Системи та способи для визначення набору коефіцієнтів інтерполяції
Номер патенту: 114233
Опубліковано: 10.05.2017
Автори: Раджендран Вівек, Субасінгха Субасінгха Шамінда, Крішнан Венкатеш
Формула / Реферат
1. Спосіб для визначення набору коефіцієнтів інтерполяції за допомогою електронного пристрою, який містить етапи, на яких:
- визначають значення на основі властивості поточного кадру і властивості попереднього кадру;
- визначають те, знаходиться чи ні значення за межами діапазону;
- визначають набір коефіцієнтів інтерполяції на основі визначення, що значення знаходиться за межами діапазону, і індикатора режиму прогнозування;
- інтерполюють вектори частоти спектральної лінії (LSF) субкадрів на основі набору коефіцієнтів інтерполяції для створення інтерпольованих LSF-векторів; і
- синтезують мовний сигнал на основі інтерпольованих LSF-векторів.
2. Спосіб за п. 1, в якому індикатор режиму прогнозування вказує один з трьох або більше режимів прогнозування.
3. Спосіб за п. 1, в якому значення є відношенням енергій на основі енергії імпульсної характеристики синтезуючого фільтра поточного кадру та енергії імпульсної характеристики синтезуючого фільтра попереднього кадру.
4. Спосіб за п. 3, в якому визначення того, знаходиться чи ні значення за межами діапазону, містить етап, на якому визначають те, менше чи ні відношення енергій, ніж порогове значення.
5. Спосіб за п. 1, в якому набір коефіцієнтів інтерполяції включає в себе два або більше коефіцієнтів інтерполяції.
6. Спосіб за п. 1, який додатково містить перетворення інтерпольованих LSF-векторів у коефіцієнти.
7. Спосіб за п. 1, в якому інтерполяція LSF-векторів субкадрів на основі набору коефіцієнтів інтерполяції містить етап, на якому множать кінцевий LSF-вектор поточного кадру на перший коефіцієнт інтерполяції, множать кінцевий LSF-вектор попереднього кадру на другий коефіцієнт інтерполяції і множать середній LSF-вектор поточного кадру на різницевий коефіцієнт.
8. Спосіб за п. 1, який додатково містить етап, на якому використовують набір коефіцієнтів інтерполяції за умовчанням у відповідь на визначення, що значення не знаходиться за межами діапазону.
9. Спосіб за п. 1, в якому індикатор режиму прогнозування вказує режим прогнозування поточного кадру.
10. Електронний пристрій для визначення набору коефіцієнтів інтерполяції, який містить:
- процесор, виконаний з можливістю:
- визначення значення на основі властивості поточного кадру і властивості попереднього кадру;
- визначення того, знаходиться чи ні значення за межами діапазону;
- визначення набору коефіцієнтів інтерполяції на основі визначення, що значення знаходиться за межами діапазону, і індикатора режиму прогнозування;
- інтерполяції векторів частоти спектральної лінії (LSF) субкадрів на основі набору коефіцієнтів інтерполяції для створення інтерпольованих LSF-векторів; і
- синтезування мовного сигналу на основі інтерпольованих LSF-векторів.
11. Електронний пристрій за п. 10, в якому індикатор режиму прогнозування вказує один з трьох або більше режимів прогнозування.
12. Електронний пристрій за п. 10, в якому значення є відношенням енергій на основі енергії імпульсної характеристики синтезуючого фільтра поточного кадру та енергії імпульсної характеристики синтезуючого фільтра попереднього кадру.
13. Електронний пристрій за п. 12, в якому процесор виконаний з можливістю визначення того, менше чи ні відношення енергій, ніж порогове значення.
14. Електронний пристрій за п. 10, в якому набір коефіцієнтів інтерполяції включає в себе два або більше коефіцієнтів інтерполяції.
15. Електронний пристрій за п. 10, в якому процесор виконаний з можливістю перетворення інтерпольованих LSF-векторів у коефіцієнти.
16. Електронний пристрій за п. 10, в якому процесор виконаний з можливістю множення кінцевого LSF-вектора поточного кадру на перший коефіцієнт інтерполяції, множення кінцевого LSF-вектора попереднього кадру на другий коефіцієнт інтерполяції і множення середнього LSF-вектора поточного кадру на різницевий коефіцієнт.
17. Електронний пристрій за п. 10, в якому процесор виконаний з можливістю використання набору коефіцієнтів інтерполяції за умовчанням у відповідь на визначення, що значення не знаходиться за межами діапазону.
18. Електронний пристрій за п. 10, в якому індикатор режиму прогнозування вказує режим прогнозування поточного кадру.
19. Зчитуваний комп'ютером носій, який зберігає комп′ютерний код для визначення набору коефіцієнтів інтерполяції, який містить:
- код для інструктування електронному пристрою визначати значення на основі властивості поточного кадру і властивості попереднього кадру;
- код для інструктування електронному пристрою визначати те, знаходиться чи ні значення за межами діапазону;
- код для інструктування електронному пристрою визначати набір коефіцієнтів інтерполяції на основі визначення, що значення знаходиться за межами діапазону, і індикатора режиму прогнозування;
- код для інструктування електронному пристрою інтерполювати вектори частоти спектральної лінії (LSF) субкадрів на основі набору коефіцієнтів інтерполяції для створення інтерпольованих LSF-векторів; і
- код для інструктування електронному пристрою синтезувати мовний сигнал на основі інтерпольованих LSF-векторів.
20. Зчитуваний комп'ютером носій за п. 19, при цьому індикатор режиму прогнозування вказує один з трьох або більше режимів прогнозування.
21. Зчитуваний комп'ютером носій за п. 19, при цьому значення є відношенням енергій на основі енергії імпульсної характеристики синтезуючого фільтра поточного кадру та енергії імпульсної характеристики синтезуючого фільтра попереднього кадру.
22. Зчитуваний комп'ютером носій за п. 19, при цьому набір коефіцієнтів інтерполяції включає в себе два або більше коефіцієнтів інтерполяції.
23. Зчитуваний комп'ютером носій за п. 19, який додатково містить код для інструктування електронному пристрою перетворювати інтерпольовані LSF-вектори у коефіцієнти.
24. Зчитуваний комп'ютером носій за п. 19, який додатково містить код для інструктування електронному пристрою використовувати набір коефіцієнтів інтерполяції за умовчанням у відповідь на визначення, що значення не знаходиться за межами діапазону.
25. Зчитуваний комп'ютером носій за п. 19, при цьому індикатор режиму прогнозування вказує режим прогнозування поточного кадру.
26. Пристрій для визначення набору коефіцієнтів інтерполяції, який містить:
- засіб для визначення значення на основі властивості поточного кадру і властивості попереднього кадру;
- засіб для визначення того, знаходиться чи ні значення за межами діапазону;
- засіб для визначення набору коефіцієнтів інтерполяції на основі визначення, що значення знаходиться за межами діапазону, і індикатора режиму прогнозування;
- засіб для інтерполяції векторів частоти спектральної лінії (LSF) субкадрів на основі набору коефіцієнтів інтерполяції для створення інтерпольованих LSF-векторів; і
- засіб для синтезування мовного сигналу на основі інтерпольованих LSF-векторів.
27. Пристрій за п. 26, в якому індикатор режиму прогнозування вказує один з трьох або більше режимів прогнозування.
28. Пристрій за п. 26, в якому значення є відношенням енергій на основі енергії імпульсної характеристики синтезуючого фільтра поточного кадру та енергії імпульсної характеристики синтезуючого фільтра попереднього кадру.
29. Пристрій за п. 26, в якому набір коефіцієнтів інтерполяції включає в себе два або більше коефіцієнтів інтерполяції.
30. Пристрій за п. 26, який додатково містить засіб для перетворення інтерпольованих LSF-векторів у коефіцієнти.
31. Пристрій за п. 26, який додатково містить засіб для використання набору коефіцієнтів інтерполяції за умовчанням у відповідь на визначення, що значення не знаходиться за межами діапазону.
32. Пристрій за п. 26, в якому індикатор режиму прогнозування вказує режим прогнозування поточного кадру.
Текст
Реферат: Описується спосіб для визначення набору коефіцієнтів інтерполяції за допомогою електронного пристрою. Спосіб включає в себе визначення значення на основі властивості поточного кадру і властивості попереднього кадру. Спосіб також включає в себе визначення того, знаходиться чи ні значення за межами діапазону. Спосіб додатково включає в себе визначення набору коефіцієнтів інтерполяції на основі значення та індикатора режиму прогнозування, якщо значення знаходиться за межами діапазону. Спосіб додатково включає в себе синтезування мовного сигналу. UA 114233 C2 (12) UA 114233 C2 UA 114233 C2 5 10 15 20 25 30 35 40 45 50 55 60 Перехресні посилання на споріднені заявки [0001] Дана заявка стосується і заявляє пріоритет попередньої заявки на патент (США) номер 61/767461, поданої 21 лютого 2013 року, названої «SYSTEMS AND METHODS FOR DETERMINING А SET OF INTERPOLATION FACTORS». Галузь техніки, до якої належить винахід [0002] Дане розкриття, загалом, стосується електронних пристроїв. Більш конкретно, дане розкриття стосується систем та способів для визначення набору коефіцієнтів інтерполяції. Рівень техніки [0003] В останні декілька десятиріч набули повсюдного поширення електронні пристрої. Зокрема, вдосконалення електронних технологій дозволяє скорочувати вартість все більш складних і корисних електронних пристроїв. Зниження вартості і споживчий попит призводять до швидкого поширення варіантів застосування електронних пристроїв, так що в сучасному суспільстві вони застосовуються фактично повсюдно. В міру зростання застосування електронних пристроїв, також зростає і попит на нові і поліпшені ознаки електронних пристроїв. Більш конкретно, часто потрібні електронні пристрої, які виконують нові функції і/або які виконують функції швидше, ефективніше або з більш високою якістю. [0004] Деякі електронні пристрої (наприклад, стільникові телефони, смартфони, пристрої звукозапису, записуючі відеокамери, комп'ютери тощо) використовують аудіосигнали. Ці електронні пристрої можуть кодувати, зберігати і/або передавати аудіосигнали. Наприклад, смартфон може одержувати, кодувати і передавати мовний сигнал для телефонного виклику, в той час як інший смартфон може приймати і декодувати мовний сигнал. [0005] Проте, виникають визначені складності при кодуванні, передачі і декодуванні аудіосигналів. Наприклад, аудіосигнал може кодуватися, щоб зменшувати величину смуги пропускання, необхідної для того, щоб передавати аудіосигнал. Коли частина аудіосигналу втрачена в передачі, може бути складним точно представляти декодований аудіосигнал. Як можна бачити з цього пояснення, можуть бути корисними системи та способи, які поліпшують декодування. Суть винаходу [0006] Описується спосіб для визначення набору коефіцієнтів інтерполяції за допомогою електронного пристрою. Спосіб включає в себе визначення значення на основі властивості поточного кадру і властивості попереднього кадру. Спосіб також включає в себе визначення того, знаходиться чи ні значення за межами діапазону. Спосіб додатково включає в себе визначення набору коефіцієнтів інтерполяції на основі значення та індикатора режиму прогнозування, якщо значення знаходиться за межами діапазону. Спосіб додатково включає в себе синтезування мовного сигналу. [0007] Визначення набору коефіцієнтів інтерполяції може бути основане на степеню, в якому значення знаходиться за межами діапазону. Степінь, в якому значення знаходиться за межами діапазону, може визначатися на основі одного або більше порогових значень за межами діапазону. [0008] Індикатор режиму прогнозування може вказувати один з двох режимів прогнозування. Індикатор режиму прогнозування може вказувати один з трьох або більше режимів прогнозування. [0009] Значення може бути відношенням енергій на основі енергії імпульсної характеристики синтезуючого фільтра поточного кадру та енергії імпульсної характеристики синтезуючого фільтра попереднього кадру. Визначення того, знаходиться чи ні значення за межами діапазону, може включати в себе визначення того, менше чи ні відношення енергій, ніж порогове значення. Значення може включати в себе перший коефіцієнт відображення поточного кадру і перший коефіцієнт відображення попереднього кадру. Визначення того, знаходиться чи ні значення за межами діапазону, може включати в себе визначення того, перевищує чи ні перший коефіцієнт відображення попереднього кадру перше порогове значення, і того, менше чи ні перший коефіцієнт відображення поточного кадру другого порогового значення. [0010] Спосіб може включати в себе інтерполяцію векторів частоти спектральної лінії (LSF) субкадрів на основі набору коефіцієнтів інтерполяції. Інтерполяція LSF-векторів субкадрів на основі набору коефіцієнтів інтерполяції може включати в себе множення кінцевого LSF-вектора поточного кадру на перший коефіцієнт інтерполяції, множення кінцевого LSF-вектора попереднього кадру на другий коефіцієнт інтерполяції і множення середнього LSF-вектора поточного кадру на різницевий коефіцієнт. [0011] Набір коефіцієнтів інтерполяції може включати в себе два або більше коефіцієнтів інтерполяції. Спосіб може включати в себе використання набору коефіцієнтів інтерполяції за умовчанням, якщо значення не знаходиться за межами діапазону. 1 UA 114233 C2 5 10 15 20 25 30 35 40 45 50 55 60 [0012] Індикатор режиму прогнозування може вказувати режим прогнозування поточного кадру. Індикатор режиму прогнозування може вказувати режим прогнозування попереднього кадру. [0013] Також описується електронний пристрій для визначення набору коефіцієнтів інтерполяції. Електронний пристрій включає в себе схему визначення значень, яка визначає значення на основі властивості поточного кадру і властивості попереднього кадру. Електронний пристрій також включає в себе схему визначення наборів коефіцієнтів інтерполяції, з’єднану зі схемою визначення значень. Схема визначення наборів коефіцієнтів інтерполяції визначає те, знаходиться чи ні значення за межами діапазону, і визначає набір коефіцієнтів інтерполяції на основі значення та індикатора режиму прогнозування, якщо значення знаходиться за межами діапазону. Електронний пристрій також включає в себе схему синтезуючих фільтрів, яка синтезує мовний сигнал. [0014] Також описується комп'ютерний програмний продукт для визначення набору коефіцієнтів інтерполяції. Комп'ютерний програмний продукт включає в себе довготривалий матеріальний зчитуваний комп’ютером носій з інструкціями. Інструкції включають в себе код для інструктування електронному пристрою визначати значення на основі властивості поточного кадру і властивості попереднього кадру. Інструкції також включають в себе код для інструктування електронному пристрою визначати те, знаходиться чи ні значення за межами діапазону. Інструкції додатково включають в себе код для інструктування електронному пристрою визначати набір коефіцієнтів інтерполяції на основі значення та індикатора режиму прогнозування, якщо значення знаходиться за межами діапазону. Інструкції додатково включають в себе код для інструктування електронному пристрою синтезувати мовний сигнал. [0015] Також описується пристрій для визначення набору коефіцієнтів інтерполяції. Пристрій включає в себе засіб для визначення значення на основі властивості поточного кадру і властивості попереднього кадру. Пристрій також включає в себе засіб для визначення того, знаходиться чи ні значення за межами діапазону. Пристрій додатково включає в себе засіб для визначення набору коефіцієнтів інтерполяції на основі значення та індикатора режиму прогнозування, якщо значення знаходиться за межами діапазону. Пристрій додатково включає в себе засіб для синтезування мовного сигналу. Короткий опис креслень [0016] Фіг. 1 є блок-схемою, що ілюструє загальний приклад кодера і декодера; [0017] Фіг. 2 є блок-схемою, що ілюструє приклад базової реалізації кодера і декодера; [0018] Фіг. 3 є блок-схемою, що ілюструє приклад широкосмугового мовного кодера і широкосмугового мовного декодера; [0019] Фіг. 4 є блок-схемою, що ілюструє більш конкретний приклад кодера; [0020] Фіг. 5 є схемою, що ілюструє приклад кадрів у часі; [0021] Фіг. 6 є блок-схемою послідовності операцій способу, що ілюструє одну конфігурацію способу для кодування мовного сигналу за допомогою кодера; [0022] Фіг. 7 є блок-схемою, що ілюструє одну конфігурацію електронного пристрою, виконаного з можливістю визначення набору коефіцієнтів інтерполяції; [0023] Фіг. 8 є блок-схемою послідовності операцій способу, що ілюструє одну конфігурацію способу для визначення набору коефіцієнтів інтерполяції за допомогою електронного пристрою; [0024] Фіг. 9 є блок-схемою, що ілюструє приклади модулів визначення значень; [0025] Фіг. 10 є блок-схемою, що ілюструє один приклад модуля визначення наборів коефіцієнтів інтерполяції; [0026] Фіг. 11 є схемою, що ілюструє один приклад визначення набору коефіцієнтів інтерполяції; [0027] Фіг. 12 є схемою, що ілюструє інший приклад визначення набору коефіцієнтів інтерполяції; [0028] Фіг. 13 включає в себе графіки прикладів форм синтезованого мовного сигналу; [0029] Фіг. 14 включає всебе графіки додаткових прикладів форм синтезованого мовного сигналу; [0030] Фіг. 15 є блок-схемою, що ілюструє одну конфігурацію пристрою бездротового зв’язку, в якому можуть реалізовуватися системи та способи для визначення набору коефіцієнтів інтерполяції; і [0031] Фіг. 16 ілюструє різні компоненти, які можуть бути використані в електронному пристрої. Докладний опис винаходу [0032] Далі описуються різні конфігурації з посиланням на креслення, на яких аналогічні посилання з номерами можуть вказувати функціонально аналогічні елементи. Системи та 2 UA 114233 C2 5 10 15 20 25 30 35 40 45 50 55 60 способи, загалом, описані та проілюстровані на кресленнях в даному документі, можуть пристосовуватися і проектуватися в широкому спектрі різних конфігурацій. Таким чином, нижченаведений докладний опис декількох конфігурацій, представлених на кресленнях, не має намір обмежувати заявлений обсяг, а просто представляє системи та способи. [0033] Фіг. 1 є блок-схемою, що ілюструє загальний приклад кодера 104 і декодера 108. Кодер 104 приймає мовний сигнал 102. Мовний сигнал 102 може являти собою мовний сигнал в будь-якому частотному діапазоні. Наприклад, мовний сигнал 102 може бути дискретизований при 16 кілобітах в секунду (Кбіт/с) і може являти собою надширокосмуговий сигнал з приблизним частотним діапазоном в 0-16 кілогерц (кГц) або 0-14 кГц, широкосмуговий сигнал з приблизним частотним діапазоном в 0-8 кГц або вузькосмуговий сигнал з приблизним частотним діапазоном в 0-4 кГц. В інших прикладах, мовний сигнал 102 може являти собою сигнал смуги низьких частот з приблизним частотним діапазоном в 50-300 герц (Гц) або сигнал смуги високих частот з приблизним частотним діапазоном в 4-8 кГц. Інші можливі частотні діапазони для мовного сигналу 102 включають в себе 300-3400 Гц (наприклад, частотний діапазон комутованої телефонної мережі загального користування (PSTN)), 14-20 кГц, 16-20 кГц та 16-32 кГц. [0034] Кодер 104 кодує мовний сигнал 102, щоб формувати кодований мовний сигнал 106. Загалом, кодований мовний сигнал 106 включає в себе один або більше параметрів, які представляють мовний сигнал 102. Один або більше параметрів можуть квантуватися. Приклади одного або більше параметрів включають в себе параметри фільтрації (наприклад, вагові коефіцієнти, частоти спектральних ліній (LSF), індикатори режиму прогнозування, пари спектральних ліній (LSP), частоти спектральних імітансів (ISF), пари спектральних імітансів (ISP), коефіцієнти часткової кореляції (ParCor), коефіцієнти відображення і/або значення логарифмічного відношення площ тощо) і параметри, включені в кодований сигнал збудження (наприклад, коефіцієнти посилення, індекси адаптивних таблиць кодування, посилення адаптивних таблиць кодування, індекси фіксованих таблиць кодування і/або посилення фіксованих таблиць кодування тощо). Параметри можуть відповідати одній або більше смуг частот. Декодер 108 декодує кодований мовний сигнал 106, щоб формувати декодований мовний сигнал 110. Наприклад, декодер 108 складає декодований мовний сигнал 110 на основі одного або більше параметрів, включених в кодований мовний сигнал 106. Декодований мовний сигнал 110 може являти собою приблизне відтворення вихідного мовного сигналу 102. [0035] Кодер 104 може реалізовуватися в апаратних засобах (наприклад, в схемі), в програмному забезпеченні або в комбінації вищезазначеного. Наприклад, кодер 104 може бути реалізований як спеціалізована інтегральна схема (ASIC) або як процесор з інструкціями. Аналогічно, декодер 108 може реалізовуватися в апаратних засобах (наприклад, в схемі), в програмному забезпеченні або в комбінації вищезазначеного. Наприклад, декодер 108 може бути реалізований як спеціалізована інтегральна схема (ASIC) або як процесор з інструкціями. Кодер 104 і декодер 108 можуть реалізовуватися на окремих електронних пристроях або на ідентичному електронному пристрої. [0036] Фіг. 2 є блок-схемою, що ілюструє приклад базової реалізації кодера 204 і декодера 208. Кодер 204 може бути одним прикладом кодера 104, описаного в зв'язку з фіг. 1. Кодер 204 може включати в себе модуль 212 аналізу, перетворювач 214 коефіцієнтів, квантувач А 216, зворотний квантувач А 218, зворотний перетворювач А 220 коефіцієнтів, аналітичний фільтр 222 і квантувач В 224. Один або більше компонентів кодера 204 і/або декодера 208 можуть реалізовуватися в апаратних засобах (наприклад, в схемі), в програмному забезпеченні або в комбінації вищезазначеного. [0037] Кодер 204 приймає мовний сигнал 202. Потрібно зазначити, що мовний сигнал 202 може включати в себе будь-який частотний діапазон, як описано вище в зв'язку з фіг. 1 (наприклад, всю смугу мовних частот або підсмугу мовних частот). [0038] У цьому прикладі, модуль 212 аналізу кодує спектральну обвідну мовного сигналу 202 як набір коефіцієнтів лінійного прогнозування (LP) (наприклад, коефіцієнтів А(z) аналітичної фільтрації, які можуть застосовуватися для того, щоб формувати синтезуючий фільтр 1/А(z) з усіма полюсами, де z є комплексним числом). Модуль 212 аналізу типово обробляє вхідний сигнал як послідовність неперекривних кадрів мовного сигналу 202, при цьому новий набір коефіцієнтів обчислюється для кожного кадру або субкадру. У деяких конфігураціях, період кадру може бути періодом, протягом якого мовний сигнал 202 приблизно може бути локально стаціонарним. Один типовий приклад періоду кадру становить 20 мілісекунд (мс) (наприклад, еквівалентний 160 вибіркам на частоті дискретизації 8 кГц). В одному прикладі, модуль 212 аналізу виконаний з можливістю обчислювати набір з десяти коефіцієнтів лінійного прогнозування, щоб характеризувати формантну структуру кожного кадру в 20 мс. В іншому 3 UA 114233 C2 5 10 15 20 25 30 35 40 45 50 55 60 прикладі, частота дискретизації в 12,8 кГц може бути використана для кадру в 20 мс. У цьому прикладі, розмір кадру становить 256 вибірок, і модуль 212 аналізу може обчислювати набір з 16 коефіцієнтів лінійного прогнозування (наприклад, коефіцієнтів лінійного прогнозування 16-ого порядку). Хоча це приклади інфраструктури, які можуть реалізовуватися відповідно до систем та способів, розкритих в даному документі, потрібно зазначити, що ці приклади не повинні обмежувати обсяг розкритих систем та способів, які можуть застосовуватися до будь-якої інфраструктури. Також можна реалізовувати модуль 212 аналізу таким чином, щоб обробляти мовний сигнал 202 як послідовність перекривних кадрів. [0039] Модуль 212 аналізу може бути виконаний з можливістю безпосередньо аналізувати вибірки кожного кадру, або вибірки можуть бути спочатку зважені згідно з функцією кадрування (наприклад, вікном Хеммінга). Аналіз також може виконуватися для вікна, що перевищує кадр, наприклад, 30-мілісекундного вікна. Це вікно може бути симетричним (наприклад, 5-20-5, так що воно включає в себе 5 мс безпосередньо перед і після 20-мілісекундного кадру) або асиметричним (наприклад, 10-20, так що воно включає в себе останні 10 мс попереднього кадру). Модуль 212 аналізу типово виконаний з можливістю обчислювати коефіцієнти лінійного прогнозування з використанням рекурсії Левінсона-Дурбіна або алгоритму Леро-Гугена. В іншій реалізації, модуль 212 аналізу може бути виконаний з можливістю обчислювати набір кепстральних коефіцієнтів для кожного кадру замість набору коефіцієнтів лінійного прогнозування. [0040] Вихідна швидкість кодера 204 може значно знижуватися, з відносно невеликим ефектом відносно якості відтворення, за допомогою квантування коефіцієнтів. Коефіцієнти лінійного прогнозування складно квантувати ефективно, і вони звичайно перетворюються в інше представлення, наприклад, в LSF для квантування і/або ентропійного кодування. У прикладі за фіг. 2, перетворювач 214 коефіцієнтів перетворює набір коефіцієнтів у відповідний LSF-вектор (наприклад, набір LSF). Інші представлення «один-до-одного» коефіцієнтів включають в себе LSP, ParCor-коефіцієнти, коефіцієнти відображення, значення логарифмічного відношення площ, ISP та ISF. Наприклад, ISF можуть використовуватися в кодеку на основі GSM (глобальної системи мобільного зв'язку) за AMR-WB (стандартом широкосмугового адаптивного багатошвидкісного кодування). Для зручності, терміни «частоти спектральних ліній», «LSF», «LSF-вектори» і зв'язані терміни можуть використовуватися для того, щоб означати одне або більше з LSF, LSP, ISF, ISP, ParCor-коефіцієнтів, коефіцієнтів відображення і значень логарифмічного відношення площ. Типово, перетворення між набором коефіцієнтів і відповідним LSF-вектором є оборотним, але деякі конфігурації можуть включати в себе реалізації кодера 204, в яких перетворення є необоротним без помилки. [0041] Квантувач А 216 виконаний з можливістю квантувати LSF-вектор (або інше представлення коефіцієнтами). Кодер 204 може виводити результат цього квантування як параметри 228 фільтрації. Квантувач А 216 типово включає в себе векторний квантувач, який кодує вхідний вектор (наприклад, LSF-вектор) як індекс для відповідного векторного запису в таблиці або в таблиці кодування. [0042] Як видно на фіг. 2, кодер 204 також формує залишковий сигнал за допомогою пропускання мовного сигналу 202 через аналітичний фільтр 222 (який також називається «відбілюючим фільтром» або «фільтром помилок прогнозування»), який сконфігурований згідно з набором коефіцієнтів. Аналітичний фільтр 222 може бути реалізований як фільтр з кінцевою імпульсною характеристикою (FIR) або фільтр з нескінченною імпульсною характеристикою (IIR). Цей залишковий сигнал повинен типово містити перцепційно важливу інформацію мовного кадру, наприклад, довготривалу структуру, зв'язану з основним тоном, який не представлений в параметрах 228 фільтрації. Квантувач В 224 виконаний з можливістю обчислювати квантоване представлення цього залишкового сигналу для виведення як кодованого сигналу 226 збудження. У деяких конфігураціях, квантувач В 224 включає в себе векторний квантувач, який кодує вхідний вектор як індекс для відповідного векторного запису в таблиці або в таблиці кодування. Додатково або альтернативно, квантувач В 224 може бути виконаний з можливістю відправляти один або більше параметрів, з яких вектор може формуватися динамічно в декодері 208, а не витягуватися з пристрою зберігання даних, як в способі на основі розріджених таблиць кодування. Цей спосіб використовується в схемах кодування, таких як алгебраїчне CELP (лінійне прогнозування із збудженням за кодом), і в кодеках, таких як EVRC (вдосконалений кодек із змінною швидкістю) за стандартом 3GPP2 (Партнерського проекту третього покоління 2). У деяких конфігураціях, кодований сигнал 226 збудження і параметри 228 фільтрації можуть бути включені в кодований мовний сигнал 106. [0043] Може бути переважним, якщо кодер 204 формує кодований сигнал 226 збудження згідно з ідентичними значеннями параметра фільтрації, які доступні у відповідному декодері 4 UA 114233 C2 5 10 15 20 25 30 35 40 45 50 55 60 208. Таким чином, результуючий кодований сигнал 226 збудження вже може враховувати в деякій мірі неідеальності в цих значеннях параметрів, такі як помилка квантування. Відповідно, може бути переважним конфігурувати аналітичний фільтр 222 з використанням ідентичних значень коефіцієнтів, які доступні в декодері 208. У базовому прикладі кодера 204, як проілюстровано на фіг. 2, зворотний квантувач А 218 деквантує параметри 228 фільтрації. Зворотний перетворювач А 220 коефіцієнтів перетворює результуючі значення зворотно у відповідний набір коефіцієнтів. Цей набір коефіцієнтів використовується для того, щоб конфігурувати аналітичний фільтр 222 з можливістю формувати залишковий сигнал, який квантується за допомогою квантувача В 224. [0044] Деякі реалізації кодера 204 виконані з можливістю обчислювати кодований сигнал 226 збудження за допомогою ідентифікації одного з набору векторів таблиць кодування, який має найкращий збіг із залишковим сигналом. Проте, потрібно зазначити, що кодер 204 також може бути реалізований з можливістю обчислювати квантоване представлення залишкового сигналу без фактичного формування залишкового сигналу. Наприклад, кодер 204 може бути виконаний з можливістю використовувати визначене число векторів таблиць кодування для того, щоб формувати відповідні синтезовані сигнали (наприклад, згідно з поточним набором параметрів фільтрації) і вибирати вектор таблиці кодування, асоційований зі сформованим сигналом, який має найкращий збіг з вихідним мовним сигналом 202 в перцепційно зваженому домені. [0045] Декодер 208 може включати в себе зворотний квантувач В 230, зворотний квантувач С 236, зворотний перетворювач В 238 коефіцієнтів і синтезуючий фільтр 234. Зворотний квантувач С 236 деквантує параметри 228 фільтрації (наприклад, LSF-вектор), і зворотний перетворювач В 238 коефіцієнтів перетворює LSF-вектор в набір коефіцієнтів (наприклад, як описано вище у відношенні зворотного квантувача А 218 і зворотного перетворювач А 220 коефіцієнтів кодера 204). Зворотний квантувач В 230 деквантує кодований сигнал 226 збудження для того, щоб формувати сигнал 232 збудження. На основі коефіцієнтів і сигналу 232 збудження, синтезуючий фільтр 234 синтезує декодований мовний сигнал 210. Іншими словами, синтезуючий фільтр 234 виконаний з можливістю спектрально формувати сигнал 232 збудження згідно з деквантованими коефіцієнтами, щоб формувати декодований мовний сигнал 210. У деяких конфігураціях, декодер 208 також може надавати сигнал 232 збудження в інший декодер, який може використовувати сигнал 232 збудження для того, щоб витягувати сигнал збудження іншої смуги частот (наприклад, смуги високих частот). У деяких реалізаціях, декодер 208 може бути виконаний з можливістю надавати в інший декодер додаткову інформацію, яка пов'язана із сигналом 232 збудження, таку як нахил спектра, посилення і запізнення основного тону і мовний режим. [0046] Система кодера 204 і декодера 208 є базовим прикладом мовного кодека за методом аналізу через синтез. Кодування на основі лінійного прогнозування із збудженням за таблицею кодування являє собою одне популярне сімейство кодування за методом аналізу через синтез. Реалізації таких кодерів можуть виконувати кодування на основі форми сигналів залишку, що включає в себе такі операції, як вибір записів з фіксованих та адаптивних таблиць кодування, операції мінімізації помилок і/або операцій перцепційного зважування. Інші реалізації кодування за методом аналізу через синтез включають в себе кодування на основі лінійного прогнозування зі змішаним збудженням (MELP), на основі алгебраїчного CELP (ACELP), на основі релаксаційного CELP (RCELP), на основі регулярного імпульсного збудження (RPE), на основі багатоімпульсного збудження (MPE), на основі багатоімпульсного CELP (MPE) і на основі лінійного прогнозування із збудженням векторною сумою (VSELP). Відповідні способи кодування включають в себе кодування на основі багатосмугового збудження (MBE) та інтерполяції форми прототипного сигналу (PWI). Приклади стандартизованих мовних кодеків за методом аналізу через синтез включають в себе кодек за стандартом повношвидкісного кодування ETSI (Європейського інституту стандартизації в галузі телекомунікацій)-GSM (GSM 06.10) (який використовує лінійне прогнозування із збудженням по залишку (RELP)); GSM-кодек за стандартом поліпшеного повношвидкісного кодування (ETSI-GSM 06.60); кодер за стандартом ITU (Міжнародного союзу телекомунікацій), 11.8 Кбіт/с, G.729, додаток Е; кодеки згідно з IS (проміжним стандартом)-641 для IS-136 (за схемою множинного доступу з часовим розділенням каналів); кодеки за стандартом адаптивного багатошвидкісного кодування на основі GSM (GSM-AMR); і кодек 4GV™ (вокодер четвертого покоління) (QUALCOMM Incorporated, San Diego, Каліфорнія). Кодер 204 і відповідний декодер 208 можуть бути реалізовані згідно з будь-якою з цих технологій або будь-якою іншою технологією кодування мови (відомою або такою, що розробляється), яка представляє мовний сигнал як (А) набір параметрів, які описують фільтр, і (В) сигнал збудження, що використовується для того, щоб активувати описаний фільтр з можливістю відтворювати мовний сигнал. 5 UA 114233 C2 5 10 15 20 25 30 35 40 45 50 55 [0047] Навіть після того, як аналітичний фільтр 222 видаляє приблизну спектральну обвідну з мовного сигналу 202, значна величина точної гармонічної структури може залишатися, особливо для вокалізованої мови. Періодична структура пов'язана з основним тоном, і різні вокалізовані звуки, що вимовляються одним тим, хто говорить, можуть мати різні формантні структури, але аналогічні структури основного тону. [0048] Ефективність кодування і/або якість мови може бути підвищена за допомогою використання одного або більше значень параметрів для того, щоб кодувати характеристики структури основного тону. Однією важливою характеристикою структури основного тону є ефективність першої гармоніки (яка також називається «власною частотою»), яка типово знаходиться в діапазоні 60-400 герц (Гц). Ця характеристика типово кодується як інверсія власної частоти, яка також називається «запізненням основного тону». Запізнення основного тону вказує число вибірок в одному періоді основного тону і може кодуватися як один або більше індексів таблиць кодування. Мовні сигнали від чоловіків, які говорять, часто мають більше запізнення основного тону, ніж мовні сигнали від жінок, які говорять. [0049] Іншою характеристикою сигналу, пов'язаною зі структурою основного тону, є періодичність, яка вказує інтенсивність гармонічної структури або, іншими словами, степінь, в якому сигнал є гармонічним або негармонічним. Два типових індикатори періодичності являють собою переходи через нуль і нормалізовані автокореляційні функції (NACF). Періодичність також може показуватися за допомогою посилення основного тону, яке, як правило, кодується як посилення таблиці кодування (наприклад, квантоване посилення адаптивної таблиці кодування). [0050] Кодер 204 може включати в себе один або більше модулів, виконаних з можливістю кодувати довготривалу гармонічну структуру мовного сигналу 202. У деяких підходах до CELPкодування, кодер 204 включає в себе модуль аналізу на основі лінійного прогнозуючого кодування (LPC) з розімкненим контуром, який кодує короткочасні характеристики або приблизну спектральну обвідну, після чого виконується стадія аналізу на основі довготривалого прогнозування із замкненим контуром, яка кодує точну структуру основного тону або гармонічну структуру. Короткочасні характеристики кодуються як коефіцієнти (наприклад, параметри 228 фільтрації), а довготривалі характеристики кодуються як значення для параметрів, такі як запізнення основного тону і посилення основного тону. Наприклад, кодер 204 може бути виконаний з можливістю виводити кодований сигнал 226 збудження в формі, яка включає в себе один або більше індексів таблиць кодування (наприклад, індекс фіксованої таблиці кодування та індекс адаптивної таблиці кодування) і відповідні значення посилення. Обчислення цього квантованого представлення залишкового сигналу (наприклад, за допомогою квантувача В 224) може включати в себе вибір таких індексів та обчислення таких значень. Кодування структури основного тону також може включати в себе інтерполяцію форми прототипного сигналу основного тону, причому ця операція може включати в себе обчислення різниці між послідовними імпульсами основного тону. Моделювання довготривалої структури може бути деактивоване для кадрів, що відповідають невокалізованій мові, які типово є шумоподібними і неструктурованими. [0051] Деякі реалізації декодера 208 можуть бути виконані з можливістю виводити сигнал 232 збудження в інший декодер (наприклад, в декодер смуги високих частот) після того, як довготривала структура (структура основного тону або гармонічна структура) відновлена. Наприклад, такий декодер може бути виконаний з можливістю виводити сигнал 232 збудження як деквантовану версію кодованого сигналу 226 збудження. Звичайно, також можна реалізовувати декодер 208 таким чином, що інший декодер виконує деквантування кодованого сигналу 226 збудження для того, щоб одержувати сигнал 232 збудження. [0052] Фіг. 3 є блок-схемою, що ілюструє приклад широкосмугового мовного кодера 342 і широкосмугового мовного декодера 358. Один або більше компонентів широкосмугового мовного кодера 342 і/або широкосмугового мовного декодера 358 можуть реалізовуватися в апаратних засобах (наприклад, в схемі), в програмному забезпеченні або в комбінації вищезазначеного. Широкосмуговий мовний кодер 342 і широкосмуговий мовний декодер 358 можуть реалізовуватися на окремих електронних пристроях або на ідентичному електронному пристрої. [0053] Широкосмуговий мовний кодер 342 включає в себе гребінку А 344 фільтрів, кодер 348 першої смуги частот і кодер 350 другої смуги частот. Гребінка А 344 фільтрів виконана з можливістю фільтрувати широкосмуговий мовний сигнал 340 для того, щоб формувати сигнал 346a першої смуги частот (наприклад, вузькосмуговий сигнал) і сигнал 346b другої смуги частот (наприклад, сигнал смуги високих частот). 6 UA 114233 C2 5 10 15 20 25 30 35 40 45 50 55 60 [0054] Кодер 348 першої смуги частот виконаний з можливістю кодувати сигнал 346a першої смуги частот для того, щоб формувати параметри 352 фільтрації (наприклад, параметри вулькосмугової (NB) фільтрації) і кодований сигнал 354 збудження (наприклад, кодований вузькосмуговий сигнал збудження). У деяких конфігураціях, кодер 348 першої смуги частот може формувати параметри 352 фільтрації і кодований сигнал 354 збудження як індекси таблиць кодування або в іншій квантованій формі. У деяких конфігураціях, кодер 348 першої смуги частот може реалізовуватися відповідно до кодера 204, описаного в зв'язку з фіг. 2. [0055] Кодер 350 другої смуги частот виконаний з можливістю кодувати сигнал 346b другої смуги частот (наприклад, сигнал смуги високих частот) згідно з інформацією в кодованому сигналі 354 збудження для того, щоб формувати параметри 356 кодування у другій смузі частот (наприклад, параметри кодування в смузі високих частот). Кодер 350 другої смуги частот може бути виконаний з можливістю формувати параметри 356 кодування у другій смузі частот як індекси таблиць кодування або в іншій квантованій формі. Один конкретний приклад широкосмугового мовного кодера 342 виконаний з можливістю кодувати широкосмуговий мовний сигнал 340 на швидкості приблизно в 8,55 Кбіт/с, при цьому приблизно 7,55 Кбіт/с використовуються для параметрів 352 фільтрації і кодованого сигналу 354 збудження, і приблизно 1 Кбіт/с використовуються для параметрів 356 кодування у другій смузі частот. У деяких реалізаціях, параметри 352 фільтрації, кодований сигнал 354 збудження і параметри 356 кодування у другій смузі частот можуть бути включені в кодований мовний сигнал 106. [0056] У деяких конфігураціях, кодер 350 другої смуги частот може реалізовуватися аналогічно кодеру 204, описаному в зв'язку з фіг. 2. Наприклад, кодер 350 другої смуги частот може формувати параметри фільтрації другої смуги частот (наприклад, як частину параметрів 356 кодування у другій смузі частот), як описано в зв'язку з кодером 204, описаним в зв'язку з фіг. 2. Проте, кодер 350 другої смуги частот може відрізнятися в деякому відношенні. Наприклад, кодер 350 другої смуги частот може включати в себе формувач збудження другої смуги частот, який може формувати сигнал збудження другої смуги частот на основі кодованого сигналу 354 збудження. Кодер 350 другої смуги частот може використовувати сигнал збудження другої смуги частот для того, щоб формувати синтезований сигнал другої смуги частот і визначати коефіцієнт посилення другої смуги частот. У деяких конфігураціях, кодер 350 другої смуги частот може квантувати коефіцієнт посилення другої смуги частот. Відповідно, приклади параметрів кодування у другій смузі частот включають в себе параметри фільтрації другої смуги частот і квантований коефіцієнт посилення другої смуги частот. [0057] Може бути переважним комбінувати параметри 352 фільтрації, кодований сигнал 354 збудження і параметри 356 кодування у другій смузі частот в один потік бітів. Наприклад, може бути переважним мультиплексувати кодовані сигнали разом для передачі (наприклад, по дротовому, оптичному або бездротовому каналу передачі) або для зберігання як кодований широкосмуговий мовний сигнал. У деяких конфігураціях, широкосмуговий мовний кодер 342 включає в себе мультиплексор (не показаний), виконаний з можливістю комбінувати параметри 352 фільтрації, кодований сигнал 354 збудження і параметри 356 кодування у другій смузі частот в мультиплексований сигнал. Параметри 352 фільтрації, кодований сигнал 354 збудження і параметри 356 кодування у другій смузі частот можуть бути прикладами параметрів, включених в кодований мовний сигнал 106, як описано в зв'язку з фіг. 1. [0058] У деяких реалізаціях, електронний пристрій, який включає в себе широкосмуговий мовний кодер 342, також може включати в себе схему, виконану з можливістю передавати мультиплексований сигнал в канал передачі, такий як дротовий, оптичний або бездротовий канал. Цей електронний пристрій також може бути виконаний з можливістю здійснювати одну або більше операцій канального кодування для сигналу, такі як кодування з корекцією помилок (наприклад, узгоджене за швидкістю згорткове кодування) і/або кодування з виявленням помилок (наприклад, кодування з контролем циклічним надмірним кодом), і/або кодування згідно з одним або більше рівнями мережних протоколів (наприклад, протокол керування передачею/Інтернет-протоколом (TCP/IP), CDMA2000). [0059] Може бути переважним, якщо мультиплексор виконаний з можливістю вбудовувати параметри 352 фільтрації і кодований сигнал 354 збудження як роздільний субпотік мультиплексованого сигнал, так що параметри 352 фільтрації і кодований сигнал 354 збудження можуть відновлюватися і декодуватися незалежно від іншої частини мультиплексованого сигналу, наприклад, сигналу смуги високих частот і/або смуги низьких частот. Наприклад, мультиплексований сигнал може компонуватися таким чином, що параметри 352 фільтрації і кодований сигнал 354 збудження можуть відновлюватися за допомогою відсікання параметрів 356 кодування у другій смузі частот. Одна потенційна перевага такої ознаки полягає у виключенні необхідності транскодування параметрів 356 7 UA 114233 C2 5 10 15 20 25 30 35 40 45 50 55 60 кодування у другій смузі частот перед їх передачею в систему, яка підтримує декодування параметрів 352 фільтрації і кодованого сигналу 354 збудження, але не підтримує декодування параметрів 356 кодування у другій смузі частот. [0060] Широкосмуговий мовний декодер 358 може включати в себе декодер 360 першої смуги частот, декодер 366 другої смуги частот і гребінку В 368 фільтрів. Декодер 360 першої смуги частот (наприклад, вузькосмуговий декодер) виконаний з можливістю декодувати параметри 352 фільтрації і кодований сигнал 354 збудження для того, щоб формувати декодований сигнал 362a першої смуги частот (наприклад, декодований вузькосмуговий сигнал). Декодер 366 другої смуги частот виконаний з можливістю декодувати параметри 356 кодування у другій смузі частот згідно із сигналом 364 збудження (наприклад, вузькосмуговим сигналом збудження), на основі кодованого сигналу 354 збудження, формувати декодований сигнал 362b другої смуги частот (наприклад, декодований сигнал смуги високих частот). У цьому прикладі, декодер 360 першої смуги частот виконаний з можливістю надавати сигнал 364 збудження в декодер 366 другої смуги частот. Гребінка В 368 фільтрів виконана з можливістю комбінувати декодований сигнал 362a першої смуги частот і декодований сигнал 362b другої смуги частот для того, щоб формувати декодований широкосмуговий мовний сигнал 370. [0061] Деякі реалізації широкосмугового мовного декодера 358 можуть включати в себе демультиплексор (не показаний), виконаний з можливістю формувати параметри 352 фільтрації, кодований сигнал 354 збудження і параметри 356 кодування у другій смузі частот з мультиплексованого сигналу. Електронний пристрій, що включає в себе широкосмуговий мовний декодер 358, може включати в себе схему, виконану з можливістю приймати мультиплексований сигнал з каналу передачі, такого як дротовий, оптичний або бездротовий канал. Цей електронний пристрій також може бути виконаний з можливістю здійснювати одну або більше операцій канального декодування для сигналу, таких як декодування з корекцією помилок (наприклад, узгоджене за швидкістю згорткове декодування) і/або декодування з виявленням помилок (наприклад, декодування з контролем циклічним надмірним кодом), і/або декодування згідно з одним або більше рівнів мережних протоколів (наприклад, Ethernet, TCP/IP, CDMA2000). [0062] Гребінка А 344 фільтрів у широкосмуговому мовному кодері 342 виконана з можливістю фільтрувати вхідний сигнал згідно зі схемою з розбиттям смуги частот для того, щоб формувати сигнал 346a першої смуги частот (наприклад, вузькосмуговий або низькочастотний підсмуговий сигнал) і сигнал 346b другої смуги частот (наприклад, сигнал смуги високих частот або високочастотний підсмуговий сигнал). Залежно від проектних критеріїв конкретного додатку, вихідні піддіапазони можуть мати рівні або нерівні смуги пропускання і можуть бути перкривними або неперекривними. Конфігурація гребінки А 344 фільтрів, яка формує більше двох підсмуг частот, також можлива. Наприклад, гребінка А 344 фільтрів може бути виконана з можливістю формувати один або більше сигналів смуги низьких частот, які включають в себе компоненти в частотному діапазоні нижче частотного діапазону сигналу 346a першої смуги частот (наприклад, в такому діапазоні, як 50-300 герц (Гц)). Також гребінка А 344 фільтрів може бути виконана з можливістю формувати один або більше додаткових сигналів смуги високих частот, які включають в себе компоненти в частотному діапазоні вище частотного діапазону сигналу 346b другої смуги частот (наприклад, в такому діапазоні, як 14-20 або 16-32 кілогерца (кГц) 16-20). У такій конфігурації, широкосмуговий мовний кодер 342 може реалізовуватися з можливістю кодувати сигнал або сигнали окремо, і мультиплексор може бути виконаний з можливістю включати в себе додатковий кодований сигнал або сигнали в мультиплексованому сигналі (наприклад, як одна або більше роздільних частин). [0063] Фіг. 4 є блок-схемою, що ілюструє більш конкретний приклад кодера 404. Зокрема, фіг. 4 ілюструє CELP-архітектуру аналізу через синтез для кодування мови з низькою швидкістю передачі бітів. У цьому прикладі, кодер 404 включає в себе модуль 472 кадрування і попередньої обробки, модуль 476 аналізу, перетворювач 478 коефіцієнтів, квантувач 480, синтезуючий фільтр 484, суматор 488, модуль 492 перцепційної зважуючої фільтрації і мінімізації помилок і модуль 494 оцінки збудження. Потрібно зазначити, що кодер 404 і один або більше компонентів кодера 404 можуть реалізовуватися в апаратних засобах (наприклад, в схемі), в програмному забезпеченні або в комбінації вищезазначеного. [0064] Мовний сигнал 402 (наприклад, вхідна мова s) може являти собою електронний сигнал, який містить мовну інформацію. Наприклад, акустичний мовний сигнал може бути захоплений за допомогою мікрофона і дискретизований для того, щоб формувати мовний сигнал 402. У деяких конфігураціях, мовний сигнал 402 може бути дискретизований при 16 Кбіт/с. Мовний сигнал 402 може містити діапазон частот, як описано вище в зв'язку з фіг. 1. 8 UA 114233 C2 5 10 15 20 25 30 35 40 45 50 55 60 [0065] Мовний сигнал 402 може надаватися в модуль 472 кадрування і попередньої обробки. Модуль 472 кадрування і попередньої обробки може розділяти мовний сигнал 402 на послідовність кадрів. Кожний кадр може становити конкретний період часу. Наприклад, кожний кадр може відповідати 20 мс мовного сигналу 402. Модуль 472 кадрування і попередньої обробки може виконувати інші операції для мовного сигналу 402, такі як фільтрація (наприклад, одне або більше з фільтрації нижніх частот, фільтрації верхніх частот і смугової фільтрації). Відповідно, модуль 472 кадрування і попередньої обробки може формувати заздалегідь оброблений мовний сигнал 474 (наприклад, S(a), де а є числом вибірок) на основі мовного сигналу 402. [0066] Модуль 476 аналізу може визначати набір коефіцієнтів (наприклад, аналітичний фільтр А(z) на основі лінійного прогнозування). Наприклад, модуль 476 аналізу може кодувати спектральну обвідну заздалегідь обробленого мовного сигналу 474 як набір коефіцієнтів, як описано в зв'язку з фіг. 2. [0067] Коефіцієнти можуть надаватися в перетворювач 478 коефіцієнтів. Перетворювач 478 коефіцієнтів перетворює набір коефіцієнтів у відповідний LSF-вектор (наприклад, LSF, LSP, ISF, ISP тощо), як описано вище в зв'язку з фіг. 2. [0068] LSF-вектор надається в квантувач 480. Квантувач 480 квантує LSF-вектор у квантований LSF-вектор 482. Наприклад, квантувач 480 може виконувати векторне квантування для LSF-вектора, щоб давати в результаті квантований LSF-вектор 482. Це квантування може бути або непрогнозуючим (наприклад, LSF-вектор попереднього кадру не використовується в процесі квантування), або прогнозуючим (наприклад, LSF-вектор попереднього кадру використовується в процесі квантування). [0069] У деяких конфігураціях, може використовуватися один з двох режимів прогнозування: режим прогнозуючого квантування або режим непрогнозуючого квантування. У режимі непрогнозуючого квантування, векторне LSF-квантування для кадру є незалежним від LSFвектора будь-якого попереднього кадру. У режимі прогнозуючого квантування, векторне LSFквантування для кадру залежить від LSF-вектора попереднього кадру. [0070] В інших конфігураціях, можуть використовуватися три або більше режимів прогнозування. У цих конфігураціях, кожний з трьох або більше режимів прогнозування вказує степінь залежності, в якому векторне LSF-квантування для кадру залежить від LSF-вектора попереднього кадру. В одному прикладі, можуть використовуватися три режими прогнозування. Наприклад, в першому режимі прогнозування, LSF-вектор для кадру квантується незалежно (наприклад, без залежності) від LSF-вектора будь-якого попереднього кадру. У другому режимі прогнозування, LSF-вектор квантується залежно від LSF попереднього кадру, але з меншою залежністю, ніж в третьому режимі прогнозування. У третьому режимі прогнозування, LSFвектор квантується залежно від LSF попереднього кадру з більшою залежністю, ніж у другому режимі прогнозування. [0071] Режими прогнозування можуть керуватися через коефіцієнти прогнозування. У деяких конфігураціях, наприклад, LSF-вектор поточного кадру може квантуватися на основі коефіцієнтів прогнозування і LSF-вектора попереднього кадру. Режими прогнозування з більшою залежністю від попереднього кадру можуть використовувати більш високі коефіцієнти прогнозування, ніж режими прогнозування з меншою залежністю. Більш високі коефіцієнти прогнозування можуть зважувати LSF-вектор попереднього кадру вище, в той час як більш низькі коефіцієнти прогнозування можуть зважувати LSF-вектор попереднього кадру нижче при квантуванні LSF-вектора поточного кадру. [0072] Квантувач 480 може формувати індикатор 431 режиму прогнозування, який вказує режим прогнозування для кожного кадру. Індикатор 431 режиму прогнозування може відправлятися в декодер. У деяких конфігураціях, індикатор 431 режиму прогнозування може вказувати один з двох режимів прогнозування (наприклад, те, використовується прогнозуюче квантування або непрогнозуюче квантування) для кадру. Наприклад, індикатор 431 режиму прогнозування може вказувати те, квантується кадр на основі вищенаведеного кадру (наприклад, прогнозуюче) чи ні (наприклад, непрогнозуюче). В інших конфігураціях, індикатор 431 режиму прогнозування може вказувати один з трьох або більше режимів прогнозування (згідно з трьома або більше степенями залежності, в яких векторне LSF-квантування для кадру залежить від LSF-вектора попереднього кадру). [0073] У деяких конфігураціях, індикатор 431 режиму прогнозування може вказувати режим прогнозування поточного кадру. В інших конфігураціях, індикатор 431 режиму прогнозування може вказувати режим прогнозування попереднього кадру. В ще одних інших конфігураціях, можуть використовуватися декілька індикаторів 431 режиму прогнозування з розрахунку на кадр. Наприклад, можуть відправлятися два індикатори 431 режиму прогнозування кадру, що 9 UA 114233 C2 5 10 15 20 25 30 35 40 45 50 55 60 відповідають кадру, при цьому перший індикатор 431 режиму прогнозування вказує режим прогнозування, що використовується для поточного кадру, а другий індикатор 431 режиму прогнозування вказує режим прогнозування, що використовується для попереднього кадру. [0074] У деяких конфігураціях, LSF-вектори можуть формуватися і/або квантуватися на основі субкадрів. У деяких реалізаціях, тільки квантовані LSF-вектори, що відповідають визначеним субкадрам (наприклад, останньому субкадру або кінцевому субкадру кожного кадру), можуть відправлятися в декодер. У деяких конфігураціях, квантувач 480 також може визначати квантований ваговий вектор 429. Вагові вектори можуть використовуватися для того, щоб квантувати LSF-вектори (наприклад, середні LSF-вектори) між LSF-векторами, що відповідають субкадрам, які відправляються (наприклад, кінцевими LSF-векторами). Вагові вектори можуть квантуватися. Наприклад, квантувач 480 може визначати індекс таблиці кодування або таблиці пошуку, що відповідає ваговому вектору, який має найкращий збіг з фактичним ваговим вектором. Квантовані вагові вектори 429 (наприклад, індекси) можуть відправлятися в декодер. Квантований LSF-вектор 482, індикатор 431 режиму прогнозування і/або квантований ваговий вектор 429 можуть бути прикладами параметрів 228 фільтрації, описаних вище в зв'язку з фіг. 2. [0075] Квантовані LSF надаються в синтезуючий фільтр 484. Синтезуючий фільтр 484 формує синтезований мовний сигнал 486 (наприклад, відновлену мову (a) на основі квантованого LSFвектора 482 і сигналу 496 збудження. Наприклад, синтезуючий фільтр 484 фільтрує сигнал 496 збудження на основі квантованого LSF-вектора 482 (наприклад, 1/А(z)). [0076] Синтезований мовний сигнал 486 віднімається із заздалегідь обробленого мовного сигналу 474 за допомогою суматора 488, щоб давати в результаті сигнал 490 помилки (який також називається «сигналом помилки прогнозування»). Сигнал 490 помилки може представляти помилку між заздалегідь обробленим мовним сигналом 474 і його оцінкою (наприклад, синтезованим мовним сигналом 486). Сигнал 490 помилки надається в модуль 492 перцепційної зважуючої фільтрації і мінімізації помилок. [0077] Модуль 492 перцепційної зважуючої фільтрації і мінімізації помилок формує зважений сигнал 493 помилки на основі сигналу 490 помилки. Наприклад, не всі компоненти (наприклад, частотні компоненти) сигналу 490 помилки впливають однаковим чином на перцепційну якість синтезованого мовного сигналу. Помилка в деяких смугах частот впливає більшим чином на якість мови, ніж помилка в інших смугах частот. Модуль 492 перцепційної зважуючої фільтрації і мінімізації помилок може формувати зважений сигнал 493 помилки, який зменшує помилку в частотних компонентах з великим впливом на якість мови, і розподіляє велику помилку в інших частотних компонентах з меншим впливом на якість мови. [0078] Модуль 494 оцінки збудження формує сигнал 496 збудження і кодований сигнал 498 збудження на основі зваженого сигналу 493 помилки з модуля 492 перцепційної зважуючої фільтрації і мінімізації помилок. Наприклад, модуль 494 оцінки збудження оцінює один або більше параметрів, які характеризують сигнал 490 помилки або зважений сигнал 493 помилки. Кодований сигнал 498 збудження може включати в себе один або більше параметрів і може відправлятися в декодер. У CELP-підході, наприклад, модуль 494 оцінки збудження може визначати параметри, такі як індекс адаптивної (або для основного тону) таблиці кодування, посилення адаптивної (або для основного тону) таблиці кодування, індекс фіксованої таблиці кодування і посилення фіксованої таблиці кодування, які характеризують сигнал 490 помилки (наприклад, зважений сигнал 493 помилки). На основі цих параметрів модуль 494 оцінки збудження може формувати сигнал 496 збудження, який надається в синтезуючий фільтр 484. У цьому підході, індекс адаптивної таблиці кодування, посилення адаптивної таблиці кодування (наприклад, квантоване посилення адаптивної таблиці кодування), індекс фіксованої таблиці кодування і посилення фіксованої таблиці кодування (наприклад, квантоване посилення фіксованої таблиці кодування) можуть відправлятися в декодер як кодований сигнал 498 збудження. [0079] Кодований сигнал 226 збудження може бути прикладом кодованого сигналу 226 збудження, описаного вище в зв'язку з фіг. 2. Відповідно, квантований LSF-вектор 482, індикатор 431 режиму прогнозування, кодований сигнал 498 збудження і/або квантований ваговий вектор 429 можуть бути включені в кодований мовний сигнал 106, як описано вище в зв'язку з фіг. 1. [0080] Фіг. 5 є схемою, що ілюструє приклад кадрів 503 у час 501. Кожний кадр 503 розділений на визначене число субкадрів 505. У прикладі, проілюстрованому на фіг. 5, попередній кадр А 503a включає в себе 4 субкадри 505a-d, попередній кадр В 503b включає в себе 4 субкадри 505e-h, і поточний кадр С 503c включає в себе 4 субкадри 505i-l. Типовий кадр 503 може займати період часу в 20 мс і може включати в себе 4 субкадри, хоча можуть 10 UA 114233 C2 5 використовуватися кадри інших довжин і/або інших чисел субкадрів. Кожний кадр може позначатися за допомогою відповідного номера кадру, де n означає поточний кадр (наприклад, поточний кадр С 503c). Крім того, кожний субкадр може позначатися за допомогою відповідного номера k субкадру. [0081] Фіг. 5 може використовуватися для того, щоб ілюструвати один приклад LSFквантування в кодері (наприклад, в кодері 404). Кожний субкадр k в кадрі n має відповідний LSFвектор , для використання в аналітичних і синтезуючих фільтрах. Кінцевий , LSF-вектор 527 поточного кадру (наприклад, LSF-вектор останнього субкадру n-ого кадру) позначається як 10 , де . Середній LSF-вектор 525 поточного кадру (наприклад, середній LSF-вектор n-ого кадру) позначається як . «Середній LSF-вектор» являє собою LSF-вектор між іншими LSF-векторами (наприклад, між та ) у час 501. Один приклад кінцевого LSF-вектора 523 попереднього кадру проілюстрований на фіг. 5 і позначається як , де 15 20 . При використанні в даному документі, термін «попередній кадр» може означати будь-який кадр перед поточним кадром (наприклад, n-1, n-2, n-3 тощо). Відповідно, «кінцевий LSF-вектор попереднього кадру» може являти собою кінцевий LSF-вектор, що відповідає будь-якому кадру перед поточним кадром. У прикладі, проілюстрованому на фіг. 5, кінцевий LSF-вектор 523 попереднього кадру відповідає останньому субкадру 505h з попереднього кадру В 503b (наприклад, кадру n-1), який безпосередньо передує поточному кадру С 503c (наприклад, кадру n). [0082] Кожний LSF-вектор є M-вимірним, при цьому кожна розмірність LSF-вектора відповідає одному LSF-значенню. Наприклад, M типово становить 16 для широкосмугової мови (наприклад, мови, дискретизованої при 16 кГц). I-а LSF-розмірність k-того субкадру кадру n позначається як 25 , де e [0083] У процесі квантування кадру n кінцевий LSF-вектор x n може квантуватися спочатку. Це квантування може бути непрогнозуючим (наприклад, кінцевий LSF-вектор попереднього кадру не використовується в процесі квантування) або прогнозуючим (наприклад, кінцевий LSF-вектор попереднього кадру 30 . використовується в процесі квантування). Як описано вище, можуть використовуватися два або більше режимів прогнозування. Середній LSF-вектор m x n потім може квантуватися. Наприклад, кодер може вибирати ваговий вектор таким чином, m що xi , n є таким, як вказано в рівнянні (1). [0084] I-а розмірність вагового вектора w n відповідає одному ваговому коефіцієнту і позначається за допомогою wi , n , де 35 обмежується. Зокрема, якщо 0 wi , n 1 дає в результаті значення (наприклад, інтерполяція), e e обмежене за допомогою xi , n та xi , n 1 , і wi , n 0 або wi , n 1 , результуючий середній LSFe e m вектор x n може знаходитися за межами діапазону [ xi , n xi , n 1 ] (наприклад, екстраполяція на основі 40 i , 2, , M . Також потрібно зазначити, що wi , n не 1 e xie, n та xi, n 1 ). Кодер може визначати (наприклад, вибирати) ваговий вектор w n таким чином, що квантований середній LSF-вектор є найближчим до фактичного середнього LSFзначення в кодері на основі деякого показника спотворення, такого як середньоквадратична помилка (MSE) або логарифмічне спектральне спотворення (LSD). У процесі квантування, e кодер передає індекси квантування кінцевого LSF-вектора поточного кадру x n та індекс вагового вектора w n , що дозволяє декодеру відновлювати 11 e m x n та x n . UA 114233 C2 [0085] LSF-вектори субкадрів e m k x n можуть бути інтерпольовані на основі, xi, n 1 , xi , n та xie, n з використанням коефіцієнтів k та k інтерполяції, як задано за допомогою рівняння (2). 5 Потрібно зазначити, що інтерполяції k та k та k можуть бути такими, що 0 k , k 1 . Коефіцієнти k можуть бути заздалегідь визначеними значеннями, відомими як кодеру, так і декодеру. [0086] Оскільки LSF-вектори в поточному кадрі залежать від кінцевого LSF-вектора 10 15 20 25 30 35 40 45 e x n 1 попереднього кадру, на якість мови поточного кадру може виявлятися негативний вплив, коли оцінюється кінцевий LSF-вектор попереднього кадру (наприклад, коли виникає стирання кадрів). m k Наприклад, середній LSF-вектор x n поточного кадру і LSF-вектори x n субкадрів поточного e кадру (наприклад, за винятком x n ) можуть бути інтерпольовані на основі оціненого кінцевого LSF-вектора попереднього кадру. Це може призводити до неузгоджених коефіцієнтів синтезуючої фільтрації між кодером і декодером, що може формувати артефакти в синтезованому мовному сигналі. [0087] Фіг. 6 є блок-схемою послідовності операцій способу, що ілюструє одну конфігурацію способу 600 для кодування мовного сигналу 402 за допомогою кодера 404. Наприклад, електронний пристрій, що включає в себе кодер 404, може здійснювати спосіб 600. Фіг. 6 ілюструє процедури LSF-квантування для поточного кадру n. [0088] Кодер 404 може одержувати 602 квантований кінцевий LSF-вектор попереднього кадру. Наприклад, кодер 404 може квантувати кінцевий LSF, що відповідає попередньому кадру e (наприклад, x n 1 ) за допомогою вибору вектора таблиці кодування, який є найближчим до кінцевого LSF, що відповідає попередньому кадру n-1. [0089] Кодер 404 може квантувати 604 кінцевий LSF-вектор поточного кадру (наприклад, e x n ). Кодер 404 квантує 604 кінцевий LSF-вектор поточного кадру на основі кінцевого LSFвектора попереднього кадру, якщо використовується прогнозуюче LSF-квантування. Проте, квантування 604 LSF-вектора поточного кадру не основане на кінцевому LSF-векторі попереднього кадру, якщо непрогнозуюче квантування використовується для кінцевого LSF поточного кадру. [0090] Кодер 404 може квантувати 606 середній LSF-вектор поточного кадру (наприклад, m x n ) за допомогою визначення вагового вектора (наприклад, w n ). Наприклад, кодер 404 може вибирати ваговий вектор, який приводить до квантованого середнього LSF-вектора, який є найближчим до фактичного середнього LSF-вектора. Як проілюстровано в рівнянні (1), квантований середній LSF-вектор може бути оснований на ваговому векторі, кінцевому LSFвекторі попереднього кадру і кінцевому LSF-векторі поточного кадру. [0091] Кодер 404 може відправляти 608 квантований кінцевий LSF-вектор поточного кадру і ваговий вектор в декодер. Наприклад, кодер 404 може надавати кінцевий LSF-вектор поточного кадру і ваговий вектор в передавальний пристрій на електронному пристрої, який може передавати їх в декодер на іншому електронному пристрої. [0092] Деякі конфігурації систем та способів, розкритих в даному документі, надають підходи для визначення коефіцієнтів LSF-інтерполяції на основі однієї або більше властивостей поточного кадру і однієї або більше властивостей попереднього кадру. Наприклад, системи та способи, розкриті в даному документі, можуть застосовуватися в системі кодування мови, яка працює при погіршених характеристиках каналу. Деякі системи кодування мови виконують інтерполяцію і/або екстраполяцію LSF між LSF поточного кадру і LSF попереднього кадру на основі субкадрів. Проте, мовні артефакти можуть виходити в результаті в умовах стирання кадрів, залежно від LSF-вектора, оціненого внаслідок стертого кадру, при цьому оцінений LSFвектор використовується для того, щоб формувати LSF-вектори субкадрів для кадру, що коректно приймається. 12 UA 114233 C2 5 10 15 20 25 30 35 40 45 50 55 [0093] Фіг. 7 є блок-схемою, що ілюструє одну конфігурацію електронного пристрою 737, виконаного з можливістю визначення набору коефіцієнтів інтерполяції. Електронний пристрій 737 включає в себе декодер 708. Декодер 708 формує декодований мовний сигнал 759 (наприклад, синтезований мовний сигнал) на основі квантованих вагових векторів 729, квантованих LSF-векторів 782, індикатора 731 режиму прогнозування і/або кодованого сигналу 798 збудження. Один або більше декодерів, описаних вище, можуть реалізовуватися відповідно до декодера 708, описаного в зв'язку з фіг. 7. Електронний пристрій 737 також включає в себе детектор 743 стертих кадрів. Детектор 743 стертих кадрів може реалізовуватися окремо від декодера 708 або може реалізовуватися в декодері 708. Детектор 743 стертих кадрів виявляє стертий кадр (наприклад, кадр, який не приймається або приймається з помилками) і може надавати індикатор 767 стертого кадру, коли стертий кадр виявляється. Наприклад, детектор 743 стертих кадрів може виявляти стертий кадр на основі одного або більше з хеш-функції, контрольної суми, коду з повтореннями, біта(ів) парності, контролю циклічним надмірним кодом (CRC) тощо. [0094] Потрібно зазначити, що один або більше компонентів, включених в електронний пристрій 737 і/або декодер 708, можуть реалізовуватися в апаратних засобах (наприклад, в схемі), в програмному забезпеченні або в комбінації вищезазначеного. Наприклад, одне або більше з модуля 761 визначення значень і модуля 765 визначення наборів коефіцієнтів інтерполяції можуть реалізовуватися в апаратних засобах (наприклад, в схемі), в програмному забезпеченні або в комбінації вищезазначеного. Також потрібно зазначити, що стрілки в прямокутниках на фіг. 7 або на інших блок-схемах в даному документі можуть означати прямий або непрямий зв'язок між компонентами. Наприклад, модуль 761 визначення значень може з’єднуватися з модулем 765 визначення наборів коефіцієнтів інтерполяції. [0095] Декодер 708 формує декодований мовний сигнал 759 (наприклад, синтезований мовний сигнал) на основі параметрів, що приймаються. Приклади параметрів, що приймаються, включають в себе квантовані LSF-вектори 782, квантовані вагові вектори 729, індикатор 731 режиму прогнозування і кодований сигнал 798 збудження. Декодер 708 включає в себе одне або більше із зворотного квантувача А 745, модуля 749 інтерполяції, зворотного перетворювача 753 коефіцієнтів, синтезуючого фільтра 757, модуля 761 визначення значень, модуля 765 визначення наборів коефіцієнтів інтерполяції і зворотного квантувача В 773. [0096] Декодер 708 приймає квантовані LSF-вектори 782 (наприклад, квантовані LSF, LSP, ISF, ISP, ParCor-коефіцієнти, коефіцієнти відображення або значення логарифмічного відношення площ) і квантовані вагові вектори 729. Квантовані LSF-вектори 782, що приймаються, можуть відповідати піднабору субкадрів. Наприклад, квантовані LSF-вектори 782 можуть включати в себе тільки квантовані кінцеві LSF-вектори, які відповідають останньому субкадру кожного кадру. У деяких конфігураціях, квантовані LSF-вектори 782 можуть являти собою індекси, що відповідають таблиці пошуку або таблиці кодування. Додатково або альтернативно, квантовані вагові вектори 729 можуть являти собою індекси, що відповідають таблиці пошуку або таблиці кодування. [0097] Електронний пристрій 737 і/або декодер 708 можуть приймати індикатор 731 режиму прогнозування з кодера. Як описано вище, індикатор 731 режиму прогнозування вказує режим прогнозування для кожного кадру. Наприклад, індикатор 731 режиму прогнозування може вказувати один з двох або більше режимів прогнозування для кадру. Більш конкретно, індикатор 731 режиму прогнозування може вказувати те, використовується прогнозуюче квантування або непрогнозуюче квантування, і/або степінь залежності, в якому векторне LSF-квантування для кадру залежить від LSF-вектора попереднього кадру. Як описано вище в зв'язку з фіг. 4, індикатор 731 режиму прогнозування може вказувати один або більше режимів прогнозування, що відповідають поточному кадру (наприклад, кадру n) і/або попередньому кадру (наприклад, кадру n-1). [0098] Коли кадр коректно приймається, зворотний квантувач А 745 деквантує квантовані LSF-вектори 729, що приймаються, щоб формувати деквантовані LSF-вектори 747. Наприклад, зворотний квантувач А 745 може шукати деквантовані LSF-вектори 747 на основі індексів (наприклад, квантованих LSF-векторів 782), що відповідають таблиці пошуку або таблиці кодування. Деквантування квантованих LSF-векторів 782 також може бути основане на індикаторі 731 режиму прогнозування. Деквантовані LSF-вектори 747 можуть відповідати e піднабору субкадрів (наприклад, кінцевим LSF-векторам x n , що відповідають останньому субкадру кожного кадру). Крім того, зворотний квантувач А 745 деквантує квантовані вагові вектори 729, щоб формувати деквантовані вагові вектори 739. Наприклад, зворотний квантувач 13 UA 114233 C2 5 10 15 20 25 30 А 745 може шукати деквантовані вагові вектори 739 на основі індексів (наприклад, квантованих вагових векторів 729), що відповідають таблиці пошуку або таблиці кодування. [0099] Коли кадр являє собою стертий кадр, детектор 743 стертих кадрів може надавати індикатор 767 стертого кадру в зворотний квантувач А 745. Коли виникає стертий кадр, один або більше квантованих LSF-векторів 782 і/або один або більше квантованих вагових векторів 729 можуть не прийматися або можуть містити помилки. У цьому випадку, зворотний квантувач А 745 може оцінювати один або більше деквантованих LSF-векторів 747 (наприклад, кінцевий e LSF-вектор стертого кадру x n ) на основі одного або більше LSF-векторів з попереднього кадру (наприклад, кадру перед стертим кадром). Додатково або альтернативно, зворотний квантувач А 745 може оцінювати один або більше деквантованих вагових векторів 739, коли виникає стертий кадр. Деквантовані LSF-вектори 747 (наприклад, кінцеві LSF-вектори) можуть надаватися в модуль 749 інтерполяції та необов'язково в модуль 761 визначення значень. [00100] Модуль 761 визначення значень визначає значення 763 на основі властивості поточного кадру і властивості попереднього кадру. Значення 763 являє собою показник, який вказує степінь зміни між властивістю попереднього кадру і властивістю поточного кадру. Приклади властивостей кадру включають в себе імпульсну енергію синтезуючого фільтра (наприклад, посилення синтезуючого фільтра), коефіцієнти відображення і нахили спектра. Різкі зміни у властивостях кадру можуть бути нетиповими в мові і можуть призводити до артефактів у синтезованому мовному сигналі, якщо залишаються невирішеними. Відповідно, значення 763 може бути використане для того, щоб дозволяти потенційні артефакти у випадку стирання кадрів. [00101] У деяких конфігураціях, значення 763 може бути відношенням енергій. Наприклад, модуль 761 визначення значень може визначати відношення (наприклад, R) енергій енергії імпульсної характеристики синтезуючого фільтра поточного кадру (наприклад, E n ) і енергії імпульсної характеристики синтезуючого фільтра попереднього кадру (наприклад, E n 1 ). [00102] В одному підході, модуль 761 визначення значень може визначати відношення енергій таким чином. Модуль 761 визначення значень може одержувати кінцевий LSF-вектор e e поточного кадру (наприклад, x n ) і кінцевий LSF-вектор попереднього кадру (наприклад, x n 1 ) з деквантованих LSF-векторів 747. Модуль 761 визначення значень може виконувати зворотне перетворення коефіцієнтів для кінцевого LSF-вектора поточного кадру і кінцевого LSF-вектора попереднього кадру, щоб одержувати кінцевий синтезуючий фільтр поточних кадрів (наприклад, ) і кінцевий синтезуючий фільтр попередніх кадрів (наприклад, 35 ), відповідно. Модуль 761 визначення значень може визначати імпульсні характеристики кінцевого синтезуючого фільтра поточного кадру і кінцевого синтезуючого фільтра попереднього кадру. e e Наприклад, імпульсні характеристики синтезуючих фільтрів, що відповідають x n 1 та x n , можуть, відповідно, позначатися як hn 1 i та hn i , де i є індексом вибірки імпульсної характеристики. Потрібно зазначити, що імпульсні характеристики (наприклад, hn 1 i та 40 45 hn i ) можуть зрізатися, оскільки кінцевий синтезуючий фільтр поточних кадрів і кінцевий синтезуючий фільтр попередніх кадрів являють собою фільтри з нескінченною імпульсною характеристикою (IIR). [00103] Імпульсна енергія синтезуючого фільтра поточного кадру є одним прикладом властивості поточного кадру. Додатково, енергія імпульсної характеристики синтезуючого фільтра попереднього кадру є одним прикладом властивості попереднього кадру. У деяких конфігураціях, модуль 761 визначення значень може визначати імпульсну енергію синтезуючого фільтра поточного кадру (наприклад, E n ) і енергію імпульсної характеристики синтезуючого фільтра попереднього кадру (наприклад, E n 1 ) відповідно до рівняння (3). 14 UA 114233 C2 [00104] У рівнянні (3), i є індексом вибірки, і N є довжиною зрізаної імпульсної характеристики hn i . Як проілюстровано за допомогою рівняння (3), імпульсна енергія 5 синтезуючого фільтра поточного кадру та енергія імпульсної характеристики синтезуючого фільтра попереднього кадру може зрізатися. У деяких конфігураціях, N може становити 128 вибірок. Енергії імпульсної характеристики синтезуючого фільтра (наприклад, E n та E n 1 ) можуть бути оцінками посилень відповідних синтезуючих фільтрів (які основані, наприклад, на e e LSF-векторах x n та x n 1 ). [00105] Модуль 761 визначення значень може визначати відношення енергій між імпульсною енергією синтезуючого фільтра поточного кадру (наприклад, E n ) і енергією імпульсної 10 15 характеристики синтезуючого фільтра попереднього кадру (наприклад, E n 1 ) відповідно до рівняння (4). [00106] У деяких конфігураціях, значення 763 може бути багатовимірним. Наприклад, модуль 761 визначення значень може визначати значення 763 як набір коефіцієнтів відображення. Наприклад, модуль 761 визначення значень може визначати перший коефіцієнт відображення поточного кадру (наприклад, R0 n ) і перший коефіцієнт відображення попереднього кадру (наприклад, R0 n 1 ). У деяких конфігураціях, один або більше коефіцієнтів 20 25 30 35 40 45 50 відображення можуть витягуватися з одного або більше LSF-векторів (наприклад, деквантованих LSF-векторів 747) і/або векторів коефіцієнтів лінійного прогнозування. Наприклад, коефіцієнти відображення можуть бути основані на LPC-коефіцієнтах. Значення 763 може включати в себе перший коефіцієнт відображення поточного кадру і перший коефіцієнт відображення попереднього кадру. Відповідно, значення 763 може вказувати зміну (якщо виникає) між першим коефіцієнтом відображення поточного кадру (наприклад, R0 n ) і першим коефіцієнтом відображення попереднього кадру (наприклад, R0 n 1 ). В інших конфігураціях, значення 763 може включати в себе один або більше нахилів спектра кожного кадру, які можуть визначатися як відношення енергії смуги високих частот (наприклад, верхньої половини спектрального діапазону) до енергії смуги низьких частот (наприклад, нижньої половини спектрального діапазону). [00107] Значення 763 може надаватися в модуль 765 визначення наборів коефіцієнтів інтерполяції. Модуль 765 визначення наборів коефіцієнтів інтерполяції може визначати те, знаходиться чи ні значення 763 (наприклад, відношення енергій, коефіцієнти відображення або нахили спектра) за межами діапазону. Діапазон вказує домен значень 763, які є характерними для звичайної мови. Наприклад, діапазон може відділяти значення 763, які типово виникають в звичайній мові, від значень 763, які не виникають і/або є рідкими в звичайній мові. Наприклад, значення 763, які знаходяться за межами діапазону, можуть вказувати характеристики кадру, які виникають в зв'язку зі стертим кадром і/або недостатнім маскуванням стирання кадрів. Відповідно, модуль 765 визначення наборів коефіцієнтів інтерполяції може визначати те, демонструє чи ні кадр характеристики, які не виникають або які є рідкими в звичайній мові, на основі значення 763 і діапазону. [00108] У деяких конфігураціях, діапазон може бути багатовимірний. Наприклад, діапазон може задаватися в двох або більше розмірностях. У цих конфігураціях, багатовимірне значення 763 може знаходитися за межами діапазону, якщо кожна розмірність значення 763 знаходиться за межами кожної розмірності діапазону. Потрібно зазначити, що визначення того, знаходиться чи ні значення 763 за межами діапазону (наприклад, першого діапазону), може означати визначення того, знаходиться чи ні значення 763 всередині іншого діапазону (наприклад, в доповненні першого діапазону). [00109] Діапазон може бути оснований на одному або більше порогових значень. В одному прикладі, одне порогове значення може відділяти значення 763 всередині діапазону від значень 763 за межами діапазону. Наприклад, всі значення 763 вище порогового значення можуть знаходитися всередині діапазону, а всі значення 763 нижче порогового значення можуть знаходитися за межами діапазону. Альтернативно, всі значення 763 нижче порогового значення можуть знаходитися всередині діапазону, а всі значення 763 вище порогового значення можуть 15 UA 114233 C2 5 10 15 20 25 30 35 40 знаходитися за межами діапазону. В іншому прикладі, два порогових значення можуть відділяти значення 763 всередині діапазону від значень 763 за межами діапазону. Наприклад, всі значення 763 між пороговими значеннями можуть знаходитися всередині діапазону, в той час як всі значення 763, які нижче нижнього порогового значення і вище більш високого порогового значення, можуть знаходитися за межами діапазону. Альтернативно, всі значення 763 між пороговими значеннями можуть знаходитися за межами діапазону, в той час як всі значення 763, які нижче нижнього порогового значення і вище більш високого порогового значення, можуть знаходитися всередині діапазону. Як проілюстровано за допомогою цих прикладів, діапазон може бути безперервним або переривчастим. У додаткових прикладах, можуть використовуватися більше двох порогових значень. У деяких конфігураціях, багатовимірний діапазон може бути оснований щонайменше на двох порогових значеннях, при цьому перше порогове значення відповідає одній розмірності діапазону, а друге порогове значення відповідає іншій розмірності діапазону. [00110] У деяких конфігураціях, модуль 765 визначення наборів коефіцієнтів інтерполяції може визначати те, знаходиться чи ні значення 763 за межами діапазону, за допомогою визначення того, відношення (R) енергій менше чи ні одного або більше порогових значень і/або більше чи ні одного або більше порогових значень. В інших конфігураціях, модуль 765 визначення наборів коефіцієнтів інтерполяції може визначати те, знаходиться чи ні значення 763 за межами діапазону, за допомогою визначення того, знаходиться чи ні зміна між першим коефіцієнтом відображення (R0) (або, наприклад, нахилом спектра) попереднього кадру і поточного кадру за межами багатовимірного діапазону. Наприклад, електронний пристрій 737 може визначати те, перевищує чи ні перший коефіцієнт відображення попереднього кадру (наприклад, R0 n 1 ) перше порогове значення, і те, менше чи ні перший коефіцієнт відображення поточного кадру (наприклад, R0 n ) другого порогового значення. [00111] Якщо значення 763 не знаходиться за межами діапазону, модуль 765 визначення наборів коефіцієнтів інтерполяції може використовувати набір коефіцієнтів інтерполяції за умовчанням. Набір коефіцієнтів інтерполяції за умовчанням може являти собою фіксований набір коефіцієнтів інтерполяції, який використовується, коли стирання кадрів не виникає (наприклад, при характеристиках чистого каналу). Наприклад, модуль 765 визначення наборів коефіцієнтів інтерполяції може надавати набір коефіцієнтів інтерполяції за умовчанням як набір 769 коефіцієнтів інтерполяції, коли значення 763 не знаходиться за межами діапазону. [00112] Модуль 765 визначення наборів коефіцієнтів інтерполяції може визначати набір 769 коефіцієнтів інтерполяції. Наприклад, модуль 765 визначення наборів коефіцієнтів інтерполяції може визначати набір 769 коефіцієнтів інтерполяції на основі значення 763 та індикатора 731 режиму прогнозування, якщо значення 763 знаходиться за межами діапазону. Набір коефіцієнтів інтерполяції являє собою набір з двох або більше коефіцієнтів інтерполяції. Наприклад, набір коефіцієнтів інтерполяції може включати в себе коефіцієнти та інтерполяції. У деяких конфігураціях, набір коефіцієнтів інтерполяції може включати в себе різницевий коефіцієнт, який оснований на інших коефіцієнтах інтерполяції в наборі коефіцієнтів інтерполяції. Наприклад, набір коефіцієнтів інтерполяції може включати в себе коефіцієнти , інтерполяції і різницевий коефіцієнт 1 . У деяких конфігураціях, набір коефіцієнтів інтерполяції може включати в себе два або більше коефіцієнтів інтерполяції для одного або більше субкадрів. Наприклад, набір коефіцієнтів інтерполяції може включати в себе, k , k і різницевий коефіцієнт 1 k k для k-того субкадру, де 45 50 55 k , , K , і K є числом 1 субкадрів у кадрі. Коефіцієнти інтерполяції (і, наприклад, різницевий коефіцієнт) використовуються для того, щоб інтерполювати деквантовані LSF-вектори 747. [00113] Якщо значення 763 знаходиться за межами діапазону, модуль 765 визначення наборів коефіцієнтів інтерполяції може визначати (наприклад, вибирати) набір 769 коефіцієнтів інтерполяції з групи наборів коефіцієнтів інтерполяції на основі значення 763 та індикатора 731 режиму прогнозування. Наприклад, системи та способи, розкриті в даному документі, можуть надавати адаптивний механізм для того, щоб перемикатися між заздалегідь заданими наборами коефіцієнтів інтерполяції (наприклад, різними наборами та ) на основі значення 763 та індикатора 731 режиму прогнозування. [00114] Потрібно зазначити, що деякі відомі підходи використовують тільки фіксований коефіцієнт інтерполяції. Наприклад, один відомий підхід, наданий за допомогою технічних вимог вдосконаленого кодека із змінною швидкістю версія В (EVRC-B), може використовувати тільки один фіксований коефіцієнт інтерполяції. У підходах, які використовують фіксовану 16 UA 114233 C2 5 10 15 20 25 30 інтерполяцію, коефіцієнт(и) інтерполяції не може змінюватися або не може бути адаптованим. Проте, відповідно до систем та способів, розкритих в даному документі, електронний пристрій 737 може адаптивно визначати різні набори коефіцієнтів інтерполяції (наприклад, адаптивно вибирати набір коефіцієнтів інтерполяції з групи декількох наборів коефіцієнтів інтерполяції) на основі значення 763 і/або індикатора 731 режиму прогнозування. У деяких випадках, може використовуватися набір коефіцієнтів інтерполяції за умовчанням. Набір коефіцієнтів інтерполяції за умовчанням може бути ідентичним набору коефіцієнтів інтерполяції, який використовується у випадку чистого каналу (наприклад, без стертого кадру). Системи та способи, розкриті в даному документі, можуть виявляти випадки для відхилення від набору коефіцієнтів інтерполяції за умовчанням. [00115] Системи та способи, розкриті в даному документі, можуть надавати перевагу більшої гнучкості при обробці потенційних артефактів, що викликаються за допомогою стирань кадрів. Інша перевага систем та способів, розкритих в даному документі, може полягати в тому, що може не вимагатися додаткова передача службових сигналів. Наприклад, може не вимагатися додаткова передача службових сигналів, крім індикатора 731 режиму прогнозування, квантованих LSF-векторів 782 і/або кодованого сигналу 798 збудження для того, щоб реалізовувати системи та способи, розкриті в даному документі. [00116] У деяких конфігураціях, визначення набору 769 коефіцієнтів інтерполяції може бути основане на одному або більше порогових значень за межами діапазону. Наприклад, різні набори коефіцієнтів інтерполяції можуть визначатися на основі степені, в якому значення 763 знаходиться за межами діапазону, як визначено на основі одного або більше порогових значень за межами діапазону. В інших конфігураціях, не можуть використовуватися порогові значення за межами діапазону. У цих конфігураціях, можуть використовуватися тільки одне або більше порогових значень, які обмежують діапазон. Наприклад, набір 769 коефіцієнтів інтерполяції може визначатися на основі будь-якого значення 763 за межами діапазону і на основі індикатора 731 режиму прогнозування. Визначення набору 769 коефіцієнтів інтерполяції може бути виконане відповідно до одного або більше підходів. Приклади деяких підходів задаються таким чином. [00117] В одному підході, модуль 765 визначення наборів коефіцієнтів інтерполяції може визначати набір 769 коефіцієнтів інтерполяції (наприклад, k , k і 1 k k ) на основі відношення (наприклад, R) енергій. Зокрема, якщо R знаходиться за межами діапазону, можна припускати, що кінцевий LSF стертого кадру (наприклад, кадру n-1) некоректно оцінений. Отже, різний набір k , k і 1 k k може вибиратися таким чином, що більший ваговий коефіцієнт 35 40 45 50 55 інтерполяції привласнюється кінцевому LSF-вектору e xn поточного кадру (наприклад, кадру, що коректно приймається). Це може допомагати зменшувати артефакти в синтезованому мовному сигналі (наприклад, в декодованому мовному сигналі 759). [00118] У зв'язку з відношенням (R) енергій індикатор 731 режиму прогнозування також може бути використаний в деяких конфігураціях. Індикатор 731 режиму прогнозування може e відповідати поточному кадру (наприклад, при квантуванні кінцевого LSF-вектора x n поточного кадру). У цьому підході, набір коефіцієнтів інтерполяції може визначатися на основі того, є режим прогнозування кадру прогнозуючим або непрогнозуючим. Якщо поточний кадр (наприклад, кадр n) використовує непрогнозуюче квантування, можна припустити, що кінцевий e LSF x n поточного кадру коректно квантований. Таким чином, більш високий ваговий коефіцієнт e інтерполяції може надаватися кінцевому LSF x n поточного кадру в порівнянні з випадком, в e якому кінцевий LSF x n поточного кадру квантується з прогнозуючим квантуванням. Відповідно, модуль 765 визначення наборів коефіцієнтів інтерполяції використовує відношення (R) енергій, а також те, застосовує поточний кадр прогнозуюче або непрогнозуюче квантування (наприклад, прогнозуючу або непрогнозуючу природу LSF-квантувача кадру n), для того щоб визначати набір 769 коефіцієнтів інтерполяції в цьому підході. [00119] Нижченаведена роздруківка (1) ілюструє приклади наборів коефіцієнтів інтерполяції, які можуть використовуватися в цьому підході. Модуль 765 визначення наборів коефіцієнтів інтерполяції може визначати (наприклад, вибирати) один з наборів коефіцієнтів інтерполяції на основі значення 763 та індикатора 731 режиму прогнозування. У деяких конфігураціях, коефіцієнти інтерполяції можуть перейти від залежності від LSF-вектора попереднього кадру до збільшеної залежності від LSF-вектора поточного кадру. Коефіцієнти інтерполяції (наприклад, 17 UA 114233 C2 вагові коефіцієнти) наведені в роздруківці (1), в якій кожний рядок упорядковується як k , 1 k k та k , при цьому кожний рядок відповідає кожному субкадру k, і k={1, 2, 3, 4}. 5 Наприклад, перший рядок кожного набору коефіцієнтів інтерполяції включає в себе коефіцієнти інтерполяції для першого субкадру, другий рядок включає в себе коефіцієнти інтерполяції для другого субкадру, тощо. Наприклад, якщо Interpolation_factor_set_A визначається як набір 769 коефіцієнтів інтерполяції, модуль 749 інтерполяції застосовує 1 0.30 , 1 0.00 і 1 1 1 0.70 для першого субкадру відповідно до рівняння (2) в процесі інтерполяції. 10 15 20 25 30 35 40 Потрібно зазначити, що набори коефіцієнтів інтерполяції, наведені в роздруківці (1), є прикладами. Інші набори коефіцієнтів інтерполяції можуть бути використані відповідно до систем та способів, розкритих в даному документі. Interpolation_factor_set_A={0,00, 0,70, 0,30, 0,00, 0,00, 1,00, 0,00, 0,00, 1,00, 0,00, 0,00, 1,00}; Interpolation_factor_set_B={0,15, 0,70, 0,15, 0,05, 0,65, 0,30, 0,00, 0,50, 0,50, 0,00, 0,0, 1,00}; Interpolation_factor_set_C={0,10, 0,70, 0,20, 0,00, 0,30, 0,70, 0,00, 0,10, 0,90, 0,00, 0,00, 1,00}; Interpolation_factor_set_D={0,30, 0,50, 0,20, 0,15, 0,65, 0,20, 0,05, 0,55, 0,40, 0,00, 0,00, 1,00}; Interpolation_factor_set_E={0,55, 0,45, 0,00, 0,05, 0,95, 0,00, 0,00, 0,55, 0,45, 0,00, 0,00, 1,00}; роздруківка (1) [00120] У роздруківці (2), один набір 769 коефіцієнтів інтерполяції (наприклад, «pt_int_coeffs») може визначатися за допомогою вибору одного з наборів коефіцієнтів інтерполяції з роздруківки (1) на основі відношення (R) енергій (наприклад, значення 763) та індикатора 731 режиму прогнозування для поточного кадру (наприклад, «frame_n_mode»). Наприклад, набір 769 коефіцієнтів інтерполяції може визначатися на основі того, є режим прогнозування поточних кадрів непрогнозуючим або прогнозуючим, і на основі двох порогових значень (наприклад, TH1, TH2), які можуть бути використані для того, щоб визначати те, знаходиться чи ні (і в якому степені знаходиться) R за межами діапазону. У роздруківці (2), діапазон може задаватися як R≥TH2. if ((R
ДивитисяДодаткова інформація
Назва патенту англійськоюSystems and methods for determining an interpolation factor set
Автори англійськоюRajendran, Vivek, Subasingha, Subasingha Shaminda, Krishnan, Venkatesh
Автори російськоюРаджендран Вивек, Субасингха Субасингха Шаминда, Кришнан Венкатэш
МПК / Мітки
МПК: G10L 19/005, G10L 19/07
Мітки: коефіцієнтів, набору, способи, системі, інтерполяції, визначення
Код посилання
<a href="https://ua.patents.su/42-114233-sistemi-ta-sposobi-dlya-viznachennya-naboru-koeficiehntiv-interpolyaci.html" target="_blank" rel="follow" title="База патентів України">Системи та способи для визначення набору коефіцієнтів інтерполяції</a>
Попередній патент: Очисник головок коренеплодів
Наступний патент: Інгібітор асфальтово-смолистих та парафінових відкладів
Випадковий патент: Розкладний дренаж для дренування черевної порожнини