Системи, способи і пристрій широкосмугового мовного кодування
Номер патенту: 92341
Опубліковано: 25.10.2010
Формула / Реферат
1. Спосіб обробки сигналу для генерування широкосмугового мовного сигналу з вхідних сигналів, які містять параметри фільтра смуги нижніх частот, сигнал збудження смуги нижніх частот і параметри фільтра смуги верхніх частот, що містить етапи, на яких
синтезують мовний сигнал смуги нижніх частот згідно з щонайменше сигналом збудження смуги нижніх частот і сукупністю параметрів фільтра смуги нижніх частот,
генерують сигнал збудження смуги верхніх частот на основі сигналу збудження смуги нижніх частот,
згідно з щонайменше сигналом збудження смуги верхніх частот і сукупністю параметрів фільтра смуги верхніх частот синтезують мовний сигнал смуги верхніх частот, і
об'єднують мовний сигнал смуги нижніх частот і мовний сигнал смуги верхніх частот для одержання широкосмугового мовного сигналу,
при цьому на етапі генерації сигналу збудження смуги верхніх частот застосовують нелінійну функцію до сигналу, який оснований на сигналі збудження смуги нижніх частот, для генерації спектрально розширеного сигналу, в якому сигнал збудження смуги верхніх частот оснований на спектрально розширеному сигналі.
2. Спосіб обробки сигналу за п. 1, в якому на етапі синтезу мовного сигналу смуги нижніх частот синтезують мовний сигнал смуги нижніх частот згідно з щонайменше сигналом збудження смуги нижніх частот і сукупністю коефіцієнтів фільтра лінійного прогнозування.
3. Спосіб обробки сигналу за п. 1, в якому на етапі синтезу мовного сигналу смуги верхніх частот синтезують мовний сигнал смуги верхніх частот згідно з щонайменше сигналом збудження смуги верхніх частот і сукупністю коефіцієнтів фільтра лінійного прогнозування.
4. Спосіб обробки сигналу за п. 1, в якому нелінійна функція є нелінійною функцією без запам'ятовування.
5. Спосіб обробки сигналу за п. 1, в якому нелінійна функція є функцією абсолютного значення.
6. Спосіб обробки сигналу за п. 1, в якому на етапі генерації сигналу збудження смуги верхніх частот змішують сигнал, який оснований на спектрально розширеному сигналі, з модульованим шумовим сигналом, при цьому сигнал збудження смуги верхніх частот оснований на змішаному сигналі.
7. Спосіб обробки сигналу за п. 6, в якому модульований шумовий сигнал оснований на результаті модуляції шумового сигналу згідно з обвідною часової області сигналу, основаного на щонайменше одному з мовного сигналу смуги нижніх частот, сигналу збудження смуги нижніх частот і спектрально розширеного сигналу.
8. Спосіб обробки сигналу за п. 1, який містить етап, на якому, до об'єднання і згідно з сукупністю коефіцієнтів підсилення, змінюють амплітуду мовного сигналу смуги верхніх частот в часі.
9. Спосіб обробки сигналу за п. 8, в якому на етапі зміни амплітуди мовного сигналу смуги верхніх частот змінюють, згідно з сукупністю коефіцієнтів підсилення, амплітуду в часі щонайменше одного з сигналу збудження смуги нижніх частот, спектрально розширеного сигналу, сигналу збудження смуги верхніх частот і мовного сигналу смуги верхніх частот.
10. Носій даних, який має машиновиконувані команди, що описують спосіб обробки сигналу за будь-яким з попередніх пунктів.
11. Пристрій для генерування широкосмугового мовного сигналу з вхідних сигналів, які містять параметри фільтра смуги нижніх частот, сигнал збудження смуги нижніх частот і параметри фільтра смуги верхніх частот, що містить
вузькосмуговий декодер, виконаний з можливістю синтезування мовного сигналу смуги нижніх частот згідно з щонайменше сигналом збудження смуги нижніх частот і сукупністю параметрів фільтра смуги нижніх частот,
декодер смуги верхніх частот, виконаний з можливістю генерування сигналу збудження смуги верхніх частот на основі сигналу збудження смуги нижніх частот і синтезування мовного сигналу смуги верхніх частот згідно з щонайменше сигналом збудження смуги верхніх частот і сукупністю параметрів фільтра смуги верхніх частот, і
гребінку фільтрів, виконану з можливістю об'єднання мовного сигналу смуги нижніх частот і мовного сигналу смуги верхніх частот для одержання широкосмугового мовного сигналу,
при цьому декодер смуги верхніх частот виконаний з можливістю застосування нелінійної функції до сигналу, який оснований на сигналі збудження смуги нижніх частот, для генерації спектрально розширеного сигналу, і
декодер смуги верхніх частот виконаний з можливістю генерування сигналу збудження смуги верхніх частот на основі спектрально розширеного сигналу.
12. Пристрій за п. 11, в якому вузькосмуговий декодер виконаний з можливістю синтезування мовного сигналу смуги нижніх частот згідно з щонайменше сигналом збудження смуги нижніх частот і сукупністю коефіцієнтів фільтра лінійного прогнозування.
13. Пристрій за п. 11, в якому декодер смуги верхніх частот виконаний з можливістю синтезування мовного сигналу смуги верхніх частот згідно з щонайменше сигналом збудження смуги верхніх частот і сукупністю коефіцієнтів фільтра лінійного прогнозування.
14. Пристрій за п. 11, в якому декодер смуги верхніх частот виконаний з можливістю застосування нелінійної функції без запам'ятовування до сигналу, який оснований на вузькосмуговому сигналі збудження, для генерації спектрально розширеного сигналу.
15. Пристрій за п. 11, в якому декодер смуги верхніх частот виконаний з можливістю застосування функції абсолютного значення до сигналу, який оснований на сигналі збудження смуги нижніх частот, для генерації спектрально розширеного сигналу.
16. Пристрій за п. 11, в якому декодер смуги верхніх частот виконаний з можливістю змішування сигналу, який оснований на спектрально розширеному сигналі, з модульованим шумовим сигналом, і
при цьому декодер смуги верхніх частот виконаний з можливістю генерування сигналу збудження смуги верхніх частот на основі змішаного сигналу.
17. Пристрій за п. 16, в якому декодер смуги верхніх частот здійснює модуляцію шумового сигналу згідно з обвідною часової області сигналу, основаного на щонайменше одному з мовного сигналу смуги нижніх частот, сигналу збудження смуги нижніх частот і спектрально розширеного сигналу,
при цьому модульований шумовий сигнал оснований на результаті модуляції.
18. Пристрій за п. 11, в якому декодер смуги верхніх частот виконаний з можливістю зміни амплітуди мовного сигналу смуги верхніх частот у часі згідно з сукупністю коефіцієнтів підсилення.
19. Пристрій за п. 18, в якому декодер смуги верхніх частот виконаний з можливістю зміни амплітуди мовного сигналу смуги верхніх частот згідно з сукупністю коефіцієнтів підсилення, змінюючи, згідно з сукупністю коефіцієнтів підсилення, амплітуду в часі щонайменше одного з сигналу збудження смуги нижніх частот, спектрально розширеного сигналу, сигналу збудження смуги верхніх частот і мовного сигналу смуги верхніх частот.
20. Пристрій за п. 11, який містить стільниковий телефон.
21. Пристрій за п. 11, який містить пристрій для прийому сукупності пакетів, які узгоджуються з версією інтернет-протоколу, при цьому сукупність пакетів описує сигнал збудження смуги нижніх частот, сукупність параметрів фільтра смуги нижніх частот і сукупність параметрів фільтра смуги верхніх частот.
22. Спосіб обробки сигналу для генерування вихідних сигналів, які містять параметри фільтра смуги нижніх частот, сигнал збудження смуги нижніх частот і параметри фільтра смуги верхніх частот з вхідного сигналу, який містить широкосмуговий мовний сигнал, при цьому спосіб містить етапи, на яких
обробляють широкосмуговий мовний сигнал для одержання мовного сигналу смуги нижніх частот і мовного сигналу смуги верхніх частот,
кодують мовний сигнал смуги нижніх частот для одержання щонайменше кодованого сигналу збудження смуги нижніх частот і сукупності параметрів фільтра смуги нижніх частот,
генерують сигнал збудження смуги верхніх частот на основі кодованого сигналу збудження смуги нижніх частот,
згідно з сигналом збудження смуги верхніх частот кодують мовний сигнал смуги верхніх частот для одержання щонайменше сукупності параметрів фільтра смуги верхніх частот,
при цьому на етапі генерації сигналу збудження смуги верхніх частот застосовують нелінійну функцію до сигналу, який оснований на кодованому сигналі збудження смуги нижніх частот, для генерації спектрально розширеного сигналу, при цьому сигнал збудження смуги верхніх частот оснований на спектрально розширеному сигналі.
23. Спосіб обробки сигналу за п. 22, в якому на етапі кодування мовного сигналу смуги нижніх частот для одержання щонайменше кодованого сигналу збудження смуги нижніх частот і сукупності параметрів фільтра смуги нижніх частот кодують мовний сигнал смуги нижніх частот для одержання щонайменше кодованого сигналу збудження смуги нижніх частот і сукупності коефіцієнтів фільтра лінійного прогнозування.
24. Спосіб обробки сигналу за п. 22, в якому на етапі кодування мовного сигналу смуги верхніх частот для одержання щонайменше сукупності параметрів фільтра смуги верхніх частот кодують мовний сигнал смуги верхніх частот для одержання щонайменше сукупності коефіцієнтів фільтра лінійного прогнозування.
25. Спосіб обробки сигналу за п. 22, в якому нелінійна функція є нелінійною функцією без запам'ятовування.
26. Спосіб обробки сигналу за п. 22, в якому нелінійна функція є функцією абсолютного значення.
27. Спосіб обробки сигналу за п. 22, в якому на етапі генерації сигналу збудження смуги верхніх частот на основі спектрально розширеного сигналу змішують сигнал, який оснований на спектрально розширеному сигналі, з модульованим шумовим сигналом, при цьому сигнал збудження смуги верхніх частот оснований на змішаному сигналі.
28. Спосіб обробки сигналу за п. 27, в якому модульований шумовий сигнал оснований на результаті модуляції шумового сигналу згідно з обвідною часової області сигналу, основаного на щонайменше одному з мовного сигналу смуги нижніх частот, сигналу збудження смуги нижніх частот і спектрально розширеного сигналу.
29. Спосіб обробки сигналу за п. 22, який містить етап, на якому обчислюють обвідну підсилення згідно з співвідношенням, яке змінюється у часі, між сигналом смуги верхніх частот і сигналом, основаним на сигналі збудження смуги нижніх частот.
30. Спосіб обробки сигналу за п. 29, в якому етап обчислення обвідної підсилення містить етапи, на яких
на основі сигналу збудження смуги верхніх частот і сукупності параметрів фільтра смуги верхніх частот генерують синтезований сигнал смуги верхніх частот, і
обчислюють обвідну підсилення згідно з співвідношенням, яке змінюється у часі, між сигналом смуги верхніх частот і синтезованим сигналом смуги верхніх частот.
31. Носій даних, який має машиновиконувані команди, що описують спосіб обробки сигналу за будь-яким з пунктів 22-30.
32. Пристрій для генерування вихідних сигналів, які містять параметри фільтра смуги нижніх частот, сигнал збудження смуги нижніх частот і параметри фільтра смуги верхніх частот з вхідного сигналу, який містить широкосмуговий мовний сигнал, що містить
гребінку фільтрів, виконану з можливістю фільтрації широкосмугового мовного сигналу для одержання мовного сигналу смуги нижніх частот і мовного сигналу смуги верхніх частот, кодер смуги нижніх частот, виконаний з можливістю кодування мовного сигналу смуги нижніх частот для одержання щонайменше кодованого сигналу збудження смуги нижніх частот і сукупності параметрів фільтра смуги нижніх частот, і
кодер смуги верхніх частот, виконаний з можливістю генерування сигналу збудження смуги верхніх частот на основі кодованого сигналу збудження смуги нижніх частот, і кодування мовного сигналу смуги верхніх частот, згідно з сигналом збудження смуги верхніх частот для одержання щонайменше сукупності параметрів фільтра смуги верхніх частот,
при цьому кодер смуги верхніх частот виконаний з можливістю застосування нелінійної функції до сигналу, який оснований на кодованому сигналі збудження смуги нижніх частот, для генерації спектрально розширеного сигналу, і
декодер смуги верхніх частот виконаний з можливістю генерування сигналу збудження смуги верхніх частот на основі спектрально розширеного сигналу.
33. Пристрій за п. 32, в якому вузькосмуговий кодер виконаний з можливістю кодування мовного сигналу смуги нижніх частот для одержання щонайменше кодованого сигналу збудження смуги нижніх частот і сукупності коефіцієнтів фільтра лінійного прогнозування.
34. Пристрій за п. 32, в якому кодер смуги верхніх частот виконаний з можливістю кодування мовного сигналу смуги верхніх частот для одержання щонайменше сукупності коефіцієнтів фільтра лінійного прогнозування.
35. Пристрій за п. 32, в якому кодер смуги верхніх частот виконаний з можливістю застосування нелінійної функції без запам'ятовування до сигналу, який оснований на кодованому сигналі збудження смуги нижніх частот, для генерації спектрально розширеного сигналу.
36. Пристрій за п. 32, в якому кодер смуги верхніх частот виконаний з можливістю застосування функції абсолютного значення до сигналу, який оснований на кодованому сигналі збудження смуги нижніх частот, для генерації спектральнорозширеного сигналу.
37. Пристрій за п. 32, в якому кодер смуги верхніх частот виконаний з можливістю змішування сигналу, який оснований на спектрально розширеному сигналі, з модульованим шумовим сигналом, і
кодер смуги верхніх частот виконаний з можливістю генерування сигналу збудження смуги верхніх частот на основі змішаного сигналу.
38. Пристрій за п. 37, в якому кодер смуги верхніх частот виконаний з можливістю модулювання шумового сигналу згідно з обвідною часової області сигналу, основаного на щонайменше одному з мовного сигналу смуги нижніх частот, кодованого сигналу збудження смуги нижніх частот і спектрально розширеного сигналу.
39. Пристрій за п. 32, в якому кодер смуги верхніх частот виконаний з можливістю обчислення обвідної підсилення згідно з співвідношенням, яке змінюється в часі, між сигналом смуги верхніх частот і сигналом, основаним на кодованому сигналі збудження смуги нижніх частот.
40. Пристрій за п. 39, в якому кодер смуги верхніх частот виконаний з можливістю генерування синтезованого сигналу смуги верхніх частот на основі сигналу збудження смуги верхніх частот і сукупності параметрів фільтра смуги верхніх частот і обчислення обвідної підсилення згідно з співвідношенням, яке змінюється в часі, між сигналом смуги верхніх частот і синтезованим сигналом смуги верхніх частот.
41. Пристрій за п. 32, який містить стільниковий телефон.
42. Пристрій за п. 32, який містить пристрій, виконаний з можливістю передачі сукупності пакетів, які узгоджуються з версією інтернет-протоколу, причому сукупність пакетів описує кодований сигнал збудження смуги нижніх частот, сукупність параметрів фільтра смуги нижніх частот і сукупність параметрів фільтра смуги верхніх частот.
Текст
1. Спосіб обробки сигналу для генерування широкосмугового мовного сигналу з вхідних сигналів, які містять параметри фільтра смуги нижніх частот, сигнал збудження смуги нижніх частот і параметри фільтра смуги верхніх частот, що містить етапи, на яких синтезують мовний сигнал смуги нижніх частот згідно з щонайменше сигналом збудження смуги нижніх частот і сукупністю параметрів фільтра смуги нижніх частот, генерують сигнал збудження смуги верхніх частот на основі сигналу збудження смуги нижніх частот, згідно з щонайменше сигналом збудження смуги верхніх частот і сукупністю параметрів фільтра смуги верхніх частот синтезують мовний сигнал смуги верхніх частот, і об'єднують мовний сигнал смуги нижніх частот і мовний сигнал смуги верхніх частот для одержання широкосмугового мовного сигналу, при цьому на етапі генерації сигналу збудження смуги верхніх частот застосовують нелінійну функцію до сигналу, який оснований на сигналі збудження смуги нижніх частот, для генерації спектрально розширеного сигналу, в якому сигнал збудження смуги верхніх частот оснований на спектрально розширеному сигналі. 2. Спосіб обробки сигналу за п. 1, в якому на етапі синтезу мовного сигналу смуги нижніх частот синтезують мовний сигнал смуги нижніх частот згідно 2 (19) 1 3 92341 4 вузькосмуговий декодер, виконаний з можливістю 18. Пристрій за п. 11, в якому декодер смуги верхсинтезування мовного сигналу смуги нижніх частот ніх частот виконаний з можливістю зміни амплітузгідно з щонайменше сигналом збудження смуги ди мовного сигналу смуги верхніх частот у часі нижніх частот і сукупністю параметрів фільтра згідно з сукупністю коефіцієнтів підсилення. смуги нижніх частот, 19. Пристрій за п. 18, в якому декодер смуги верхдекодер смуги верхніх частот, виконаний з можлиніх частот виконаний з можливістю зміни амплітувістю генерування сигналу збудження смуги верхди мовного сигналу смуги верхніх частот згідно з ніх частот на основі сигналу збудження смуги нижсукупністю коефіцієнтів підсилення, змінюючи, ніх частот і синтезування мовного сигналу смуги згідно з сукупністю коефіцієнтів підсилення, ампліверхніх частот згідно з щонайменше сигналом туду в часі щонайменше одного з сигналу збузбудження смуги верхніх частот і сукупністю парадження смуги нижніх частот, спектрально розшиметрів фільтра смуги верхніх частот, і реного сигналу, сигналу збудження смуги верхніх гребінку фільтрів, виконану з можливістю об'єдчастот і мовного сигналу смуги верхніх частот. нання мовного сигналу смуги нижніх частот і мов20. Пристрій за п. 11, який містить стільниковий ного сигналу смуги верхніх частот для одержання телефон. широкосмугового мовного сигналу, 21. Пристрій за п. 11, який містить пристрій для при цьому декодер смуги верхніх частот виконаний прийому сукупності пакетів, які узгоджуються з з можливістю застосування нелінійної функції до версією інтернет-протоколу, при цьому сукупність сигналу, який оснований на сигналі збудження пакетів описує сигнал збудження смуги нижніх часмуги нижніх частот, для генерації спектрально стот, сукупність параметрів фільтра смуги нижніх розширеного сигналу, і частот і сукупність параметрів фільтра смуги верхдекодер смуги верхніх частот виконаний з можлиніх частот. вістю генерування сигналу збудження смуги верх22. Спосіб обробки сигналу для генерування вихініх частот на основі спектрально розширеного сигдних сигналів, які містять параметри фільтра смуналу. ги нижніх частот, сигнал збудження смуги нижніх 12. Пристрій за п. 11, в якому вузькосмуговий дечастот і параметри фільтра смуги верхніх частот з кодер виконаний з можливістю синтезування моввхідного сигналу, який містить широкосмуговий ного сигналу смуги нижніх частот згідно з щонаймовний сигнал, при цьому спосіб містить етапи, на менше сигналом збудження смуги нижніх частот і яких сукупністю коефіцієнтів фільтра лінійного прогнообробляють широкосмуговий мовний сигнал для зування. одержання мовного сигналу смуги нижніх частот і 13. Пристрій за п. 11, в якому декодер смуги верхмовного сигналу смуги верхніх частот, ніх частот виконаний з можливістю синтезування кодують мовний сигнал смуги нижніх частот для мовного сигналу смуги верхніх частот згідно з щоодержання щонайменше кодованого сигналу збунайменше сигналом збудження смуги верхніх часдження смуги нижніх частот і сукупності параметтот і сукупністю коефіцієнтів фільтра лінійного прорів фільтра смуги нижніх частот, гнозування. генерують сигнал збудження смуги верхніх частот 14. Пристрій за п. 11, в якому декодер смуги верхна основі кодованого сигналу збудження смуги ніх частот виконаний з можливістю застосування нижніх частот, нелінійної функції без запам'ятовування до сигназгідно з сигналом збудження смуги верхніх частот лу, який оснований на вузькосмуговому сигналі кодують мовний сигнал смуги верхніх частот для збудження, для генерації спектрально розширеноодержання щонайменше сукупності параметрів го сигналу. фільтра смуги верхніх частот, 15. Пристрій за п. 11, в якому декодер смуги верхпри цьому на етапі генерації сигналу збудження ніх частот виконаний з можливістю застосування смуги верхніх частот застосовують нелінійну фунфункції абсолютного значення до сигналу, який кцію до сигналу, який оснований на кодованому оснований на сигналі збудження смуги нижніх чассигналі збудження смуги нижніх частот, для генетот, для генерації спектрально розширеного сиграції спектрально розширеного сигналу, при цьому налу. сигнал збудження смуги верхніх частот оснований 16. Пристрій за п. 11, в якому декодер смуги верхна спектрально розширеному сигналі. ніх частот виконаний з можливістю змішування 23. Спосіб обробки сигналу за п. 22, в якому на сигналу, який оснований на спектрально розширеетапі кодування мовного сигналу смуги нижніх часному сигналі, з модульованим шумовим сигналом, тот для одержання щонайменше кодованого сигі налу збудження смуги нижніх частот і сукупності при цьому декодер смуги верхніх частот виконаний параметрів фільтра смуги нижніх частот кодують з можливістю генерування сигналу збудження смумовний сигнал смуги нижніх частот для одержання ги верхніх частот на основі змішаного сигналу. щонайменше кодованого сигналу збудження смуги 17. Пристрій за п. 16, в якому декодер смуги верхнижніх частот і сукупності коефіцієнтів фільтра ніх частот здійснює модуляцію шумового сигналу лінійного прогнозування. згідно з обвідною часової області сигналу, основа24. Спосіб обробки сигналу за п. 22, в якому на ного на щонайменше одному з мовного сигналу етапі кодування мовного сигналу смуги верхніх смуги нижніх частот, сигналу збудження смуги ничастот для одержання щонайменше сукупності жніх частот і спектрально розширеного сигналу, параметрів фільтра смуги верхніх частот кодують при цьому модульований шумовий сигнал основамовний сигнал смуги верхніх частот для одержанний на результаті модуляції. ня щонайменше сукупності коефіцієнтів фільтра лінійного прогнозування. 5 92341 6 25. Спосіб обробки сигналу за п. 22, в якому нелізбудження смуги нижніх частот, для генерації спенійна функція є нелінійною функцією без запам'яктрально розширеного сигналу, і товування. декодер смуги верхніх частот виконаний з можли26. Спосіб обробки сигналу за п. 22, в якому нелівістю генерування сигналу збудження смуги верхнійна функція є функцією абсолютного значення. ніх частот на основі спектрально розширеного сиг27. Спосіб обробки сигналу за п. 22, в якому на налу. етапі генерації сигналу збудження смуги верхніх 33. Пристрій за п. 32, в якому вузькосмуговий кочастот на основі спектрально розширеного сигнадер виконаний з можливістю кодування мовного лу змішують сигнал, який оснований на спектральсигналу смуги нижніх частот для одержання щоно розширеному сигналі, з модульованим шумонайменше кодованого сигналу збудження смуги вим сигналом, при цьому сигнал збудження смуги нижніх частот і сукупності коефіцієнтів фільтра верхніх частот оснований на змішаному сигналі. лінійного прогнозування. 28. Спосіб обробки сигналу за п. 27, в якому моду34. Пристрій за п. 32, в якому кодер смуги верхніх льований шумовий сигнал оснований на результачастот виконаний з можливістю кодування мовного ті модуляції шумового сигналу згідно з обвідною сигналу смуги верхніх частот для одержання щочасової області сигналу, основаного на щонайменайменше сукупності коефіцієнтів фільтра лінійнонше одному з мовного сигналу смуги нижніх часго прогнозування. тот, сигналу збудження смуги нижніх частот і спек35. Пристрій за п. 32, в якому кодер смуги верхніх трально розширеного сигналу. частот виконаний з можливістю застосування не29. Спосіб обробки сигналу за п. 22, який містить лінійної функції без запам'ятовування до сигналу, етап, на якому обчислюють обвідну підсилення який оснований на кодованому сигналі збудження згідно з співвідношенням, яке змінюється у часі, смуги нижніх частот, для генерації спектрально між сигналом смуги верхніх частот і сигналом, осрозширеного сигналу. нованим на сигналі збудження смуги нижніх час36. Пристрій за п. 32, в якому кодер смуги верхніх тот. частот виконаний з можливістю застосування фун30. Спосіб обробки сигналу за п. 29, в якому етап кції абсолютного значення до сигналу, який оснообчислення обвідної підсилення містить етапи, на ваний на кодованому сигналі збудження смуги яких нижніх частот, для генерації спектрально розшина основі сигналу збудження смуги верхніх частот і реного сигналу. сукупності параметрів фільтра смуги верхніх час37. Пристрій за п. 32, в якому кодер смуги верхніх тот генерують синтезований сигнал смуги верхніх частот виконаний з можливістю змішування сигначастот, і лу, який оснований на спектрально розширеному обчислюють обвідну підсилення згідно з співвідсигналі, з модульованим шумовим сигналом, і ношенням, яке змінюється у часі, між сигналом кодер смуги верхніх частот виконаний з можливіссмуги верхніх частот і синтезованим сигналом смутю генерування сигналу збудження смуги верхніх ги верхніх частот. частот на основі змішаного сигналу. 31. Носій даних, який має машиновиконувані ко38. Пристрій за п. 37, в якому кодер смуги верхніх манди, що описують спосіб обробки сигналу за частот виконаний з можливістю модулювання шубудь-яким з пунктів 22-30. мового сигналу згідно з обвідною часової області 32. Пристрій для генерування вихідних сигналів, сигналу, основаного на щонайменше одному з які містять параметри фільтра смуги нижніх часмовного сигналу смуги нижніх частот, кодованого тот, сигнал збудження смуги нижніх частот і парасигналу збудження смуги нижніх частот і спектраметри фільтра смуги верхніх частот з вхідного сигльно розширеного сигналу. налу, який містить широкосмуговий мовний сигнал, 39. Пристрій за п. 32, в якому кодер смуги верхніх що містить частот виконаний з можливістю обчислення обвідгребінку фільтрів, виконану з можливістю фільтраної підсилення згідно з співвідношенням, яке зміції широкосмугового мовного сигналу для одернюється в часі, між сигналом смуги верхніх частот і жання мовного сигналу смуги нижніх частот і мовсигналом, основаним на кодованому сигналі збуного сигналу смуги верхніх частот, кодер смуги дження смуги нижніх частот. нижніх частот, виконаний з можливістю кодування 40. Пристрій за п. 39, в якому кодер смуги верхніх мовного сигналу смуги нижніх частот для одерчастот виконаний з можливістю генерування синжання щонайменше кодованого сигналу збуджентезованого сигналу смуги верхніх частот на основі ня смуги нижніх частот і сукупності параметрів сигналу збудження смуги верхніх частот і сукупнофільтра смуги нижніх частот, і сті параметрів фільтра смуги верхніх частот і обкодер смуги верхніх частот, виконаний з можливісчислення обвідної підсилення згідно з співвіднотю генерування сигналу збудження смуги верхніх шенням, яке змінюється в часі, між сигналом смуги частот на основі кодованого сигналу збудження верхніх частот і синтезованим сигналом смуги смуги нижніх частот, і кодування мовного сигналу верхніх частот. смуги верхніх частот, згідно з сигналом збудження 41. Пристрій за п. 32, який містить стільниковий смуги верхніх частот для одержання щонайменше телефон. сукупності параметрів фільтра смуги верхніх час42. Пристрій за п. 32, який містить пристрій, викотот, наний з можливістю передачі сукупності пакетів, при цьому кодер смуги верхніх частот виконаний з які узгоджуються з версією інтернет-протоколу, можливістю застосування нелінійної функції до причому сукупність пакетів описує кодований сигсигналу, який оснований на кодованому сигналі нал збудження смуги нижніх частот, сукупність 7 92341 8 параметрів фільтра смуги нижніх частот і сукупність параметрів фільтра смуги верхніх частот. Пов'язані заявки Дана заявка претендує на пріоритет попередньої патентної заявки США № 60/667901, під назвою "CODING THE HIGH-FREQUENCY BAND OF WIDEBAND SPEECH", поданої 1 квітня 2005 року. Дана заявка також претендує на пріоритет попередньої патентної заявки США № 60/673965, під назвою "PARAMETER CODING IN A HIGH-BAND SPEECH CODER", поданої 22 квітня 2005 року. Галузь техніки, до якої належить винахід Даний винахід належить до обробки сигналу. Рівень техніки Голосовий зв'язок за допомогою телефонної мережі загального користування (PSTN) традиційно обмежений по пропускній здатності частотним діапазоном 300-3400 кГц. Нові мережі для голосового зв'язку, наприклад, мережі стільникового зв'язку і передачі голосу по IP (інтернет-протокол, VoIP), можуть не мати такі ж обмеження по пропускній здатності, і може виявитися бажаним передавати і приймати по таких мережах голосові передачі, які включають в себе широкий частотний діапазон. Наприклад, може виявитися бажаним підтримувати частотний діапазон аудіо з нижньою межею до 50 Гц і/або верхньою межею до 7 або 8 кГц. Також може виявитися бажаним підтримувати інші додатки, наприклад високоякісний аудіо- або аудіо/відеоконференцзв'язок, який може мати аудіо-мовний контент в діапазонах, які виходять за межі традиційних обмежень PSTN. Розширення діапазону, яке підтримується мовним кодером, на більш високі частоти може підвищити розбірливість голосу. Наприклад, інформація, яка диференціює фрикативні звуки, наприклад 'с' і 'ф', в основному міститься на високих частотах. Розширення смуги верхніх частот може підвищити інші якості мови, наприклад присутність. Наприклад, навіть вокалізований голосний звук може мати спектральну енергію значно вищу за обмеження PSTN. Один підхід до широкосмуговому мовного кодування передбачає поширення методу вузькосмугового мовного кодування (наприклад, призначеного для кодування діапазону 0-4 кГц) на широкий спектр. Наприклад, мовний сигнал можна дискретизувати на більш високій частоті, щоб він включав в себе високочастотні компоненти, і метод вузькосмугового кодування можна-адаптувати для використання більшої кількості коефіцієнтів фільтра для представлення цього широкосмугового сигналу. Методи вузькосмугового кодування, наприклад CELP (лінійне прогнозування з кодовим збудженням) вимагають великого об'єму обчислень, однак, широкосмуговий CELP-кодер може вимагати дуже багато циклів обробки, щоб мати практичне застосування в багатьох мобільних і інших вбудованих додатках. Кодування всього спектра широкосмугового сигналу для досягнення потрібної якості з використанням такого методу також може приводити до неприйнятно великого збільшення ширини смуги. Крім того, було б потрібне транскодування такого кодованого сигналу раніше, ніж передати навіть його вузькосмугову частину і/або декодувати за допомогою системи, яка підтримує тільки вузькосмугове кодування. Інший підхід до широкосмуговому мовного кодування передбачає екстраполяцію спектральної обвідної смуги верхніх частот з кодованою вузькосмуговою спектральною обвідною. Хоч такий підхід можна реалізувати без збільшення ширини смуги і без необхідності в транскодуванні, грубу спектральну обвідну або формантну структур} частини смуги верхніх частот мовного сигналу, в загальному випадку, неможливо точно прогнозувати на основі спектральної обвідної вузькосмугової частини. Може виявитися бажаним реалізувати широкосмугове мовне кодування так, щоб щонайменше вузькосмугову частину кодованого сигналу можна було передавати по вузькосмуговому каналу (наприклад, каналу PSTN) без транскодування або іншої значної зміни. Ефективність широкосмугового розширення кодування також може бути бажаною, наприклад, щоб уникнути значного скорочення кількості користувачів, які можуть обслуговуватися в додатках, наприклад, безпровідної стільникової телефонної мережі і мовленні по безпровідних і провідних каналах. Патенти US 5,978,759 та US 5,455,888 описують пристрій збільшення ширини смуги мовного сигналу, який одержує вхідний вузькосмуговий мовний сигнал і видає на виході мовний сигнал з розширеною шириною смуги. Суть винаходу Згідно з одним варіантом здійснення, спосіб обробки сигналу включає в себе етапи, на яких синтезують вузькосмуговий мовний сигнал згідно з щонайменше вузькосмуговим сигналом збудження і сукупністю вузькосмугових параметрів фільтра, і генерують сигнал збудження смуги верхніх частот на основі вузькосмугового сигналу збудження. Спосіб також включає в себе етапи, на яких синтезують мовний сигнал смуги верхніх частот згідно з щонайменше сигналом збудження смуги верхніх частот і сукупністю параметрів фільтра смуги верхніх частот, і об'єднують вузькосмуговий мовний сигнал і мовний сигнал смуги верхніх частот для отримання широкосмугового мовного сигналу. Згідно з цим способом, на етапі генерації сигналу збудження смуги верхніх частот застосовують нелінійну функцію до сигналу, який оснований на вузькосмуговому сигналі збудження, для генерації спектрально розширеного сигналу, і сигнал збудження смуги верхніх частот оснований на спектрально розширеному сигналі. Згідно з іншим варіантом здійснення, пристрій включає в себе вузькосмуговий декодер, здатний синтезувати вузькосмуговий мовний сигнал згідно з щонайменше вузькосмуговим сигналом збудження і сукупністю вузькосмугових параметрів фільтра. Пристрій також включає в себе декодер смуги верхніх частот, здатний генерувати сигнал збудження смуги верхніх частот на основі вузькосмугового сигналу збудження і синтезувати мов 9 92341 10 ний сигнал смуги верхніх частот згідно з щонаймеФіг. 1b - блок-схема реалізації А102 широкоснше сигналом збудження смуги верхніх частот і мугового мовного кодера А100. сукупністю параметрів фільтра смуги верхніх часФіг. 2а - блок-схема широкосмугового мовного тот. Пристрій також включає в себе гребінку фільдекодера В100 згідно з варіантом здійснення. трів, призначену для об'єднання вузькосмугового Фіг. 2b - блок-схема реалізації В102 широкосмовного сигналу і мовного сигналу смуги верхніх мугового мовного кодера В100. частот для отримання широкосмугового мовного Фіг. 3a - блок-схема реалізації А112 гребінки сигналу. Декодер смуги верхніх частот може зафільтрів А110. стосовувати нелінійну функцію до сигналу, який Фіг. 3b - блок-схема реалізації В122 гребінки оснований на вузькосмуговому сигналі збудження, фільтрів В120. для генерації спектрально розширеного сигналу і Фіг. 4а - смуга частот низького і високого діадля генерації сигналу збудження смуги верхніх пазонів для одного прикладу гребінки фільтрів частот на основі спектрально розширеного сигнаА110. лу. Фіг. 4b - смуга частот низького і високого діаЗгідно з ще одним варіантом здійснення, спопазонів для іншого прикладу гребінки фільтрів сіб обробки сигналу включає в себе етапи, на яких Α110. обробляють широкосмуговий мовний сигнал для Фіг. 4с - блок-схема реалізації А114 гребінки отримання вузькосмугового мовного сигналу і мофільтрів А112. вного сигналу смуги верхніх частот, і кодують вуФіг. 4d - блок-схема реалізації В124 гребінки зькосмуговий мовний сигнал для отримання щофільтрів В122. найменше кодованого вузькосмугового сигналу Фіг. 5а - приклад графіка залежності логарифзбудження і сукупності вузькосмугових параметрів мічної амплітуди від частоти для мовного сигналу. фільтра. Спосіб також включає в себе етапи, на Фіг. 5b - блок-схема базової системи кодуваняких генерують сигнал збудження смуги верхніх ня з лінійним прогнозуванням. частот на основі вузькосмугового сигналу збуФіг. 6 - блок-схема реалізації А122 вузькосмудження, причому вузькосмуговий сигнал збудженгового кодера А120. ня оснований на кодованому вузькосмуговому сигФіг. 7 - блок-схема реалізації В112 вузькосмуналі збудження. Спосіб включає в себе етапи, на гового декодера В110. яких кодують мовний сигнал смуги верхніх частот, Фіг. 8а - приклад графіка залежності логарифзгідно з сигналом збудження смуги верхніх частот мічної амплітуди від частоти для залишкового сигдля отримання щонайменше сукупності параметналу для вокалізованої мови. рів фільтра смуги верхніх частот. Згідно з цим споФіг. 8b - приклад графіка залежності логарифсобом, на етапі генерації сигналу збудження смуги мічної амплітуди від часу для залишкового сигналу верхніх частот застосовують нелінійну функцію до для вокалізованої мови. сигналу, який оснований на вузькосмуговому сигФіг. 9 - блок-схема базової системи кодування налі збудження, для генерації спектрально розшиз лінійним прогнозуванням, яка також здійснює реного сигналу, і сигнал збудження смуги верхніх довгострокове прогнозування. частот оснований на спектрально розширеному Фіг. 10 - блок-схема реалізації А202 кодера сигналі. А200 смуги верхніх частот. Згідно з ще одним варіантом здійснення, приФіг. 11 - блок-схема реалізації А302 генератострій включає в себе гребінку фільтрів, призначену ра збудження А300 смуги верхніх частот. для фільтрації широкосмугового мовного сигналу Фіг. 12 - блок-схема реалізації А402 розширюдля отримання вузькосмугового мовного сигналу і вача спектра А400. мовного сигналу смуги верхніх частот, і вузькосмуФіг. 12а - графіки спектрів сигналу в різних тоговий кодер, призначений для кодування вузькосчках в одному прикладі операції розширення спекмугового мовного сигналу для отримання щонайтра. менше кодованого вузькосмугового сигналу Фіг. 12b - графіки спектрів сигналу в різних тозбудження і сукупності вузькосмугових параметрів чках в іншому прикладі операції розширення спекфільтра. Пристрій включає в себе кодер смуги тра. верхніх частот, призначений для генерації сигналу Фіг. 13 - блок-схема реалізації A304 генератозбудження смуги верхніх частот на основі кодовара збудження A302 смуги верхніх частот. ного вузькосмугового сигналу збудження, і кодуФіг. 14 - блок-схема реалізації A306 генератовання мовного сигналу смуги верхніх частот, згідно ра збудження A302 смуги верхніх частот. з сигналом збудження смуги верхніх частот для Фіг. 15 - логічна блок-схема задачі Τ100 обчиотримання щонайменше сукупності параметрів слення обвідної. фільтра смуги верхніх частот. Кодер смуги верхніх Фіг. 16 - блок-схема реалізації 492 об'єднувача частот може застосовувати нелінійну функцію до 490. сигналу, який оснований на кодованому вузькосФіг. 17 - ілюструє підхід до обчислення міри муговому сигналі збудження, для генерації спектперіодичності сигналу S30 смуги верхніх частот. рально розширеного сигналу, і для генерації сигФіг. 18 - блок-схема реалізації A312 генератоналу збудження смуги верхніх частот на основі ра збудження A302 смуги верхніх частот. спектрально розширеного сигналу. Фіг. 19 - блок-схема реалізації A314 генератоКороткий опис креслень ра збудження А302 смуги верхніх частот. Фіг. 1а - блок-схема широкосмугового мовного Фіг. 20 - блок-схема реалізації A316 генератокодера А100 згідно з варіантом здійснення. ра збудження А302 смуги верхніх частот. 11 92341 12 Фіг. 21 - логічна блок-схема задачі Т200 обчиНа Фіг. 1а показана блок-схема широкосмугослення коефіцієнта підсилення. вого мовного кодера А100 згідно з варіантом здійФіг. 22 - логічна блок-схема реалізації Т210 снення. Гребінка фільтрів А110 забезпечує фільтзадачі Т200 обчислення коефіцієнта підсилення. рацію широкосмугового мовного сигналу S10 для Фіг. 23а - діаграма функції вікна. створення вузькосмугового сигналу S20 і сигналу Фіг. 23b - застосування функції вікна, показаної S30 смуги верхніх частот. Вузькосмуговий кодер на Фіг. 23а, до підкадрів мовного сигналу. А120 може кодувати вузькосмуговий сигнал S20 Фіг. 24 - блок-схема реалізації В202 декодера для створення вузькосмугових (NB) параметрів В200 смуги верхніх частот. фільтра S40 і вузькосмугового залишкового сигнаФіг. 25 - блок-схема реалізації AD10 широкослу S50. Згідно з приведеним тут більш докладним мугового мовного кодера А100. описом, вузькосмуговий кодер А120 звичайно Фіг. 26а - схема реалізації D122 лінії затримки створює вузькосмугові параметри фільтра S40 і D120. кодований вузькосмуговий сигнал збудження S50 у Фіг. 26b - схема реалізації D124 лінії затримки вигляді індексів кодової книги або в іншій квантоD120. ваній формі. Кодер А200 смуги верхніх частот коФіг. 27 - схема реалізації D130 лінії затримки дує сигнал S30 смуги верхніх частот згідно з інфоD120. рмацією в кодованому вузькосмуговому сигналі Фіг. 28 - блок-схема реалізації AD12 широкосзбудження S50 для створення параметрів кодумугового мовного кодера AD10. вання S60 смуги верхніх частот. Згідно з приведеФіг. 29 - логічна блок-схема способу обробки ним тут більш докладним описом, кодер А200 смусигналу MD100 згідно з варіантом здійснення. ги верхніх частот звичайно створює параметри Фіг. 30 - логічна блок-схема способу Μ100 згікодування S60 смуги верхніх частот у вигляді індедно з варіантом здійснення. ксів кодової книги або в іншій квантованій формі. У Фіг. 31а - логічна блок-схема способу М200 одному конкретному прикладі, широкосмуговий згідно з варіантом здійснення. мовний кодер А100 може кодувати широкосмугоФіг. 31b - логічна блок-схема для реалізації вий мовний сигнал S10 з швидкістю близько 8,55 М210 способу М200. кбіт/с (кілобіт на секунду), при цьому близько 7,55 Фіг. 32 - логічна блок-схема способу М300 згікбіт/с використовується для вузькосмугових парадно з варіантом здійснення. метрів фільтра S40 і кодованого вузькосмугового На кресленнях і в прикладеному описі, однасигналу збудження S50, і близько 1 кбіт/с викорискові посилальні позиції означають однакові або товується для параметрів кодування S60 смуги аналогічні елементи або сигнали. верхніх частот. Докладний опис Може виявитися бажаним об'єднувати кодоваОписані тут варіанти здійснення включають в ні вузькосмуговий сигнал і сигнали смуги верхніх себе системи, способи і пристрій, які можуть зачастот в єдиний бітовий потік. Наприклад, може безпечувати розширення вузькосмугового мовного виявитися бажаним мультиплексувати кодовані кодера для підтримки передачі і/або збереження сигнали один з одним для передачі (наприклад, по широкосмугових мовних сигналів при збільшенні провідному, оптичному або безпровідному каналу пропускної здатності лише приблизно від 800 до зв'язку), або для збереження, у вигляді кодованого 1000 біт/с (біт на секунду). Потенційні переваги широкосмугового мовного сигналу. На Фіг. 1b потаких реалізацій включають в себе вбудоване коказана блок-схема реалізації А102 широкосмугодування для підтримки сумісності з вузькосмугового мовного кодера А100, який включає в себе а вими системами, відносний легкий розподіл і пемультиплексор А130, що забезпечує об'єднання рерозподіл бітів між каналами вузькосмугового вузькосмугових параметрів фільтра S40, кодовакодування і кодування смуги верхніх частот, виного вузькосмугового сигналу збудження S50, і ключення операції широкосмугового синтезу, що параметрів фільтра S60 смуги верхніх частот в вимагає великого об'єму обчислень, і підтримку мультиплексований сигнал S70. низької частоти дискретизації для сигналів, які Пристрій, який включає в себе кодер А102, таобробляються за допомогою процедур кодування кож може включати в себе схему, що забезпечує форми хвилі, вимагаючих великого об'єму обчиспередачу мультиплексованого сигналу S70 в калень. нал зв'язку, наприклад, провідний, оптичний або Якщо в явному вигляді не указано в контексті, без провідний канал. Такий пристрій також може термін "обчислення" використовується тут для здійснювати одну або декілька канальних операцій указання будь-якого з його звичайних значень, кодування над сигналом, наприклад кодування з наприклад розрахунок, генерацію і вибір з списку корекцією помилок (наприклад, згорткове кодуванзначень. Термін "який містить", що використовуня, сумісне по швидкості) і/або кодування з виявється в даному описі і формулі винаходу, не виленням помилок (наприклад, кодування з циклічключає інших елементів або операцій. Вираз "А ною надмірністю) і/або кодування на одному або основане на В" використовується для вказівки декількох рівнях мережевого протоколу (наприбудь-якого з його звичайних значень, в тому числі, клад, Ethernet, TCP/IP, cdma2000). випадків (і) "А дорівнює В" і (іі) "А основане на щоМоже виявитися бажаним, щоб мультиплексор найменше В". Термін "інтернет-протокол" включає А130 вбудовував кодований вузькосмуговий сигв себе версію 4, описану в IETF (Internet нал (що включає в себе вузькосмугові параметри Engineering Task Force) RFC (Request for фільтра S40 і кодований вузькосмуговий сигнал Comments) 791, і подальші версії, наприклад, верзбудження S50) у вигляді бітового потоку, що розсію 6. діляється, мультиплексованого сигналу S70, що 13 92341 14 дозволило б відновлювати і декодувати кодований вищою, ніж в сигналі S30 смуги верхніх частот (навузькосмуговий сигнал незалежно від іншої частиприклад, в діапазоні 14-20, 16-20 або 16-32 кГц). У ни мультиплексованого сигналу S70, наприклад такому випадку, можна реалізувати широкосмугосигналу смуги верхніх частот і/або сигналу смуги вий мовний кодер А100, для окремого кодування нижніх частот. Наприклад, мультиплексований цього/їх сигналу або сигналів, і мультиплексор сигнал S70 може бути сформований так, що кодоА130 може включати додатковий/і кодований/і сигваний вузькосмуговий сигнал можна відновлюванал або сигнали в мультиплексований сигнал S70 ти, відкидаючи параметри фільтра S60 смуги вер(наприклад, як окрема частина). хніх частот. Потенційна перевага такої особливості На Фіг. 3a показана блок-схема реалізації в тому, що це дозволяє уникати необхідності транА112 гребінки фільтрів А110 для створення сигнаскодування кодованого широкосмугового сигналу лів двох піддіапазонів, що мають знижені частоти до передачі його в систему, яка підтримує декодудискретизації. Гребінка фільтрів А110 приймає вання вузькосмугового сигналу, але не підтримує широкосмуговий мовний сигнал S10, що має висодекодування частини смуги верхніх частот. кочастотну частину (або смугу верхніх частот) і На Фіг. 2а показана блок-схема широкосмугонизькочастотну частину (або смугу нижніх частот). вого мовного декодера В100 згідно з варіантом Гребінка фільтрів А112 включає в себе тракт обздійснення. Вузькосмуговий декодер B110 здатний робки смуги нижніх частот для прийому широкосдекодувати вузькосмугові параметри фільтра S40 і мугового мовного сигналу S10 і створення вузькокодований вузькосмуговий сигнал збудження S50 смугового мовного сигналу S20, і тракт обробки для створення вузькосмугового сигналу S90. Десмуги верхніх частот для прийому широкосмуговокодер В200 смуги верхніх частот декодує парамего мовного сигналу S10 і створення мовного сигтри кодування S60 смуги верхніх частот згідно з налу S30 смуги верхніх частот. Низькочастотний вузькосмуговим сигналом збудження S80, на осфільтр 110 фільтрує широкосмуговий мовний сигнові кодованого вузькосмугового сигналу збудженнал S10, пропускаючи вибраний низькочастотний ня S50, для створення сигналу S100 смуги верхніх піддіапазон, і високочастотний фільтр 130 фільтчастот. У цьому прикладі, вузькосмуговий декодер рує широкосмуговий мовний сигнал S10, пропусB110 видає вузькосмуговий сигнал збудження S80 каючи вибраний високочастотний піддіапазон. на декодер В200 смуги верхніх частот. Гребінка Оскільки сигнали обох піддіапазонів мають більш фільтрів В120 об'єднує вузькосмуговий сигнал S90 вузькі смуги, ніж широкосмуговий мовний сигнал і сигнал S100 смуги верхніх частот для створення S10, їх частоти дискретизації можна знизити до широкосмугового мовного сигналу S110. деякої міри без втрати інформації. Блок 120 зниНа Фіг. 2b показана блок-схема реалізації ження частоти дискретизації знижує частоту дисВ102 широкосмугового мовного декодера В100, кретизації низькочастотного сигналу згідно з потріякий включає в себе демультиплексор В130 для бним коефіцієнтом децимації (наприклад, шляхом створення кодованих сигналів S40, S50 і S60 з видалення вибірок сигналу і/або заміни вибірок мультиплексованого сигналу S70. Пристрій, який середніми значеннями), і блок 140 зниження часвключає в себе декодер В102 містить схему для тоти дискретизації аналогічно знижує частоту дисприйому мультиплексованого сигналу S70 з канакретизації високочастотного сигналу згідно з іншим лу зв'язку, наприклад, провідного, оптичного або потрібним коефіцієнтом децимації. безпровідного каналу. Такий пристрій також може На Фіг. 3b показана блок-схема відповідної рездійснювати одну або декілька канальних операцій алізації В122 гребінки фільтрів В120. Блок 150 декодування сигналу, наприклад, декодування з підвищення частоти дискретизації підвищує частокорекцією помилок (наприклад, згорткове декодуту дискретизації вузькосмугового сигналу S90 (навання, сумісне по швидкості) і/або декодування з приклад, шляхом вставки нулів і/або шляхом дубвиявленням помилок (наприклад, декодування з лювання вибірок), і низькочастотний фільтр 160 циклічною надмірністю), і/або декодування на одфільтрує сигнал, перетворений з підвищенням ному або декількох рівнях мережевого протоколу частоти дискретизації, пропускаючи тільки частину (наприклад, Ethernet, TCP/IP, cdma2000). смуги нижніх частот (наприклад, для запобігання Гребінка фільтрів А110 фільтрує вхідний сигперешкоді дискретизації). Аналогічно, блок 170 нал згідно з схемою розщеплених діапазонів для підвищення частоти дискретизації підвищує частостворення низькочастотного піддіапазону і високоту дискретизації сигналу S100 смуги верхніх часчастотного піддіапазону. У залежності від критеріїв тот, і високочастотний фільтр 180 фільтрує сигнал, конструкції для конкретного додатку, вихідні піддіперетворений з підвищенням частоти дискретизаапазони можуть мати смуги рівної або нерівної ції, пропускаючи тільки частину смуги верхніх часширини і можуть бути такими, що перекриваються тот. Потім два смугових сигнали підсумовуються або не перекриваються. Можлива також конфігудля формування широкосмугового мовного сигнарація гребінки фільтрів А110, яка створює більше лу S110. У деяких реалізаціях декодера В100, гредвох піддіапазонів. Наприклад, така гребінка фільбінка фільтрів В120 створює зважену суму двох трів може створювати один або декілька сигналів смугових сигналів згідно з одним або декількома смуги верхніх частот, які включають в себе склаваговими коефіцієнтами, отриманими і/або обчисдові в частотному діапазоні з частотою нижчою, леними декодером В200 смуги верхніх частот. ніж в вузькосмуговому сигналі S20 (наприклад, в Можлива також конфігурація гребінки фільтрів діапазоні 50-300 Гц). Така гребінка фільтрів також В120, яка об'єднує більше двох смугових сигнали. може створювати один або декілька додаткових Кожний з фільтрів 110, 130, 160, 180 можна сигналів смуги верхніх частот, які включають в реалізувати у вигляді фільтра з кінцевою імпульссебе складові в частотному діапазоні з частотою ною характеристикою (FIR) або фільтра з нескін 15 92341 16 ченною імпульсною характеристикою (IIR). ЧастокГц. У прикладі, приведеному на Фіг. 4b, частина тні характеристики фільтрів 110 і 130 кодера моширокосмугового мовного сигналу S10 від 7 до 8 жуть мати перехідні області симетричної або асикГц не включена в кодований сигнал. Інші конкретметричної форми між смугою загородження і ні приклади високочастотного фільтра 130 мають смугою пропускання. Аналогічно, частотні хараксмуги пропускання 3,5-7,5 кГц і 3,5-8 кГц. теристики фільтрів 160 і 180 декодера можуть маУ деяких реалізаціях, забезпечення перекритти перехідні області симетричної або асиметричтя між піддіапазонами, як в прикладі, приведеному ної форми між смугою загородження і смугою на Фіг. 4b, дозволяє використовувати низькочастопропускання. Може виявитися бажаним, але не тний і/або високочастотний фільтр, що має плавсуворо обов'язково, щоб низькочастотний фільтр ний спад характеристики в області перекриття. 110 мав таку ж характеристику, як низькочастотТакі фільтри звичайно легше проектуються, виманий фільтр 160, і щоб високочастотний фільтр 130 гають меншої складності обчислень і/або вносять мав таку ж характеристику, як високочастотний меншу затримку в порівнянні з фільтрами з більш фільтр 180. У одному прикладі, дві пари фільтрів різкими або "крутими" характеристиками. Для фі110, 130 і 160, 180 утворюють гребінку квадратурльтрів, які мають різкі перехідні області, властиві них дзеркальних фільтрів (QMF), причому пара більш високі бічні смуги (що може приводити до фільтрів 110, 130 мають такі ж коефіцієнти, як паперешкоди дискретизації), ніж у фільтрів аналогічра фільтрів 160, 180. ного порядку, які мають плавний спад характерисУ типовому прикладі, низькочастотний фільтр тики. Фільтри, які мають різкі перехідні області, 110 мас смугу пропускання, яка включає в себе можуть також мати довгі імпульсні характеристики, обмежений діапазон PSTN 300-3400 Гц (наприякі можуть приводити до лунких спотворень. Для клад, смугу від 0 до 4 кГц). На Фіг. 4а і 4b показані реалізацій гребінки фільтрів, що має один або девідносна ширина смуги широкосмугового мовного кілька HR-фільтрів, яка допускає плавний спад сигналу S10, вузькосмугового сигналу S20 і сигнахарактеристики в області перекриття, можна виколу S30 смуги верхніх частот в двох різних прикларистовувати фільтр або фільтри, в яких полюси дах реалізації. У цих двох конкретних прикладах, віддалені від одиничної окружності, що може відігширокосмуговий мовний сигнал S10 має частоту равати важливу роль для забезпечення стійкої дискретизації 16 кГц (що представляє частотні реалізації з фіксованою точкою. складові в діапазоні від 0 до 8 кГц), і вузькосмугоПерекриття піддіапазонів допускає плавне вий сигнал S20 має частоту дискретизації 8 кГц змішування нижнього діапазону і верхнього діапа(що представляє частотні складові в діапазоні від зону, що може приводити до зменшення кількості 0 до 4 кГц). чутних спотворень, зниження перешкоди дискреУ прикладі, приведеному на Фіг. 4а, немає тизації, і/або менш помітного переходу від одного значного перекриття між двома піддіапазонами. діапазону до іншого. Крім того, ефективність кодуСигнал S30 смуги верхніх частот, як показано в вання вузькосмугового кодера А120 (наприклад, цьому прикладі, можна отримати з використанням кодера форми сигналу) може знижуватися із збівисокочастотного фільтра 130 з смугою пропусльшенням частоти. Наприклад, якість кодування кання 4-8 кГц. У такому випадку, може виявитися вузькосмугового кодера може знижуватися на мабажаним знизити частоту дискретизації до 8 кГц за лих бітових швидкостях, особливо при наявності допомогою перетворення зі зниженням частоти фонового шуму. У таких випадках, забезпечення дискретизації фільтрованого сигналу з коефіцієнперекриття піддіапазонів може підвищити якість том два. Така операція, яка, приблизно, значно відтворюваних частотних складових в області пезнижує обчислювальну складність подальших рекриття. операцій обробки сигналу, зміщує енергію смуги Крім того, перекриття піддіапазонів допускає пропускання в діапазон від 0 до 4 кГц без втрати плавне змішування нижнього діапазону і верхнього інформації. діапазону, що може приводити до менших чутних У альтернативному прикладі, показаному на спотворень, зниження перешкоди дискретизації Фіг. 4b, верхній і нижній піддіапазони мають поміті/або менш помітного переходу від одного діапазоне перекриття, в результаті чого область від 3,5 до ну до іншого. Така міра може бути особливо бажа4 кГц описується сигналами обох піддіапазонів. ною для реалізації, в якій вузькосмуговий кодер Сигнал S30 смуги верхніх частот, представлений в А120 і кодер А200 смуги верхніх частот діють згідцьому прикладі, можна отримати з використанням но з різними методами кодування. Наприклад, різвисокочастотного фільтра 130 з смугою пропусні методи кодування можуть створювати сигнали, кання 3,5-7 кГц. У такому випадку, може виявитися які звучать абсолютно по-різному. Кодер, який бажаним знизити частоту дискретизації до 7 кГц кодує спектральну обвідну у вигляді індексів кодошляхом перетворення зі зниженням частоти дисвої книги, може формувати сигнал, що має інше кретизації фільтрованого сигналу з коефіцієнтом звучання, ніж кодер, який кодує амплітудний 16/7. Така операція, яка, приблизно, значно знижує спектр. Часовий кодер (наприклад, кодер на основі обчислювальну складність подальших операцій імпульсно-кодової модуляції (ІКМ)) може формуобробки сигналу, зміщує енергію смуги пропусканвати сигнал, що має інше звучання, ніж частотний ня в діапазон від 0 до 3,5 кГц без втрати інформакодер. Кодер, який кодує сигнал за допомогою ції. представлення спектральної обвідної і відповідноУ звичайній телефонній трубці для телефонго залишкового сигналу, може формувати сигнал, ного зв'язку, один або декілька перетворювачів який має інше звучання, ніж кодер, який кодує сиг(тобто мікрофон і телефон або гучномовець) манал за допомогою тільки представлення спектрають недостатній відгук в частотному діапазоні 7-8 льної обвідної. Кодер, який кодує сигнал у вигляді 17 92341 18 представлення його форми хвилі, може створювачастот і смуги верхніх частот гребінок фільтрів ти вихідний сигнал, що має інше звучання, ніж від А110 і В120 можуть мати спектри, які ніяк не пов'ясинусоїдального кодера. В таких випадках, викозані один з одним за винятком перекриття двох ристанням фільтрів, що мають різкі перехідні обпіддіапазонів. Перекриття двох піддіапазонів виласті для завдання піддіапазонів, які не перекризначається як відстань від точки, в якій частотна ваються, може приводити до різкого і такого, що характеристика фільтра смуги верхніх частот спалегко сприймається переходу між піддіапазонами дає до -20 дБ, до точки, в якій частотна характерив синтезованому широкосмуговому сигналі. стика фільтра смуги нижніх частот спадає до -20 Хоч гребінки фільтрів QMF, що мають взаємодБ. У різних прикладах гребінки фільтрів А110 доповнюючі частотні характеристики, які перекриі/або В120, це перекриття займає діапазон від ваються, часто використовуються в методах оброблизько 200 Гц до близько 1 кГц. Діапазон від блибки піддіапазонів, такі фільтри непридатні для зько 400 до близько 600 Гц може представляти щонайменше деяких з описаних тут реалізацій бажаний компроміс між ефективністю кодування і широкосмугового кодування. Гребінка фільтрів згладжуванням, що сприймається. У одному конкQMF в кодері здатна створювати значну перешкоретному прикладі, згаданому вище, перекриття ду дискретизації, яка придушується відповідною складає близько 500 Гц. гребінкою фільтрів QMF в декодері. Така конфігуМоже виявитися бажаним реалізувати гребінку рація може не підходити для додатку, в якому сигфільтрів А112 і/або В122 для здійснення операцій, нал зазнає значного спотворення між гребінками показаних на Фіг. 4а і 4b, у вигляді декількох касфільтрів, оскільки спотворення може знижувати кадів. Наприклад, на Фіг. 4с показана блок-схема ефективність придушення перешкоди дискретизареалізації А114 гребінки фільтрів А112, яка здійсції. Наприклад, описані тут додатки включають в нює функціональний еквівалент операцій високосебе реалізації кодування, призначені для роботи частотної фільтрації і перетворення зі зниженням на дуже низьких бітових швидкостях. Внаслідок частоти дискретизації з використанням ряду опедуже низької бітової швидкості, велика імовірність рацій інтерполяції, повторної дискретизації, децитого, що декодований сигнал виявиться значно мації і інших операцій. Така реалізація спрощує спотвореним в порівнянні з вихідним сигналом, конструювання і/або забезпечує повторне викоритому використання гребінок фільтрів QMF може стання функціональних блоків логіки і/або коду. приводити до непригніченої перешкоди дискретиНаприклад, один і той же функціональний блок зації. Додатки, в яких використовуються гребінки можна використовувати для здійснення операцій фільтрів QMF, звичайно мають більш високі бітові децимації до 14 кГц і децимації до 7 кГц, як покашвидкості (наприклад, понад 12 кбіт/с для AMR і зано на Фіг. 4с. Операцію обертання спектра мож64 кбіт/с для G.722). на реалізувати за допомогою множення сигналу на Додатково, кодер може створювати синтезофункцію еjn або послідовність (-1)n, яка навпереваний сигнал, який, по сприйняттю, подібний до мінно набуває значення +1 і -1. Операцію формувихідного сигналу, але, насправді, значно відрізнявання спектра можна реалізувати за допомогою ється від вихідного сигналу. Наприклад, описаний низькочастотного фільтра, призначеного для фортут кодер, який виводить збудження смуги верхніх мування сигналу для отримання потрібної загальчастот з вузькосмугового залишкового сигналу, ної характеристики фільтра. може створювати такий сигнал, оскільки фактичВідмітимо, що внаслідок операції обертання ний залишковий сигнал смуги верхніх частот може спектра, спектр сигналу S30 смуги верхніх частот повністю бути відсутнім в декодованому сигналі. перекидається. Подальші операції в кодері і відпоВикористання гребінок фільтрів QMF в таких додавідному декодері можуть бути конфігуровані відтках може приводити до значної міри спотворення, повідно. Наприклад, описаний тут генератор збузумовленого скомпенсованою перешкодою дисдження A300 смуги верхніх частот може кретизації. створювати сигнал збудження S120 смуги верхніх Величину спотворення, зумовленого перешкочастот, який також має спектрально обернену фодою дискретизації QMF, можна знизити, якщо підрму. діапазон, схильний до впливу, вузький, оскільки На Фіг. 4d показана блок-схема реалізації ефект перешкоди дискретизації обмежується шиВ124 гребінки фільтрів В122, яка здійснює функціриною смуги, яка дорівнює ширині піддіапазону. ональний еквівалент операцій підвищення частоти Однак, в описаних тут прикладах, де кожний піддідискретизації і високочастотної фільтрації з викоапазон включає в себе близько половини смуги ристанням ряду операцій інтерполяції, повторної широкосмугового діапазону, спотворення, зумовдискретизації і інших операцій. Гребінка фільтрів лене скомпенсованою перешкодою дискретизації, В124 включає в себе операцію обертання спектра може впливати на значну частину сигналу. На у верхньому діапазоні, яка обертає аналогічну якість сигналу також може впливати положення операцію, здійснювану, наприклад, в гребінці фісмуги частот, в якій має місце скомпенсована пельтрів кодера, наприклад в гребінці фільтрів А114. решкода дискретизації. Наприклад, спотворення, У цьому конкретному прикладі, гребінка фільтрів яке створюється поблизу центра широкосмугового В124 також включає в себе вузькосмугові режекмовного сигналу (наприклад, між 3 і 4 кГц) може торні фільтри в нижньому і верхньому діапазонах, бути набагато менш бажаним, ніж спотворення, які ослабляють складову сигналу на 7100 Гц, хоч яке виникає поблизу краю сигналу (наприклад, такі фільтри є необов'язковими і не завжди вхопонад 6 кГц). дять до складу пристрою. Патентна заявка Хоч відгуки фільтрів гребінки фільтрів QMF су"SYSTEMS, METHODS, AND APPARATUS FOR воро пов'язані один з одним, частини смуги нижніх SPEECH SIGNAL FILTERING" подана спільно з 19 92341 20 даною заявкою, номер справи повіреного 050551, обробляє вхідний сигнал як ряд кадрів, що переквключає в себе додатковий опис і креслення, що риваються. належить до характеристик елементів конкретних Модуль аналізу може аналізувати вибірки кореалізацій гребінок фільтрів А110 і В120, і цей мажного кадру напряму, або вибірки можуть спочатку теріал включений, таким чином, за допомогою зважуватися згідно з функцією вікна (наприклад, посилання. вікна Хеммінга). Аналіз також може здійснюватися Вузькосмуговий кодер А120 реалізований згідпо вікну, що перевищує розмір кадру, наприклад но з моделлю джерело-фільтр, яка передбачає 30-мілісекундному вікну. Це вікно може бути симекодування вхідного мовного сигналу у вигляді (А) тричним (наприклад, 5-20-5, включаючи в себе 5 набору параметрів, які описують фільтр, і (В) сигмілісекунд безпосередньо до і після 20налу збудження, який збуджує описаний фільтр мілісекундного кадру) або асиметричним (напридля формування синтезованого відтворення вхідклад 10-20, включаючи в себе останні 10 мілісеного мовного сигналу. На Фіг. 5а показаний приккунд попереднього кадру). Модуль аналізу LPC лад спектральної обвідної мовного сигналу. Піки, звичайно обчислює коефіцієнти НЧ-фільтра з виякі характеризують цю спектральну обвідну предкористанням рекурсивного методу Левінсонаставляють резонанси мовного тракту і називаютьДурбіна або алгоритму Леру-Гегюна. У іншій реася формантами. Більшість мовних кодерів кодують лізації модуль аналізу може обчислювати набір щонайменше цю грубу спектральну структуру у коефіцієнтів косинусного перетворення Фур'є для вигляді набору параметрів, наприклад коефіцієнтів кожного кадру замість набору коефіцієнтів НЧфільтра. фільтра. На Фіг. 5b показаний приклад базової конфігуВихідну швидкість кодера А120 можна значно рації джерело-фільтр, що застосовується для кознижувати, з відносно невеликим впливом на дування спектральної обвідної вузькосмугового якість відтворення, завдяки квантуванню параметсигналу S20. Модуль аналізу обчислює набір парів фільтра. Коефіцієнти фільтра лінійного прогнораметрів, які характеризують фільтр, відповідний зування важко ефективно квантувати, і їх звичайно звуку голосу протягом періоду часу (звичайно 20 відображають в інше представлення, наприклад мс). Відбілюючий фільтр (який також називається пари спектральних ліній (LSP) або частот спектрааналізуючим фільтром або фільтром помилок прольних ліній (LSF), для квантування і/або ентропійгнозування), настроєний згідно з цими параметраного кодування. У прикладі, приведеному на Фіг. 6, ми фільтра, видаляє спектральну обвідну для виперетворення 220 коефіцієнтів LP-фільтра в LSF рівнювання спектральної характеристики сигналу. перетворює набір коефіцієнтів НЧ-фільтра у відОтриманий відбілений сигнал (що також називаповідний набір LSF. Інші взаємно-однозначні ється залишком) має меншу енергію і, таким чипредставлення коефіцієнтів НЧ-фільтра включаном, меншу дисперсію, і легше піддасться кодують в себе коефіцієнти PARCOR; значення логаванню, ніж вихідний мовний сигнал. Помилки, які рифмічного відношення площ; пари спектральних виникають при кодуванні залишкового сигналу, імітансів (ISP); і частоти спектральних імітансів також можуть більш рівномірно розподілятися по (ISF), які використовуються в кодеку AMR-WB спектру. Параметри фільтра і залишковий сигнал (Adaptive Multirate-Wideband) GSM (Глобальної звичайно квантуються для ефективної передачі по системи мобільного зв'язку). Звичайно перетвоканалу. У декодері, що синтезує фільтр, настроєрення між набором коефіцієнтів НЧ-фільтра і відний згідно з параметрами фільтра, збуджується повідним набором LSFs оборотне, але варіанти сигналом, основаним на залишковому сигналі, для здійснення також включають в себе реалізації костворення синтезованої версії вихідного звуку модера А120, в яких перетворення неможливо оберви. Синтезуючий фільтр звичайно має передаванути без помилки. льну функцію, зворотну передавальній функції Квантувач 230 квантує набір вузькосмугових відбілюючого фільтра. LSF (або інших представлень коефіцієнтів), і вузьНа Фіг. 6 показана блок-схема базової реалікосмуговий кодер А122 виводить результат цього зації А122 вузькосмугового кодера А120. У цьому квантування у вигляді вузькосмугових параметрів прикладі, модуль аналізу 210 кодування з лінійним фільтра S40. Такий квантувач звичайно включає в прогнозуванням (LPC) кодує спектральну обвідну себе векторний квантувач, який кодує вхідний веквузькосмугового сигналу S20 у вигляді набору котор як індекс для відповідного векторного запису в ефіцієнтів лінійного прогнозування (LP) (напритаблиці або кодовій книзі. клад, коефіцієнтів полюсного фільтра 1/A(z)). МоЗгідно з Фіг. 6, вузькосмуговий кодер А122 тадуль аналізу звичайно обробляє вхідний сигнал як кож генерує залишковий сигнал, пропускаючи вуряд кадрів, які не перекриваються, при цьому для зькосмуговий сигнал S20 через відбілюючий кожного кадру обчислюється новий набір коефіціфільтр 260 (що також називається аналізуючим єнтів. Період кадру це, в загальному випадку, пефільтром або фільтром помилок прогнозування), ріод, протягом якого, сигнал, приблизно, є локальнастроєний згідно з набором коефіцієнтів фільтра. но стаціонарним; типовий період становить 20 У цьому конкретному прикладі, відбілюючий мілісекунд (що еквівалентно 160 вибіркам при часфільтр 260 реалізований як FIR-фільтр, хоч можна тоті дискретизації 8 кГц). У одному прикладі, мотакож використовувати реалізації IIR. Цей залишдуль аналізу 210 LPC здатний обчислювати набір ковий сигнал звичайно містить важливу, з точки з десяти коефіцієнтів НЧ-фільтра для опису форзору сприйняття, інформацію мовного кадру, намантної структури кожного 20-мілісекундного кадприклад довготривалу структуру, пов'язану з оснору. Також можлива реалізація модуля аналізу, що вним тоном, яка не представлена в вузькосмугових параметрах фільтра S40. Квантувач 270 21 92341 22 обчислює квантоване представлення цього залисигнал S90. Іншими словами, вузькосмуговий синшкового сигналу для виводу як кодованого вузькотезуючий фільтр 330 формує спектр вузькосмугосмугового сигналу збудження S50. Такий квантувого сигналу збудження S80 згідно з деквантовавач звичайно включає в себе векторний квантувач, ними коефіцієнтами фільтра для створення який кодує вхідний вектор як індекс для відповідвузькосмугового сигналу S90. Вузькосмуговий деного векторного запису в таблиці або кодовій книзі. кодер В112 також видає вузькосмуговий сигнал Альтернативно, такий квантувач може передавати збудження S80 на кодер А200 смуги верхніх часодин або декілька параметрів, з яких в декодері тот, який використовує його для описаного тут може динамічно генеруватися вектор замість витявиведення збудження S120 смуги верхніх частот. гання його з сховища, як в методі розрідженої коУ деяких реалізаціях, описаних нижче, вузькосмудової книги. Такий спосіб використовується в таких говий декодер B110 може видавати на декодер схемах кодування, як алгебраїчне CELP (лінійне В200 смуги верхніх частот додаткову інформацію, прогнозування з кодовим збудженням), і таких копов'язану з вузькосмуговим сигналом, наприклад деках,як 3GPP2 (Third Generation Partnership 2) нахил спектра, коефіцієнт підсилення і інтервал EVRC (Enhanced Variable Rate Codec). основного тону, і мовний режим. Бажано, щоб вузькосмуговий кодер А120 генеСистема вузькосмугового кодера А122 і вузьрував кодований вузькосмуговий сигнал збудженкосмугового декодера В112 є основним прикладом ня згідно з тими ж значеннями параметрів фільтра, мовного кодека на основі аналізу через синтез. які будуть доступні відповідному вузькосмуговому Кодування на основі лінійного прогнозування з декодеру. Таким чином, результуючий кодований кодовим збудженням (CELP) є одним популярним вузькосмуговий сигнал збудження вже може в десімейством методів кодування на основі аналізу якій мірі враховувати неідеальність в цих значенчерез синтез, і реалізації таких кодерів можуть нях параметрів, наприклад помилки квантування. здійснювати кодування на основі форми залишкоВідповідно, бажано настроїти відбілюючий фільтр вого сигналу, в тому числі операції вибору записів з використанням тих же значень коефіцієнтів, які з фіксованої і адаптивної кодових книг, операції будуть доступні в декодері. У базовому прикладі мінімізації помилок і/або операціях перцептивного кодера А122, показаному на Фіг. 6, зворотний квазважування. Інші реалізації кодування на основі нтувач 240 деквантує вузькосмугові параметри аналізу через синтез включають в себе кодування кодування S40, перетворювач 250 LSF в коефіцієна основі лінійного прогнозування зі змішаним нти LP-фільтра 250 відображає результуючі зназбудженням (MELP), алгебраїчного CELP (ACELP), чення назад на відповідний набір коефіцієнтів НЧрелаксаційного CELP (RCELP), регулярного імпуфільтра, і цей набір коефіцієнтів використовується льсного збудження (RPE), багатоімпульсного для настройки відбілююючого фільтра 260 для CELP (МРЕ) і лінійного прогнозування із збудженгенерації залишкового сигналу, який квантується ням векторною сумою (VSELP). Споріднені спосоквантувачем 270. би кодування включають в себе кодування на осДеякі реалізації вузькосмугового кодера А120 нові багатосмугового збудження (МВЕ) і можуть обчислювати кодований вузькосмуговий інтерполяції форми сигналу-прототипу (PWI). Присигнал збудження S50 шляхом ідентифікації одноклади стандартних мовних кодеків на основі аналіго з набору векторів кодової книги, який краще за зу через синтез включають в себе повношвидкісвсіх співпадає із залишковим сигналом. Однак цей ний кодек ETSI (European Telecommunications вузькосмуговий кодер А120 також можна реалізуStandards Institute)-GSM (GSM 06.10), який викоривати для обчислення квантованого представлення стовує лінійне прогнозування із збудженням зализалишкового сигналу без фактичної генерації зашковим сигналом (RELP); вдосконалений повношлишкового сигналу. Наприклад, вузькосмуговий видкісний кодек GSM (ETSI-GSM 06.60); кодер А120 може використовувати деяку кількість стандартний кодер з швидкістю 11,8 кбіт/с згідно з векторів кодової книги для генерації відповідних ITU (International Telecommunication Union) G.729 синтезованих сигналів (наприклад, згідно з поточДодаток Ε; кодеки IS (Interim Standard)-641 для ISним набором параметрів фільтра), і вибирати век136 (схема множинного доступу з кодовим роздітор кодової книги, пов'язаний з генерованим сигленням); адаптивні багатошвидкісні кодеки GSM налом, який краще за всіх співпадає з початковим (GSM-AMR); і кодек 4GV (Fourth-Generation вузькосмуговим сигналом S20 в перцептивноVocoder ) (QUALCOMM Incorporated, Дієго, Калізваженій області. форнія). Вузькосмуговий кодер А120 і відповідний На Фіг. 7 показана блок-схема реалізації В112 декодер B110 можна реалізувати згідно з будьвузькосмугового декодера B110. Зворотний кванякою з цих технологій або будь-якою іншою технотувач 310 деквантує вузькосмугові параметри філогією мовного кодування (відомою або створеною льтра S40 (в цьому випадку, в набір LSF), і перетв майбутньому), яка представляє мовний сигнал у ворювач 320 LSF в коефіцієнти LP-фільтра вигляді (А) набору параметрів, які описують перетворює LSF в набір коефіцієнтів фільтра (нафільтр, і (В) сигналу збудження, що використовуприклад, як описано вище з посиланням на звороється для збудження описаного фільтра для відттний квантувач 240 і перетворювач 250 вузькосмуворення мовного сигналу. гового кодера А122). Зворотний квантувач 340 Навіть після того, як відбілюючий фільтр видеквантує вузькосмуговий залишковий сигнал S40 далить грубу спектральну обвідну з вузькосмугодля створення вузькосмугового сигналу збудження вого сигналу S20, може залишатися помітна частS80. На основі коефіцієнтів фільтра і вузькосмугока тонкої гармонічної структури, особливо для вого сигналу збудження S80, вузькосмуговий синвокалізованої мови. На Фіг. 8а показаний графік тезуючий фільтр 330 синтезує вузькосмуговий спектра одного прикладу залишкового сигналу, 23 92341 24 який може бути створений відбілюючим фільтром, вного тону. Моделювання довготривалої структури для вокалізованого сигналу наприклад, голосного можна блокувати для кадрів, які відповідають незвуку. Періодична структура, яка спостерігається в вокалізованій мові, яка звичайно шумоподібна і цьому прикладі, належить до основного тону, і інші неструктурована. вокалізовані звуки, вимовні тим же диктором, моРеалізація вузькосмугового декодера B110 згіжуть мати різні формантні структури, але аналогідно з структурою, показаною на Фіг. 9, може видачні структури основного тону. На Фіг. 8b показаний вати вузькосмуговий сигнал збудження S80 на графік залежності амплітуди від часу в одному декодер В200 смуги верхніх частот після відновприкладі такого залишкового сигналу, де показана лення довготривалої структури (основного тону послідовність імпульсів основного тону у часі. або гармонічної структури). Наприклад, такий деЕфективність кодування і/або якість мови мокодер може виводити вузькосмуговий сигнал збужна підвищити з використанням одного або декідження S80 як десантованої версії кодованого лькох значень параметра для кодування характевузькосмугового сигналу збудження S50. Звичайристик структури основного тону. Однією но, можна також реалізувати вузькосмуговий деважливою характеристикою структури основного кодер B110, щоб декодер В200 смуги верхніх частону є частота першої гармоніки (що також назитот здійснював деквантування кодованого вається основною частотою), яка звичайно знаховузькосмугового сигналу збудження S50 для отридиться в діапазоні від 60 до 400 Гц. Ця характеримання вузькосмугового сигналу збудження S80. стика звичайно кодується як величина, зворотна У реалізації широкосмугового мовного кодера основній частоті, яка також називається інтерваА100 згідно з схемою, показаною на Фіг. 9, кодер лом основного тону. Інтервал основного тону вкаА200 смуги верхніх частот може приймати вузькозує кількість вибірок в одному періоді основного смуговий сигнал збудження, що створюється коротону і може кодуватися як один або декілька індекткостроковим аналізом або відбілюючим фільтром. сів кодової книги. Для мовних сигналів дикторівІншими словами, вузькосмуговий кодер А120 може чоловіків характерні більш тривалі інтервали освидавати вузькосмуговий сигнал збудження на новного тону, ніж мовні сигнали дикторів-жінок. кодер А200 смуги верхніх частот до кодування Іншою характеристикою сигналу, пов'язаною зі довготривалої структури. Однак бажано, щоб коструктурою основного тону, є періодичність, яка дер А200 смуги верхніх частот приймав з вузькосвказує інтенсивність гармонічної структури або, мугового каналу ту ж інформацію кодування, яку іншими словами, ступінь гармонічності або негарбуде приймати декодер В200 смуги верхніх частот, монічності сигналу. Двома типовими ознаками петак що параметри кодування, сформовані кодером ріодичності є проходження через нуль і нормовані А200 смуги верхніх частот, вже можуть в деякій автокореляційні функції (NACF). Про періодичність мірі враховувати неідеальність в цій інформації. також може свідчити коефіцієнт підсилення основТаким чином, може бути переважним, щоб кодер ного тону, який звичайно кодується як коефіцієнт А200 смуги верхніх частот реконструював вузькопідсилення кодової книги (наприклад, квантований смуговий сигнал збудження S80 з того ж параметкоефіцієнт підсилення адаптивної кодової книги). ризованого і/або квантованого кодованого вузькоВузькосмуговий кодер А120 може включати в смугового сигналу збудження S50, який себе один або декілька модулів для кодування виводиться широкосмуговим мовним кодером довготривалої гармонічної структури вузькосмугоА100. Одна потенційна перевага такого підходу вого сигналу S20. Згідно з Фіг. 9, одна типова струскладається в більш точному обчисленні коефіцієктура CELP, яку можна використовувати, включає нтів підсилення S60b смуги верхніх частот, описав себе модуль аналізу LPC з розімкненим циклом, ному нижче. який кодує короткострокові характеристики або Крім параметрів, які характеризують короткогрубу спектральну обвідну, після якого йде каскад часну і/або довготривалу структуру вузькосмуговоаналізу довгострокового прогнозування із замкнего сигналу S20, вузькосмуговий кодер А120 може ним циклом, який кодує тонку структуру основного створювати значення параметрів, які належать до тону або гармонік. Короткострокові характеристики інших характеристик вузькосмугового сигналу S20. кодуються як коефіцієнти фільтра, а довгострокові Ці значення, які можуть бути прийнятним чином характеристики кодуються як значення параметквантовані для виводу широкосмуговим мовним рів, наприклад інтервал основного тону і коефіцікодером А100, можна включати в вузькосмугові єнт підсилення основного тону. Наприклад, вузьпараметри фільтра S40 або виводити окремо. Кокосмуговий кодер А120 може виводити кодований дер А200 смуги верхніх частот також може обчисвузькосмуговий сигнал збудження S50 в формі, лювати параметри кодування S60 смуги верхніх яка включає в себе один або декілька індексів кочастот згідно з одним або декількома з цих додатдової книги (наприклад, індекс фіксованої кодової кових параметрів (наприклад, після деквантуванкниги і індекс адаптивної кодової книги) і відповідні ня). У широкосмуговому мовному декодері В100, значення коефіцієнта підсилення. Обчислення декодер В200 смуги верхніх частот може приймати цього квантованого представлення вузькосмуговозначення параметра через вузькосмуговий декого залишкового сигналу (наприклад, квантувачем дер B110 (наприклад, після деквантування). Аль270) може включати в себе вибір таких індексів і тернативно, декодер В200 смуги верхніх частот обчислення таких значень. Кодування структури може приймати (і, можливо, деквантувати) знаосновного тону також може включати в себе інтерчення параметра напряму. поляцію форми сигналу-прототипу основного тону, У одному прикладі додаткових вузькосмугових причому ця операція може включати в себе обчипараметрів кодування, вузькосмуговий кодер А120 слення різниці між послідовними імпульсами осностворює значення нахилу спектра і параметрів 25 92341 26 мовного режиму для кожного кадру. Нахил спектра синтезований сигнал S130 смуги верхніх частот пов'язаний з формою спектральної обвідної по згідно з сигналом збудження S120 смуги верхніх смузі пропускання і звичайно представлений кванчастот і кодованої спектральної обвідної (напритованим першим коефіцієнтом відображення. Для клад, набору коефіцієнтів НЧ-фільтра), створеної більшості вокалізованих звуків, спектральна енермодулем аналізу А210. Синтезуючий фільтр А220 гія знижується із збільшенням частоти, так що пезвичайно реалізований у вигляді IIR-фільтра, хоч рший коефіцієнт відображення негативний і може можна використовувати також реалізації FIR. У досягати -1. Більшість невокалізованих звуків має конкретному прикладі, синтезуючий фільтр А220 спектр, який є або рівномірним, в результаті чого реалізований у вигляді лінійного авторегресивного перший коефіцієнт відображення близький до нуфільтра шостого порядку. ля, або має більше енергії на високих частотах, в Обчислювач А230 коефіцієнта підсилення смурезультаті чого перший коефіцієнт відображення ги верхніх частот обчислює одну або декілька різпозитивний і може досягати +1. ниць між рівнями початкового сигналу S30 смуги Мовний режим (що також називається реживерхніх частот і синтезованого сигналу S130 смуги мом вокалізації) вказує, чи представляє поточний верхніх частот для визначення обвідної підсиленкадр вокалізовану або невокалізовану мову. Цей ня для кадру. Квантувач 430, який може бути реапараметр може мати двійкове значення, основане лізований як векторний квантувач, який кодус вхіна одній або декількох мірах періодичності (напридний вектор як індекс для відповідного векторного клад, проходженнях нуля, NACF, коефіцієнті підзапису в таблиці або кодовій книзі, квантує знасилення основного тону) і/або мовній активності чення або значення, що визначає/ють обвідну піддля кадру, наприклад співвідношенні між такою силення, і кодер А202 смуги верхніх частот вивомірою і пороговим значенням. У інших реалізаціях, дить результат цього квантування як коефіцієнти параметр мовного режиму має один або декілька підсилення S60b смуги верхніх частот. інших станів для указання таких режимів, як мовУ реалізації, показаній на Фіг. 10, синтезуючий чання або фоновий шум, або перехід між мовчанфільтр А220 приймає коефіцієнти фільтра від моням і вокалізованою мовою. дуля аналізу А210. Альтернативна реалізація коКодер А200 смуги верхніх частот кодує сигнал дера А202 смуги верхніх частот включає в себе S30 смуги верхніх частот згідно з моделлю джерезворотний квантувач і зворотний перетворювач, ло-фільтр, причому збудження для цього фільтра здатні декодувати коефіцієнти фільтра з параметбазується на кодованому вузькосмуговому сигналі рів фільтра S60a смуги верхніх частот, і, в цьому збудження. На Фіг. 10 показана блок-схема реалівипадку, синтезуючий фільтр А220 повинен, зазації А202 кодера А200 смуги верхніх частот, який мість цього, приймати декодований коефіцієнти формує потік параметрів кодування S60 смуги фільтра. Така альтернативна конфігурація може верхніх частот, що включають в себе параметри підтримувати більш точне обчислення обвідної фільтра S60a смуги верхніх частот і коефіцієнти підсилення обчислювачем А230 коефіцієнта підпідсилення S60b смуги верхніх частот. Генератор силення смуги верхніх частот. збудження A300 смуги верхніх частот виводить У одному конкретному прикладі, модуль аналісигнал збудження S120 смуги верхніх частот з козу А210 і обчислювач А230 коефіцієнта підсилення дованого вузькосмугового сигналу збудження S50. смуги верхніх частот виводять набір з шести LSF і Модуль аналізу А210 формує набір значень паранабір п'яти значень коефіцієнта підсилення на метра, що характеризують спектральну обвідну кадр, відповідно, що дозволяє добитися широкоссигналу S30 смуги верхніх частот. У цьому конкремугового розширення вузькосмугового сигналу тному прикладі, модуль аналізу А210 здійснює S20 за допомогою тільки одинадцяти додаткових аналіз LPC для формування набору коефіцієнтів значень на кадр. Вухо менш чутливе до частотних НЧ-фільтра для кожного кадру сигналу S30 смуги спотворень на високих частотах, завдяки чому верхніх частот. Перетворювач 410 коефіцієнтів кодування смуги верхніх частот при низькому пофільтра лінійного прогнозування в LSF перетворядку LPC може створювати сигнал, що має якість, рює набір коефіцієнтів НЧ-фільтра у відповідний яка сприймається, сумісну з вузькосмуговим кодунабір LSF. Як відмічено вище з посиланням на ванням на більш високому порядку LPC. Типова модуль аналізу 210 і перетворювач 220, модуль реалізація кодера А200 смуги верхніх частот може аналізу А210 і/або перетворювач 410 можуть вививодити від 8 до 12 бітів на кадр для високоякіскористовувати інші набори коефіцієнтів (наприної реконструкції спектральної обвідної і ще від 8 клад, коефіцієнтів косинусного перетворення Фудо 12 бітів на кадр для високоякісної реконструкції р'є) і/або представлень коефіцієнтів (наприклад, часової обвідної. У іншому конкретному прикладі, ISP). модуль аналізу А210 виводить набір з восьми LSF Квантувач 420 квантує набір LSF смуги верхніх на кадр. частот (або іншого представлення коефіцієнтів, Деякі реалізації кодера А200 смуги верхніх чанаприклад ISP), і кодер А202 смуги верхніх частот стот здатні створювати сигнал збудження S120 виводить результат цього квантування у вигляді смуги верхніх частот, генеруючи випадковий шупараметрів фільтра S60a смуги верхніх частот. мовий сигнал, що має частотні складові смуги верТакий квантувач звичайно включає в себе векторхніх частот і модулюючи по амплітуді шумовий ний квантувач, який кодує вхідний вектор як індекс сигнал згідно з обвідною у часовому вимірюванні для відповідного векторного запису в таблиці або вузькосмугового сигналу S20, вузькосмугового кодовій книзі. сигналу збудження S80 або сигналу S30 смуги Кодер А202 смуги верхніх частот також вклюверхніх частот. Однак, хоч такий шумовий спосіб чає в себе синтезуючий фільтр А220, що формує може давати адекватні результати для невокалі 27 92341 28 зованих звуків, його застосування може виявитися тонів згідно з цією інформацією. Наприклад, гарнебажаним для вокалізованих звуків, залишкові монічна структура сигналу збудження може хараксигнали яких звичайно є гармонічними і, отже, материзуватися основною частотою спільно з інфорють деяку періодичну структуру. мацією амплітуди і фази. Інша реалізація Генератор збудження A300 смуги верхніх часгенератора збудження A300 смуги верхніх частот тот генерує сигнал збудження S120 смуги верхніх генерує гармонічно розширений сигнал S160 на частот, розширюючи спектр вузькосмугового сигоснові основної частоти і амплітуди (вказаної, наналу збудження S80 на частотний діапазон смуги приклад, інтервалом основного тону і коефіцієнтом верхніх частот. На Фіг. 11 показана блок-схема підсилення основного тону). Однак, якщо гармоніреалізації A302 генератора збудження A300 смуги чно розширений сигнал не когерентний по фазі з верхніх частот. Зворотний квантувач 450 декванвузькосмуговим сигналом збудження S80, якість тує кодований вузькосмуговий сигнал збудження результуючої декодованої мови може бути неS50 для створення вузькосмугового сигналу збуприйнятною. дження S80. Розширювач спектра А400 створює Нелінійну функцію можна використовувати для гармонічнорозширений сигнал S160 на основі створення сигналу збудження смуги верхніх часвузькосмугового сигналу збудження S80. Об'єднутот, який когерентний по фазі з вузькосмуговим вач 470 об'єднує випадковий шумовий сигнал, що збудженням і зберігає гармонічну структуру без генерується генератором 480 шуму, і обвідну у порушень безперервності. Нелінійна функція може часовому вимірюванні, що обчислюється обчистакож забезпечувати підвищений рівень шуму між лювачем 460 обвідної для створення модульовависокочастотними гармоніками, що забезпечує ного шумового сигналу S170. Об'єднувач 490 змібільш природне звучання, ніж тональні високочасшує гармонічно розширений сигнал S60 і тотні гармоніки, що створюються наприклад, спомодульований шумовий сигнал S170 для створенсобами спектрального накладення і спектрального ня сигналу збудження S120 смуги верхніх частот. перенесення. Типові нелінійні функції без запам'яУ одному прикладі, розширювач спектра А400 товування, які можуть застосовуватися в різних здійснює операцію спектрального накладення (що реалізаціях розширювача спектра А400, включатакож називається дзеркальним відображенням) ють в себе функцію абсолютного значення (яка на вузькосмуговому сигналі збудження S80 для також називається двонапівперіодним випрямленстворення гармонічно розширеного сигналу S160. ням), однонапівперіодне випрямлення, піднесення Спектральне накладення може здійснюватися до квадрату, піднесення до кубу і обмеження. Інші шляхом заповнення нулями сигналу збудження реалізації розширювача спектра А400 можуть заS80 з подальшим застосуванням високочастотного стосовувати нелінійну функцію із запам'ятовуванфільтра для збереження перешкоди дискретизації. ням. У іншому прикладі, розширювач спектра А400 На Фіг. 12 показана блок-схема реалізації створює гармонічно розширений сигнал S160 А402 розширювача спектра A400, який застосовує шляхом перенесення спектра вузькосмугового нелінійну функцію для розширення спектра вузьсигналу збудження S80 у верхній діапазон (наприкосмугового сигналу збудження S80. Блок 510 підклад, шляхом підвищення частоти дискретизації з вищення частоти дискретизації перетворює з підподальшим множенням на косинусоїдальний сигвищенням частоти дискретизації вузькосмуговий нал постійної частоти). сигнал збудження S80. Може виявитися бажаним Способи спектрального накладення і перенеперетворювати сигнал з достатнім підвищенням сення можуть створювати спектрально розширені частоти дискретизації для мінімізації перешкоди сигнали, гармонічна структура яких має порушендискретизації після застосування нелінійної функня безперервності з початковою гармонічною струції. У одному конкретному прикладі, блок підвиктурою вузькосмугового сигналу збудження S80 по щення частоти дискретизації 510 перетворює з фазі і/або частоті. Наприклад, такі способи можуть підвищенням частоти дискретизації сигнал з коестворювати сигнали, піки яких, в загальному випафіцієнтом вісім. Блок підвищення частоти дискредку, не відповідають кратним значенням основної тизації 510 може здійснювати операцію підвищенчастоти, що може викликати спотворення з метаня частоти дискретизації шляхом вставки нулів у левим призвуком в реконструйованому мовному вхідний сигнал і низькочастотної фільтрації ресигналі. Цим способам також властиво створювати зультату. Обчислювач 520 нелінійної функції зависокочастотні гармоніки, що мають неприродно стосовує нелінійну функцію до сигналу, перетвосильні тональні характеристики. Крім того, оскільки реного з підвищенням частоти дискретизації. Одна сигнал PSTN може дискретизуватися з частотою 8 потенційна перевага функції абсолютного значенкГц, але обмежений по смузі частотою 3400 Гц, ня над іншими нелінійними функціями для розшиверхній спектр вузькосмугового сигналу збудження рення спектра, наприклад квадратичною функціS80 може містити мало енергії або зовсім не місєю, полягає у відсутності необхідності в тити енергії, в результаті чого розширений сигнал, нормалізації енергії. У деяких реалізаціях, функцію що генерується згідно з операцією спектрального абсолютного значення можна ефективно застосонакладення або спектрального перенесення, може вувати, відкидаючи або очищаючи знаковий біт мати спектральний провал на частотах вище 3400 кожної вибірки. Обчислювач 520 нелінійної функції Гц. також може здійснювати амплітудну трансформаІнші способи генерації гармонічно розширеноцію перетвореного з підвищенням частоти дискрего сигналу S160 включають в себе ідентифікацію тизації або спектрально розширеного сигналу. однієї або більше основних частот вузькосмуговоБлок 530 зниження частоти дискретизації пего сигналу збудження S80 і генерацію гармонічних ретворює зі зниженням частоти дискретизації спе 29 92341 30 ктрально розширений результат застосування реного сигналу, що має частоту дискретизації сигнелінійної функції. Може виявитися бажаним, щоб налу S30 смуги верхніх частот (наприклад, 7 кГц). блок 530 зниження частоти дискретизації здійснюЯк відмічено вище, гребінки фільтрів А110 і вав операцію смугової фільтрації для вибору потВ120 можна реалізувати так, що один або обидва рібної смуги частот спектрально розширеного сигз вузькосмугового сигналу і сигналу смуги верхніх налу до зниження частоти дискретизації частот S20, S30, які мають спектрально обернену (наприклад, для зниження або усунення наклаформу на виході гребінки фільтрів А110, буде кодення спектрів або спотворень бажаним зобрадуватися і декодуватися в спектрально оберненій женням). Також може бути бажаним, щоб блок 530 формі, і знов зазнавати обертання спектра на грезниження частоти дискретизації знижував частоту бінці фільтрів В120 до висновку в широкосмуговий дискретизації в більш ніж в один етап. мовний сигнал S110. У такому випадку операція На Фіг. 12а показана діаграма спектрів сигналу обертання спектра, показана на Фіг. 12а, буде не в різних точках в одному прикладі операції розшипотрібна, що було б бажано для того, щоб сигнал рення спектра, де масштаб частоти однаковий для збудження S120 смуги верхніх частот також мав різних графіків. Графік (а) демонструє спектр одспектрально обернену форму. ного прикладу вузькосмугового сигналу збудження Різні задачі підвищення частоти дискретизації і S80. Графік (b) демонструє спектр після підвищенперетворення зі зниженням частоти дискретизації ня частоти дискретизації сигналу S80 з коефіцієноперації розширення спектра, здійснюваної розтом вісім. Графік (с) демонструє приклад розшиширювачем спектра А402, можна конфігурувати реного спектра після застосування нелінійної по-різному. Наприклад, на Фіг. 12b показана діагфункції. Графік (d) демонструє спектр після низьрама спектрів сигналу в різних точках в іншому кочастотної фільтрації. У цьому прикладі, смуга прикладі операції розширення спектра, де масшпропускання доходить до верхньої частотної межі таб частоти однаковий для різних графіків. Графік сигналу S30 смуги верхніх частот (наприклад, 7 (а) демонструє спектр одного прикладу вузькосмукГц або 8 кГц). гового сигналу збудження S80. Графік (b) демонГрафік (e) демонструє спектр після першого струє спектр після підвищення частоти дискретиетапу перетворення зі зниженням частоти дискрезації сигналу S80 з коефіцієнтом два. Графік (с) тизації, на якому частота дискретизації знижується демонструє приклад розширеного спектра після з коефіцієнтом чотири для отримання широкосмузастосування нелінійної функції. У цьому випадку, гового сигналу. Графік (f) демонструє спектр після перешкода дискретизації, яка може виникати на операції високочастотної фільтрації для вибору більш високих частотах, прийнятна. частини смуги верхніх частот розширеного сигнаГрафік (d) демонструє спектр після операції лу, і графік (g) демонструє спектр після другого обертання спектра. Графік (e) демонструє спектр етапу перетворення зі зниженням частоти дискрепісля одного етапу перетворення зі зниженням тизації, на якому частота дискретизації знижується частоти дискретизації, на якому частота дискретиз коефіцієнтом два. У одному конкретному прикзації знижується з коефіцієнтом два для отриманладі, блок 530 зниження частоти дискретизації ня потрібного спектрально розширеного сигналу. У здійснює високочастотну фільтрацію і другий етап цьому прикладі, сигнал знаходиться в спектрально перетворення зі зниженням частоти дискретизації, оберненій формі і його можна використовувати в пропускаючи широкосмуговий сигнал через висореалізації кодера А200 смуги верхніх частот, який кочастотний фільтр 130 і блок 140 зниження часобробляв сигнал S30 смуги верхніх частот в такій тоти дискретизації гребінки фільтрів А112 (або інші формі. структури або процедури, які мають таку ж харакСпектрально розширений сигнал, створений теристику) для створення спектрально розширенообчислювачем 520 нелінійної функції, з великою го сигналу, що має частотний діапазон і частоту імовірністю має яскраво виражений спад амплітудискретизації сигналу S30 смуги верхніх частот. ди із зростанням частоти. Розширювач спектра З графіка (g) виходить, що перетворення зі А402 включає в себе згладжувач спектра 540, який зниженням частоти дискретизації високочастотноздійснює операцію відбілювання сигналу, перетго сигналу, показаного на графіку (f), приводить до вореного зі зниженням частоти дискретизації. обертання його спектра. У цьому прикладі, блок Згладжувач спектра 540 може здійснювати опера530 зниження частоти дискретизації також здійсцію фіксованого відбілювання або операцію адапнює операцію обертання спектра над сигналом. тивного відбілювання. У конкретному прикладі Графік (h) демонструє результат застосування адаптивного відбілювання, згладжувач спектра операції обертання спектра, яка може здійснюва540 включає в себе модуль аналізу ГРС для обчитися за допомогою множення сигналу на функцію слення набору з чотирьох коефіцієнтів фільтра з сигналу, перетвореного зі зниженням частоти дисеjn або послідовність (-1)n, яка навперемінно кретизації, і аналізуючий фільтр четвертого порядприймає значення +1 і -1. Така операція еквівалеку для відбілювання сигналу згідно з цими коефіцінтна зсуву цифрового спектра сигналу в частотєнтами. Інші реалізації розширювача спектра А400 ному вимірюванні на відстань . Відмітимо, що включають в себе конфігурації, в яких згладжувач такий же результат можна отримати, застосовуюспектра 540 обробляє спектрально розширений чи операції перетворення зі зниженням частоти сигнал до блока 530 зниження частоти дискретидискретизації і обертання спектра в іншому порядзації. ку. Операції підвищення частоти дискретизації Генератор збудження A300 смуги верхніх часі/або перетворення зі зниженням частоти дискретот може бути реалізований для виведення гармотизації також можуть включати в себе повторну нічно розширеного S160 як сигналу збудження дискретизацію для отримання спектрально розши 31 92341 32 S120 смуги верхніх частот. Однак, в ряді випадків, слює квадрат кожної вибірки кадру сигналу, обвідвикористання тільки гармонічно розширеного сигну якої треба моделювати (наприклад, вузькосмуналу як збудження смуги верхніх частот може пригового сигналу збудження S80 або гармонічно роводити до чутних спотворень. Гармонічна структузширеного сигналу S160), для створення ра мови, в загальному випадку, менш яскраво послідовності квадратів значень. Підзадача Т120 виражена у верхньому діапазоні, ніж в нижньому реалізовує операцію згладжування на послідовнодіапазоні, і використання дуже гармонічної струксті квадратів значень. У одному прикладі, підзадатури в сигналі збудження смуги верхніх частот ча Τ120 застосовує низькочастотний IIR-фільтр може приводити до вибухового звуку. Це спотвопершого порядку до послідовності згідно з виразом рення може бути особливо помітним в мовних сигналах дикторів-жінок. у(n)=ах(n)+(1-а)у(n-1) (1) Варіанти здійснення включають в себе реалізації генератора збудження А300 смуги верхніх де x - вхідний сигнал фільтра, у - вихідний сигчастот, які змішують гармонічно розширений сигнал фільтра, n - індекс часової області, і а - коефінал S160 з шумовим сигналом. Згідно з Фіг. 11, цієнт згладжування, що має значення між 0,5 і 1. генератор збудження А302 смуги верхніх частот Значення коефіцієнта згладжування а може бути включає в себе генератор шуму 480, який створює фіксованим або, в альтернативній реалізації, адавипадковий шумовий сигнал. У одному прикладі, птивним згідно з указанням шуму у вхідному сиггенератор шуму 480 створює білий псевдовипадналі, в результаті чого а виявляється ближче до 1 ковий шумовий сигнал з одиничною дисперсією, за відсутності шуму і ближче до 0,5 при наявності хоч, в інших реалізаціях, шумовий сигнал не обошуму. Підзадача Т130 застосовує функцію квадрав'язково білий і може мати щільність потужності, тного кореня до кожної вибірки згладженої посліщо змінюється з частотою. Може виявитися бажадовності для створення обвідної часової області. ним, щоб генератор шуму 480 виводив шумовий Така реалізація обчислювача обвідної 460 мосигнал як детерміновану функцію, щоб його стан же здійснювати різні підзадачі задачі Т100 посліможна було дублювати на декодері. Наприклад, довно і/або паралельно. У інших реалізаціях задагенератор шуму 480 може виводити шумовий сигчі Т100, підзадачі T110 може передувати операція нал як детерміновану функцію інформації, закодосмугової фільтрації для вибору потрібної частотної ваної раніше в тому ж кадрі, наприклад вузькосмуділянки сигналу, обвідну якої треба моделювати, гові параметри фільтра S40 і/або кодований наприклад діапазон 3-4 кГц. вузькосмуговий сигнал збудження S50. Об'єднувач 490 змішує гармонічно розширеДо змішування з гармонічно розширеним сигний сигнал S160 і модульований шумовий сигнал налом S160, випадковий шумовий сигнал, створеS170 для створення сигналу збудження S120 смуний генератором шуму 480, може модулюватися ги верхніх частот. Реалізації об'єднувача 490 мопо амплітуді, щоб він мав обвідну у часовому вижуть обчислювати сигнал збудження S120 смуги мірюванні, яка апроксимує розподіл енергії у часі верхніх частот як суму гармонічно розширеного вузькосмугового сигналу S20, сигналу S30 смуги сигналу S160 і модульованого шумового сигналу верхніх частот, вузькосмугового сигналу збудженS170. Така реалізація об'єднувача 490 може обчиня S80 або гармонічно розширеного сигналу S160. слювати сигнал збудження S120 смуги верхніх Згідно з Фіг. 11, генератор збудження А302 смуги частот як зважену суму із застосуванням вагового верхніх частот включає в себе об'єднувач 470, що коефіцієнта до гармонічно розширеного сигналу модулює по амплітуді шумовий сигнал, який ствоS160 і/або до модульованого шумовому сигналу рюється генератором шуму 480, що згідно з обвідS170 до підсумовування. Кожний такий ваговий ною у часовому вимірюванні, обчисленою обчискоефіцієнт можна обчислювати згідно з одним або лювачем обвідної 460. Наприклад, об'єднувач 470 декількома критеріями, і він може мати фіксоване можна реалізувати у вигляді помножувача для значення або, альтернативно, адаптивне значенмасштабування вихідного сигналу генератора шуня, що обчислюється для кожного кадру або підкаму 480 згідно з обвідною у часовому вимірюванні, дру. обчисленою обчислювачем обвідної 460, для На Фіг. 16 показана блок-схема реалізації 492 створення модульованого шумового сигналу S170. об'єднувача 490, який обчислює сигнал збудження У реалізації A304 генератора збудження A302 S120 смуги верхніх частот у вигляді зваженої суми смуги верхніх частот, показаній в блок-схемі на гармонічно розширеного сигналу S160 і модульоФіг. 13, обчислювач обвідної 460 обчислює обвідну ваного шумового сигналу S170. Об'єднувач 492 гармонічно розширеного сигналу S160. У реалізазважує гармонічно розширений сигнал S160 згідно ції A306 генератора збудження A302 смуги верхніх з ваговим коефіцієнтом гармонічного сигналу частот, показаній в блок-схемі на Фіг. 14, обчислюS180, зважує модульований шумовий сигнал S170 вач обвідної 460 обчислює обвідну вузькосмуговозгідно з ваговим коефіцієнтом шуму S190 і вивого сигналу збудження S80. Інші реалізації генерадить сигнал збудження S120 смуги верхніх частот тора збудження A302 смуги верхніх частот, так чи як суму зважених сигналів. У цьому прикладі об'єінакше, можуть додавати шум до гармонічно розднувач 492 включає в себе обчислювач 550 вагоширеного сигналу S160 згідно з положеннями вувих коефіцієнтів для обчислення вагового коефіцізькосмугових імпульсів основного тону у часі. єнта гармонічного сигналу S180 і вагового Обчислювач обвідної 460 може обчислювати коефіцієнта шуму S190. обвідну у вигляді задачі, що включає в себе ряд Обчислювач 550 вагових коефіцієнтів може підзадач. На Фіг. 15 показана логічна блок-схема обчислювати вагові коефіцієнти S180 і S190 згідно прикладу Τ100 такої задачі. Підзадача T110 обчиз потрібним відношенням вмісту гармонік до ство 33 92341 34 рення шуму в сигналі збудження S120 смуги верхМоже виявитися бажаним, щоб обчислювач ніх частот. Наприклад, може виявитися бажаним, 550 вагових коефіцієнтів обчислював міру періощоб об'єднувач 492 створював сигнал збудження дичності сигналу S30 смуги верхніх частот тільки у S120 смуги верхніх частот, що має відношення випадках, коли, так чи інакше, вказана наявність енергії гармонік енергії шуму, близьке до відповідперіодичності в кадрі. Наприклад, обчислювач 550 ного відношення в сигналі S30 смуги верхніх часвагових коефіцієнтів може обчислювати міру перітот. У деяких реалізаціях обчислювача 550 вагоодичності сигналу S30 смуги верхніх частот згідно вих коефіцієнтів, вагові коефіцієнти S180, S190 з співвідношенням між іншим покажчиком періодиобчислюються згідно з одним або декількома пачності поточного кадру, наприклад коефіцієнтом раметрами, пов'язаними з періодичністю вузькоспідсилення основного тону, і пороговим значенмугового сигналу S20 або вузькосмугового залишням. У одному прикладі, обчислювач вагових коекового сигналу, наприклад коефіцієнту підсилення фіцієнтів 550 здійснює операцію автокореляції над основного тону і/або мовному режиму. Така реалісигналом S30 смуги верхніх частот тільки, якщо зація обчислювача 550 вагових коефіцієнтів може коефіцієнт підсилення основного тону кадру (нанаприклад, привласнювати ваговому коефіцієнту приклад, коефіцієнт підсилення адаптивної кодогармонічного сигналу S180, значення, пропорційне вої книги вузькосмугового залишку) має значення коефіцієнту підсилення основного тону і/або привбільше 0,5 (альтернативно щонайменше 0,5). У ласнювати ваговому коефіцієнту шуму S190 для іншому прикладі, обчислювач вагових коефіцієнтів невокалізованих мовних сигналів більш високе 550 здійснює операцію автокореляції над сигназначення, ніж для вокалізованих мовних сигналів. лом S30 смуги верхніх частот тільки для кадрів, У інших реалізаціях, обчислювач 550 вагових що мають конкретні стани мовного режиму (наприкоефіцієнтів обчислює значення вагового коефіціклад, тільки для вокалізованих сигналів). У таких єнта гармонічного сигналу S180 і/або вагового випадках, обчислювач вагових коефіцієнтів 550 коефіцієнта шуму S190 згідно з мірою періодичноможе привласнювати ваговий коефіцієнт, прийнясті сигналу S30 смуги верхніх частот. У одному тий за умовчанням, для кадрів, що мають інші статакому прикладі, обчислювач вагових коефіцієнтів ни мовного режиму і/або менші значення коефіціє550 обчислює ваговий коефіцієнт гармонічного нта підсилення основного тону. сигналу S180 як максимальне значення коефіцієнВаріанти здійснення включають в себе додатта автокореляції сигналу S30 смуги верхніх частот кові реалізації обчислювача 550 вагових коефіцієдля поточного кадру або підкадру, де автокорелянтів, які обчислюють вагові коефіцієнти згідно з ція визначається в діапазоні пошуку, який включає характеристиками, відмінними від періодичності в себе затримку в один інтервал основного тону і або додатковими до неї. Наприклад, така реалізане включає в себе затримку в нуль вибірок. На Фіг. ція може привласнювати коефіцієнту підсилення 17 показаний приклад такого діапазону пошуку шуму S190 для мовних сигналів, що мають велидовжиною в n вибірок, центр якого відповідає закий інтервал основного тону, більш високе значентримці в один інтервал основного тону і ширина ня, ніж для мовних сигналів, що мають малий інтеякого не перевищує один інтервал основного тону. рвал основного тону. Інша така реалізація На Фіг. 17 також показаний приклад іншого піобчислювача 550 вагових коефіцієнтів визначає дходу, згідно з яким обчислювач 550 вагових коеміру гармонічності широкосмугового мовного сигфіцієнтів обчислює міру періодичності сигналу S30 налу S10, або сигналу S30 смуги верхніх частот, смуги верхніх частот в декілька етапів. На першозгідно з мірою енергії сигналу на частотах, кратних му етапі, поточний кадр ділиться на деяку кількість основній частоті, відносно енергії сигналу інших підкадрів, і затримка, при якій коефіцієнт автокочастотних складових. реляції досягає максимуму, визначається окремо Деякі реалізації широкосмугового мовного кодля кожного підкадру. Як відмічено вище, автокодера А100 виводять індикацію періодичності або реляція визначається в діапазоні пошуку, який гармонічності (наприклад, однобітовий прапор, включає в себе затримку в один інтервал основноякий вказує, чи є кадр гармонічним або негармого тону і не включає в себе затримку в нуль вибінійним) на основі коефіцієнта підсилення основнорок. го тону і/або іншої описаної тут міри періодичності На другому етапі, затриманий кадр формуєтьабо гармонічності. У одному прикладі, відповідний ся за допомогою застосування відповідної певної широкосмуговий мовний декодер В100 використозатримки для кожного підкадру, зчленування вує цю індикацію для настройки такої операції, як, отриманих підкадрів для формування кадру з опнаприклад, обчислення вагового коефіцієнта. У тимальною затримкою, і обчислення вагового коіншому прикладі, така індикація використовується ефіцієнта гармонічного сигналу S180 як коефіцієнт в кодері і/або декодері при обчисленні значення кореляції між початковим кадром і кадром з оптипараметра мовного режиму. мальною затримкою. Альтернативно, обчислювач Може виявитися бажаним, щоб генератор збу550 вагових коефіцієнтів обчислює ваговий коефідження A302 смуги верхніх частот генерував сигцієнт гармонічного сигналу S180 як середнє макнал збудження S120 смуги верхніх частот таким симальних коефіцієнтів автокореляції, отриманих чином, щоб конкретні значення вагових коефіцієнна першому етапі для кожного підкадру. Реалізації тів S180 і S190 не впливали істотним чином на обчислювача 550 вагових коефіцієнтів також моенергію сигналу збудження. У такому випадку, обжуть масштабувати коефіцієнт кореляції і/або числювач 550 вагових коефіцієнтів може обчислюоб'єднувати його з іншим значенням, для обчисвати значення вагового коефіцієнта гармонічного лення значення вагового коефіцієнта гармонічного сигналу S180 або вагового коефіцієнта шуму S190 сигналу S180. (або приймати таке значення з сховища або іншо 35 92341 36 го елемента кодера А200 смуги верхніх частот) і тра А400, наприклад, після будь-кого з елементів виводити значення іншого вагового коефіцієнта 510, 520, 530 і 540 в розширювачі спектра А402. згідно з, наприклад, виразом: Фільтр 600 для усунення розрідженості також можна використовувати з реалізаціями розширювача (Wharmonic)2+(Wnoise)2=1 (2) спектра А400, які здійснюють спектральне накладення, спектральне перенесення або гармонічне де Wharmonic означає ваговий коефіцієнт гарморозширення. нічного сигналу S180 і Wnoise означає ваговий коеФільтр 600 для усунення розрідженості може фіцієнт шуму S190. Альтернативно, обчислювач змінювати фазу сигналу, що надходить на нього. 550 вагових коефіцієнтів може вибирати, згідно із Наприклад, може виявитися бажаним, щоб фільтр значенням міри періодичності поточного кадру або 600 для усунення розрідженості був настроєний і підкадру, відповідну одну з сукупності пар вагових розміщений так, щоб рандомізувати фазу сигналу коефіцієнтів S180, S190, де пари заздалегідь обзбудження S120 смуги верхніх частот, або іншим числені відповідно до постійного відношення енерчином забезпечувати її більш рівномірний розпогій, наприклад, виразом (2). Для реалізації обчисділ у часі. Також може бути бажаним, щоб спектлювача 550 вагових коефіцієнтів, для якого ральна характеристика фільтра 600 для усунення справедливий вираз (2), типові значення вагового розрідженості була рівномірною, щоб амплітуднокоефіцієнта гармонічного сигналу S180 складають частотна характеристика фільтрованого сигналу від близько 0,7 до близько 1,0, і типові значення не зазнавала значних змін. У одному прикладі, вагового коефіцієнта шуму S190 складають від фільтр 600 для усунення розрідженості реалізоваблизько 0,1 до близько 0,7. Інші реалізації обчисний у вигляді всечастотного фільтра, передавальлювача 550 вагових коефіцієнтів можуть діяти згіна функція якого виражається таким чином: дно з версією виразу (2), модифікованою згідно з бажаним основоположним зважуванням між гар0,7 z 4 0,6 z 6 Hz монічно розширеним сигналом S160 і модульова(3) 1 0,7z 4 1 0,6z 6 ним шумовим сигналом S170. Спотворення можуть виникати в синтезованоТакий фільтр, зокрема дозволяє так розподіму мовному сигналі, коли розріджена кодова книга лити енергію вхідного сигналу, щоб вона більше (записи якої в більшості своїй мають нульові знане концентрувалася лише в декількох вибірках. чення) використовувалася для обчислення кванСпотворення, зумовлені розрідженістю кодової тованого представлення залишкового сигналу. книги, звичайно більш помітні для шумоподібних Розрідженість кодової книги має місце, в основносигналів, де залишковий сигнал включає в себе му, коли вузькосмуговий сигнал кодується з низьменше інформації основного тону, а також для кою бітовою швидкістю. Спотворення, зумовлені мови в фоновому шумі. Розрідженість звичайно розрідженістю кодової книги, звичайно є квазіперіодичними у часі і виникають, в основному, на часвикликає менші спотворення у випадках, коли збудження має довготривалу структуру, і, дійсно, змітотах понад 3 кГц. Оскільки людське вухо має підвищене часове розрізнення на більш високих на фази може приводити до зашумлення вокалізованих сигналів. Таким чином, може виявитися частотах, ці спотворення можуть бути більш помітні у верхньому діапазоні. бажаним настроїти фільтр 600 для усунення розрідженості на блокування невокалізованих сигнаВаріанти здійснення включають в себе реалізації генератора збудження A300 смуги верхніх лів і пропускання щонайменше деяких вокалізованих сигналів без зміни. Невокалізовані сигнали частот, які здійснюють фільтрацію для усунення розрідженості. На Фіг. 18 показана блок-схема рехарактеризуються низьким коефіцієнтом підсилення основного тону (наприклад, квантованим вузьалізації A312 генератора збудження А302 смуги верхніх частот, яка включає в себе фільтр 600 для космуговим коефіцієнтом підсилення адаптивної кодової книги) і близьким до нуля або позитивним усунення розрідженості, фільтруючий деквантований вузькосмуговий сигнал збудження, що ствонахилом спектра (наприклад, квантованим першим коефіцієнтом відображення), що свідчить про те, рюється зворотним квантувачем 450. На Фіг. 19 що спектральна обвідна є рівномірною або зроспоказана блок-схема реалізації A314 генератора тає із збільшенням частоти. Типові реалізації фізбудження A302 смуги верхніх частот, яка включає льтра 600 для усунення розрідженості здатні фільв себе фільтр 600 для усунення розрідженості, трувати невокалізовані звуки (наприклад, вказані фільтруючий спектрально розширений сигнал, що значенням нахилу спектра), фільтрувати вокалізостворюється розширювачем спектра А400. На Фіг. вані звуки, коли коефіцієнт підсилення основного 20 показана блок-схема реалізації A316 генератотону нижче порогового значення (альтернативно, ра збудження A302 смуги верхніх частот, яка не перевищує порогове значення), і, в іншому вивключає в себе фільтр 600 для усунення розріпадку, пропускати сигнал без зміни. дженості, фільтруючий вихідний сигнал об'єднуваІнші реалізації фільтра 600 для усунення розча 490 для створення сигналу збудження S120 рідженості включають в себе два або більше фільсмуги верхніх частот. Звичайно, можливі і, таким трів, які мають різні максимальні кути зміни фази чином, явно розкриті реалізації генератора збу(наприклад, до 180 градусів). У такому випадку, дження A300 смуги верхніх частот, що об'єднують фільтр 600 для усунення розрідженості може виособливості будь-якої з реалізацій A304 і А306 з бирати з цих компонентних фільтрів згідно із знаособливостями будь-якої з реалізацій A312, A314 і ченням коефіцієнта підсилення основного тону A316. Фільтр 600 для усунення розрідженості та(наприклад, квантованого коефіцієнта підсилення кож може бути передбачений в розширювачі спек 37 92341 38 адаптивної кодової книги або LTP), щоб більший відних підкадрів відповідних сигналів. Наприклад, максимальний кут зміни фази використовувався задачі 220а і 220b можуть обчислювати енергію як для кадрів, що мають більш низькі значення коесуму квадратів вибірок відповідного підкадру. Зафіцієнта підсилення основного тону. Реалізація дача Т230 обчислює коефіцієнт підсилення для фільтра 600 для усунення розрідженості також підкадру як квадратний корінь відношення цих може включати в себе різні компонентні фільтри, енергій. У цьому прикладі, задача Т230 обчислює які здатні змінювати фазу в більш або менш широкоефіцієнт підсилення як квадратний корінь віднокому частотному спектрі, щоб фільтр, здатний змішення енергії сигналу S30 смуги верхніх частот до нювати фазу в більш широкому частотному діапаенергії синтезованого сигналу S130 смуги верхніх зоні вхідного сигналу, використовувався для частот протягом підкадру. кадрів, що мають більш низькі значення коефіцієнМоже виявитися бажаним, щоб обчислювач та підсилення основного тону. А230 коефіцієнта підсилення смуги верхніх частот Для точного відтворення кодованого мовного обчислював енергії підкадрів згідно з функцією сигналу, може виявитися бажаним, щоб відношенвікна. На Фіг. 22 показана логічна блок-схема такої ня між рівнями частини смуги верхніх частот і вуреалізації Т210 задачі Т200 обчислення коефіцієнзькосмугової частини синтезованого широкосмугота підсилення. Задача Т215а застосовує функцію вого мовного сигналу S100 були близькими до вікна до сигналу S30 смуги верхніх частот, і задача відповідного відношення в початковому широкосТ215b застосовує ту ж функцію вікна до синтезомуговому мовному сигналі S10. Крім спектральної ваного сигналу S130 смуги верхніх частот. Реаліобвідної, представленої параметрами кодування зації 222а і 222b задач 220а і 220b обчислюють S60a смуги верхніх частот, кодер А200 смуги веренергії відповідних вікон, і задача Т230 обчислює хніх частот може характеризувати сигнал S30 смукоефіцієнт підсилення для підкадру як квадратний ги верхніх частот шляхом завдання часової обвідкорінь відношення енергій. ної або обвідної підсилення. Згідно з Фіг. 10, кодер Може виявитися бажаним застосовувати фунА202 смуги верхніх частот включає в себе обчискцію вікна, яка перекриває сусідні підкадри. Наприлювач А230 коефіцієнта підсилення смуги верхніх клад, функція вікна, яка створює коефіцієнти підчастот, який обчислює один або декілька коефіцієсилення, які можна застосовувати в режимі нтів підсилення згідно з співвідношенням між сигскладання з перекриттям, може сприяти зниженню налом S30 смуги верхніх частот і синтезованим або усуненню порушення безперервності між підсигналом S130 смуги верхніх частот, наприклад, кадрами. У одному прикладі, обчислювач А230 різниці або відношення між енергіями двох сигнакоефіцієнта підсилення смуги верхніх частот залів протягом кадру або деякої його частини. У інстосовує трапецеїдальну функцію вікна, показану ших реалізаціях кодера А202 смуги верхніх частот, на Фіг. 23а, в якій вікно перекриває кожний з двох обчислювач А230 коефіцієнта підсилення смуги сусідніх підкадрів на одну мілісекунду. На Фіг. 23b верхніх частот може мати аналогічну конфігурапоказане застосування цієї функції вікна до кожноцію, але призначений для обчислення обвідної го з п'яти підкадрів 20-мілісекундного кадру. Інші підсилення згідно зі змінюваним у часі таким співреалізації обчислювача А230 коефіцієнта підсивідношенням між сигналом S30 смуги верхніх часлення смуги верхніх частот застосовують функції тот і вузькосмуговим сигналом збудження S80 або вікна, що мають різні періоди перекриття і/або різні сигналом збудження S120 смуги верхніх частот. форми вікна (наприклад, прямокутну, хемінгову), Часові обвідні вузькосмугового сигналу збуякі можуть бути симетричними або асиметричнидження S80 і сигналу S30 смуги верхніх частот з ми. Реалізація обчислювача А230 коефіцієнта підвеликою мірою ймовірності схожі. Тому, кодування силення смуги верхніх частот також може застосообвідної підсилення, яке основане на співвідновувати різні функції вікна до різних підкадрів в шенні між сигналом S30 смуги верхніх частот і вукадрі і/або кадр може включати в себе підкадри зькосмуговим сигналом збудження S80 (або сигрізної довжини. налом, виведеним з нього, наприклад сигналом Як приклади конкретних реалізацій, без обмезбудження S120 смуги верхніх частот або синтезоження, представлені наступні значення. Для цих ваним сигналом S130 смуги верхніх частот), буде, випадків передбачається 20-мілісекундний кадр, в загальному випадку, більш ефективним, ніж кохоч можна використовувати кадр будь-якої іншої дування обвідної підсилення, основане тільки на довжини. Для сигналу смуги верхніх частот, диссигналі S30 смуги верхніх частот. У типовій реалікретизованого з частотою 7 кГц, колений кадр має зації, кодер А202 смуги верхніх частот виводить 140 вибірок. Якщо такий кадр розділити на п'ять квантований індекс розміром від восьми до дванапідкадрів однакової довжини, кожний підкадр буде дцяти бітів, який вказує п'ять коефіцієнтів підсимати 28 вибірок, і вікно, показане на Фіг. 23а, буде лення для кожного кадру. мати ширину 42 вибірки. Для сигналу смуги верхОбчислювач А230 коефіцієнта підсилення смуніх частот, дискретизованого з частотою 8 кГц, ги верхніх частот може обчислювати коефіцієнт кожний кадр має 160 вибірок. Якщо такий кадр підсилення у вигляді задачі, що включає в себе розділити на п'ять підкадрів однакової довжини, одну або декілька послідовностей підзадач. На Фіг. кожний підкадр буде мати 32 вибірки, і вікно, пока21 показана логічна блок-схема прикладу Т200 зане на Фіг. 23а, буде мати ширину 48 вибірок. У такої задачі, яка обчислює значення коефіцієнта інших реалізаціях можна використовувати підкадпідсилення для відповідного підкадру згідно з відри будь-якої ширини, і навіть можна реалізувати носною енергією сигналу S30 смуги верхніх частот обчислювач А230 коефіцієнта підсилення смуги і синтезованого сигналу S130 смуги верхніх часверхніх частот, що створює різні коефіцієнти підтот. Задачі 220а і 220b обчислюють енергії відпосилення для різних вибірок кадру. 39 92341 40 На Фіг. 24 показана блок-схема реалізації не відрізнятися від функції вікна, що застосовуєтьВ202 декодера В200 смуги верхніх частот. Декося обчислювачем коефіцієнта підсилення (напридер В202 смуги верхніх частот включає в себе клад, обчислювачем коефіцієнта підсилення А230 генератор збудження В300 смуги верхніх частот, смуги верхніх частот) відповідного кодера смуги утворюючий сигнал збудження S120 смуги верхніх верхніх частот. У інших реалізаціях декодера В202 частот на основі вузькосмугового сигналу збусмуги верхніх частот, елемент 590 регулювання дження S80. У залежності від конкретних виборів підсилення має аналогічну конфігурацію, але законструкції системи, генератор В300 збудження стосовує деквантовані коефіцієнти підсилення до смуги верхніх частот можна реалізувати згідно з вузькосмугового сигналу збудження S80 або до будь-якою з описаних тут реалізацій генератора сигналу збудження S120 смуги верхніх частот. A300 збудження смуги верхніх частот. Звичайно Як відмічено вище, може виявитися бажаним бажано реалізувати генератор В300 збудження отримувати один і той же стан в кодері смуги версмуги верхніх частот, що має таку ж характеристихніх частот і декодері смуги верхніх частот (наприку, як генератор збудження смуги верхніх частот клад, з використанням деквантованих значень при кодера смуги верхніх частот конкретної системи кодуванні). Таким чином, в системі кодування згідкодування. Однак, оскільки вузькосмуговий деконо з такою реалізацією, може виявитися бажаним дер B110 звичайно здійснює деквантування кодогарантувати один і той же стан для відповідних ваного вузькосмугового сигналу збудження S50, в генераторів шуму в генераторах А300 і В300 збубільшості випадків можна реалізувати генератор дження смуги верхніх частот. Наприклад, генераВ300 збудження смуги верхніх частот, який прийтори A300 і В300 збудження смуги верхніх частот має вузькосмуговий сигнал збудження S80 від вутакої реалізації можуть мати таку конфігурацію, що зькосмугового декодера B110 і не обов'язково стан генератора шуму є детермінований функцією включає в себе зворотний квантувач, здатний деінформації, вже закодованою в тому ж кадрі (наквантувати кодований вузькосмуговий сигнал збуприклад, вузькосмугових параметрів фільтра S40 дження S50. Також можна реалізувати вузькосмуабо їх частини і/або кодованого вузькосмугового говий декодер В110, що включає в себе варіант сигналу збудження S50 або його частини). фільтра 600 для усунення розрідженості, що фільОдин або декілька квантувачів описаних тут трує деквантований вузькосмуговий сигнал збуелементів (наприклад, квантувач 230, 420 або 430) дження раніше, ніж він надійде на вузькосмуговий може здійснювати класифіковане векторне квансинтезуючий фільтр, наприклад фільтр 330. тування. Наприклад, такий квантувач може вибиЗворотний квантувач 560 деквантує параметрати одну з набору кодових книг на основі інфорри смуги верхніх частот фільтра S60a (в цьому мації, вже закодованої в тому ж кадрі в прикладі, в набір LSF), і перетворювач 570 LSF в вузькосмуговому каналі і/або в каналі смуги верхкоефіцієнти LP-фільтра перетворює LSF в набір ніх частот. Такий метод звичайно забезпечує підкоефіцієнтів фільтра (наприклад, як описано вище вищення ефективності кодування за рахунок зберіз посиланням на зворотний квантувач 240 і перетгання додаткових кодових книг. ворювач 250 вузькосмугового кодера А122). У інЯк описано вище, наприклад, з посиланням на ших реалізаціях, як відмічено вище, можна викоФіг. 8 і 9, значний об'єм періодичної структури мористовувати різні набори коефіцієнтів (наприклад, же залишатися в залишковому сигналі після видакоефіцієнти косинусного перетворення Фур'є) і/або лення грубої спектральної обвідної з вузькосмугопредставлення коефіцієнтів (наприклад, ISP). Синвого мовного сигналу S20. Наприклад, залишковий тезуючий фільтр В200 смуги верхніх частот ствосигнал може містити послідовність приблизно перює синтезований сигнал смуги верхніх частот ріодичних імпульсів або піків у часі. Поява такої згідно з сигналом збудження S120 смуги верхніх структури, яка звичайно пов'язана з основним точастот і набором коефіцієнтів фільтра. Для систеном, особливо ймовірна у вокалізованих мовних ми, в якій кодер смуги верхніх частот включає в сигналах. Обчислення квантованого представленсебе синтезуючий фільтр (наприклад, як в описаня вузькосмугового залишкового сигналу може ному вище прикладі кодера А202), може виявитися включати в себе кодування цієї структури основнобажаним реалізувати синтезуючий фільтр В200 го тону згідно з моделлю довготривалої періодичсмуги верхніх частот, що має таку ж характеристиності, представленою, наприклад, однією або деку (наприклад, таку ж передавальну функцію), як у кількома кодовими книгами. синтезуючого фільтра. Структура основного тону фактичного залишДекодер В202 смуги верхніх частот також кового сигналу може не точно співпадати з моделвключає в себе зворотний квантувач 580, декванлю періодичності. Наприклад, залишковий сигнал туючий коефіцієнти підсилення S60b смуги верхніх може включати в себе невеликі флуктуації регулячастот, і елемент 590 регулювання підсилення рності розміщення імпульсів основного тону, в ре(наприклад, помножувач або підсилювач), який зультаті чого відстані між послідовними імпульсазастосовує деквантовані коефіцієнти підсилення ми основного тону в кадрі не точно однакові, і до синтезованого сигналу смуги верхніх частот структура не є цілком регулярною. Ця нерегулярдля створення сигналу S100 смуги верхніх частот. ність знижує ефективність кодування. У випадку, коли обвідна підсилення кадру задана Деякі реалізації вузькосмугового кодера A120 більш ніж одним коефіцієнтом підсилення, елездійснюють регуляризацію структури основного мент 590 регулювання підсилення може включати тону за рахунок застосування адаптивного перетв себе логіку, здатну застосовувати коефіцієнти ворення часового масштабу до залишкового сигпідсилення до відповідних підкадрів, можливо, налу до або в ході квантування, або іншого вклюзгідно з функцією вікна, яка може відрізнятися або чення адаптивного перетворення часового 41 92341 42 масштабу в кодований сигнал збудження. НаприНа жаль, регуляризація може створювати проклад, такий кодер може вибирати або обчислюваблеми для широкосмугового мовного кодера, в ти міру трансформації у часі (наприклад, згідно з якому збудження смуги верхніх частот виводиться одним або декількома критеріями перцептивного з кодованого вузькосмугового сигналу збудження зважування і/або мінімізації помилки), завдяки чо(наприклад, система, що включає в себе широкому результуючий сигнал збудження оптимально смуговий мовний кодер А100 і широкосмуговий узгоджується з моделлю довготривалої періодичмовний декодер В100). Внаслідок того, що він виності. Регуляризація структури основного тону водиться з сигналу з трансформованою часовою здійснюється піднабором кодерів CELP, які назишкалою, сигнал збудження смуги верхніх частот ваються кодерами на основі релаксаційного лінійзвичайно має інший часовий профіль, ніж вихідний ного прогнозування з кодовим збудженням мовний сигнал смуги верхніх частот. Іншими сло(RCELP). вами, сигнал збудження смуги верхніх частот не Кодер RCELP здійснює перетворення часовосинхронізований з вихідним мовним сигналом смуго масштабу у вигляді адаптивного часового зсуву. ги верхніх частот. Цей часовий зсув може являти собою затримку в Розузгодження у часі між трансформованим межах від декількох мілісекунд з негативним знасигналом збудження смуги верхніх частот і вихідком до декількох мілісекунд з позитивним знаком, і ним мовним сигналом смуги верхніх частот може звичайно змінюється плавно, щоб уникнути чутних викликати ряд проблем. Наприклад, трансформопорушень безперервності. У деяких реалізаціях, ваний сигнал збудження смуги верхніх частот вже такий кодер застосовує регуляризацію в кусковоне може забезпечувати відповідне початкове збулінійному режимі, в якому кожний кадр або підкадр дження для синтезуючого фільтра, який настроєтрансформується з відповідним фіксованим часоний згідно з параметрами фільтра, витягнутими з вим зсувом. У інших реалізаціях, кодер застосовує вихідного мовного сигналу смуги верхніх частот. У регуляризацію у вигляді безперервної функції трарезультаті, синтезований сигнал смуги верхніх нсформації, в результаті чого кадр або підкадр частот може містити чутні спотворення, які знижутрансформується згідно з контуром основного тоють якість декодованого широкосмугового мовного ну (що також називається траєкторією основного сигналу, що сприймається. тону). У ряді випадків (наприклад, як описано в Розузгодження у часі також може приводити опублікованій патентній заявці США № до зниження ефективності кодування обвідної під2004/0098255), кодер забезпечує перетворення силення. Як відмічено вище, з високим ступенем часового масштабу в кодованому сигналі збуімовірності існує кореляція між часовими обвіднидження шляхом застосування зсуву до перцептивми вузькосмугового сигналу збудження S80 і сигно зваженого вхідного сигналу, який використовуналом S30 смуги верхніх частот. Завдяки кодуванється для обчислення кодованого сигналу ню обвідної підсилення сигналу смуги верхніх збудження. частот згідно зі співвідношенням між цими двома Кодер обчислює кодований сигнал збудження, часовими обвідними, можна реалізувати підвиякого регуляризується і квантується, і декодер щення ефективності кодування в порівнянні з кодеквантує кодований сигнал збудження для отридуванням безпосередньо обвідної підсилення. мання сигналу збудження, який використовується Однак, завдяки регуляризації кодованого вузькосдля синтезу декодованого мовного сигналу. Таким мугового сигналу збудження, цю кореляцію можна чином, декодований вихідний сигнал демонструє послабити. Розузгодження у часі між вузькосмуготаку ж змінювану затримку, яка була внесена в вим сигналом збудження S80 і сигналом S30 смуги кодований сигнал збудження за допомогою регуверхніх частот може привести до появи флуктуаляризації. Звичайно на декодер не передається цій коефіцієнтів підсилення S60b смуги верхніх ніякій інформації, яка вказує об'єми регуляризації. частот і падіння ефективності кодування. Регуляризація полегшує кодування залишкоВаріанти здійснення включають в себе спосового сигналу, що підвищує ефективність кодування би широкосмугового мовного кодування, які пез довгострокового передбачувача і, таким чином, редбачають здійснення перетворення часового підвищує загальну ефективність кодування, звимасштабу мовного сигналу смуги верхніх частот чайно без генерації спотворень. Може виявитися згідно з перетворенням часового масштабу, вклюбажаним здійснювати регуляризацію тільки на ченого у відповідний кодований вузькосмуговий вокалізованих кадрах. Наприклад, вузькосмуговий сигнал збудження. Потенційні переваги таких спокодер А124 може зсувати тільки ті кадри або підсобів включають в себе підвищення якості декодокадри, які мають довготривалу структуру, наприваного широкосмугового мовного сигналу і/або клад вокалізовані сигнали. Також може виявитися підвищення ефективності кодування обвідної підбажаним здійснювати регуляризацію тільки на силення смуги верхніх частот. підкадрах, які включають в себе енергію імпульсів На Фіг. 25 показана блок-схема реалізації основного тону. Різні реалізації кодування RCELP AD10 широкосмугового мовного кодера A100. Коописані в патентах США № 5704003 (Kleijn і інш.) і дер AD10 включає в себе реалізацію А124 вузько6879955 (Rao) і в опублікованій патентній заявці смугового кодера A120, який здійснює регуляризаСША № 2004/0098255 (Kovesi і інш.). Існуючі реацію в ході обчислення кодованого вузькосмугового лізації кодеров RCELP включають в себе сигналу збудження S50. Наприклад, вузькосмугоEnhanced Variable Rate Codec (EVRC), описаний в вий кодер А124 може бути настроєний згідно з Telecommunications Industry Association (TIA) ISодним або декількома з розглянутих вище реалі127, і Third Generation Partnership Project 2 зацій RCELP. (3GPP2) Selectable Mode Vocoder (SMV). 43 92341 44 Вузькосмуговий кодер А124 виводить сигнал лінії затримки D120, яка включає в себе зсувний SD10 даних регуляризації, який вказує ступінь зарегістр SR1. Зсувний регістр SR1 це буфер деякої стосовуваного перетворення часового масштабу. довжини m, який приймає і зберігає m найбільш Для різних випадків, коли вузькосмуговий кодер останніх вибірок мовного сигналу S30 смуги верхА124 застосовує фіксований часовий зсув до кожніх частот. Значення m дорівнює щонайменше сумі ного кадру або підкадру, сигнал SD10 даних регумаксимально підтримуваних позитивного ("випеляризації може включати в себе ряд значень, які редження") і негативного ("відставання") часових вказують величину кожного часового зсуву як ціле зсувів. Може виявитися зручним, щоб значення m або неціле значення, виражене у вибірках, мілісебуло таке, що дорівнює довжині кадру або підкадкундах або іншому прирості часу. У випадку, коли ру сигналу S30 смуги верхніх частот. вузькосмуговий кодер А124 інакше змінює часову Лінія затримки D122 виводить сигнал S30a шкалу кадру або іншої послідовності вибірок (насмуги верхніх частот з трансформованою часовою приклад, стискаючи одну частину і розтягуючи іншкалою з осередку зміщення OL зсувного регістра шу частину), сигнал SD10 інформації регуляризації SR1. Позиція осередку зміщення OL варіюється може включати в себе відповідний опис зміни, навідносно опорної позиції (нульового часового зсуприклад набір параметрів функції. У одному конкву) згідно з поточним часовим зсувом, вказаним, ретному прикладі, вузькосмуговий кодер А124 дінаприклад, сигналом SD10 даних регуляризації. лить кадр на три підкадри і обчислює фіксований Лінія затримки D122 може підтримувати однакові часовий зсув для кожного підкадру, тому сигнал межі випередження і відставання або, альтернаSD10 даних регуляризації вказує три величини тивно, одна межа більша іншої, в результаті чого в часового зсуву для кожного регуляризованого кадодному напрямку може здійснювати більший зсув, ру кодованого вузькосмугового сигналу. ніж в іншому. На Фіг. 26а показаний конкретний Широкосмуговий мовний кодер AD10 включає приклад, де часовий зсув в позитивному напрямку в себе лінію затримки D120, що забезпечує випебільший, ніж в негативному. Лінія затримки D122 редження або відставання частин мовного сигналу може виводити одночасно одну або декілька вибіS30 смуги верхніх частот, згідно з величинами рок (в залежності, наприклад, від ширини вихідної затримки, вказаними у вхідному сигналі, для ствошини). рення мовного сигналу S30a смуги верхніх частот Часовий зсув регуляризації, що має величину з трансформованою часовою шкалою. У прикладі, понад декількох мілісекунд, може приводити до показаному на Фіг. 25, лінія затримки D120 трансчутних спотворень в декодованому сигналі. Звиформує часову шкалу мовного сигналу S30 смуги чайно величина часового зсуву регуляризації, верхніх частот згідно з трансформацією, вказаною здійснюваного вузькосмуговим кодером А124, не в сигналі SD10 даних регуляризації. Таким чином, перевищує декількох мілісекунд, тому часові зсуперетворення часового масштабу тієї ж величини, ви, вказані в сигналі даних регуляризації SD10, що і для кодованого вузькосмугового сигналу збуобмежені. Однак в таких випадках може виявитися дження S50, застосовується до відповідної частибажаним, щоб лінія затримки D122 накладала мани мовного сигналу S30 смуги верхніх частот до ксимальне обмеження на часові зсуви в позитиваналізу. Хоч в цьому прикладі лінія затримки D120 ному і/або негативному напрямку (наприклад, для показана як елемент, окремий від кодера А200 забезпечення більш жорсткого обмеження, ніж смуги верхніх частот, в інших реалізаціях лінія затаке, що накладається вузькосмуговим кодером). тримки D120 забезпечена як частина кодера смуги На Фіг. 26b показана схема реалізації D124 ліверхніх частот. нії затримки D122, яка включає в себе вікно зсуву Інші реалізації кодера А200 смуги верхніх часSW. У цьому прикладі, позиція осередку зміщення тот можуть здійснювати спектральний аналіз (наOL обмежується вікном зсуву SW. Хоч на Фіг. 26b приклад, аналіз LPC) нетрансформованого мовнопоказаний випадок, коли буфер довжина m більша го сигналу S30 смуги верхніх частот і здійснювати ширини вікна зсуву SW, лінію затримки D124 також перетворення часового масштабу мовного сигналу можна реалізувати з шириною вікна зсуву SW, яка S30 смуги верхніх частот до обчислення параметдорівнює m. рів підсилення S60b смуги верхніх частот. Такий У інших реалізаціях, лінія затримки D120 запикодер може включати в себе, наприклад, реалізасує мовний сигнал S30 смуги верхніх частот в буцію лінії затримки D120 для перетворення часовофер згідно з потрібними часовими зсувами. На Фіг. го масштабу. У таких випадках, однак, параметри 27 показана схема такої реалізації D130 лінії зафільтра S60a смуги верхніх частот, основані на тримки D120, яка включає в себе два зсувних регіаналізі нетрансформованого сигналу S30, можуть стри SR2 і SR3, що приймають і зберігають мовописувати спектральну обвідну, розузгоджену по ний сигнал S30 смуги верхніх частот. Лінія часу з сигналом збудження S120 смуги верхніх затримки D130 записує кадр або підкадр з зсувночастот. го регістра SR2 в зсувний регістр SR3 згідно з чаЛінія затримки D120 може бути виконана згідсовим зсувом, вказаним, наприклад, в сигналі но з будь-якою комбінацією логічних елементів і SD10 даних регуляризації. Зсувний регістр SR3 елементів зберігання, придатною для застосуванвиконаний як буфер FIFO вивідний сигнал S30 ня потрібних операцій перетворення часового масмуги верхніх частот з трансформованою часовою сштабу до мовного сигналу S30 смуги верхніх часшкалою. тот. Наприклад, лінія затримки D120 може У конкретному прикладі, показаному на Фіг. 27, зчитувати мовний сигнал S30 смуги верхніх частот зсувний регістр SR2 включає в себе ділянку кадз буфера згідно з потрібними часовими зсувами. рового буфера FB1 і ділянку буфера затримки DB, На Фіг. 26а показана схема такої реалізації D122 і зсувний регістр SR3 включає в себе ділянку кад 45 92341 46 рового буфера FB2, ділянку випереджального бувідповідного кадру сигналу S30 смуги верхніх часфера АВ, і ділянку відстаючого буфера RB. Довтот. У інших прикладах, можна обчислювати і зажини випереджального буфера АВ і відстаючого стосовувати середнє по більш короткому періоду буфера RB можуть бути однакові, або один може (наприклад, двох підкадрах або половині кадру) бути більшим іншого, в результаті чого в одному або більш довгому періоду (наприклад, двох каднапрямку підтримується більший зсув, ніж в іншорах). У випадку, коли середнє є нецілою кількістю му. Буфер затримки DB і ділянка відстаючого бувибірок, блок D110 відображення значень затримфера RB можуть бути мати однакову довжину. ки може округляти значення до цілої кількості виАльтернативно, буфер затримки DB можна зробибірок раніше, ніж вивести його на лінію затримки ти коротшим відстаючого буфера RB для врахуD120. вання інтервалу часу, необхідного для перенесенВузькосмуговий кодер А124 може включати ня вибірок з кадрового буфера FB1 в зсувний часовий зсув регуляризації, який дорівнює нецілій регістр SR3, який може включати в себе інші опекількості вибірок, в кодований вузькосмуговий сиграції обробки, наприклад трансформацію вибірок нал збудження. У такому випадку може виявитися до збереження в зсувному регістрі SR3. бажаним, щоб блок D110 відображення значень У прикладі, приведеному на Фіг. 27, кадровий затримки округляв вузькосмуговий часовий зсув до буфер FB1 може мати довжину, яка дорівнює довцілої кількості вибірок, і щоб лінія затримки D120 жині одного кадру сигналу S30 смуги верхніх часзастосовувала округлений часовий зсув до мовнотот. У іншому прикладі, кадровий буфер FB1 може го сигналу S30 смуги верхніх частот. мати довжину, яка дорівнює довжині одного підкаУ деяких реалізаціях широкосмугового мовнодру сигналу S30 смуги верхніх частот. У такому го кодера AD10, частоти дискретизації вузькосмувипадку, лінія затримки D130 може включати в гового мовного сигналу S20 і мовного сигналу S30 себе логіку для застосування однакової (наприсмуги верхніх частот можуть відрізнятися. У таких клад, середньої) затримки до всіх підкадрів кадру, випадках, блок D110 відображення значень затрищо зсувається. Лінія затримки D130 також може мки може регулювати величини часового зсуву, включати в себе логіку для усереднення значень з вказані в сигналі SD10 даних регуляризації для кадрового буфера FB1 зі значеннями, що підлягаврахування різниці між частотами дискретизації ють перезапису у відстаючий буфер RB або випевузькосмугового мовного сигналу S20 (або вузькореджальний буфер АВ. У ще одному прикладі, смугового сигналу збудження S80) і мовного сигзсувний регістр SR3 може приймати значення сигналу S30 смуги верхніх частот. Наприклад, блок налу S30 смуги верхніх частот тільки через кадроD110 відображення значень затримки може масшвий буфер FB1, і, в такому випадку, лінія затримки табувати величини часового зсуву згідно з відноD130 може включати в себе логіку для інтерполяції шенням частот дискретизації. У одному конкретв проміжках між послідовними кадрами або підканому прикладі, як відмічено вище, вузькосмуговий драми, записаними в зсувний регістр SR3. У інших мовний сигнал S20 дискретизирований з частотою реалізаціях, лінія затримки D130 може здійснюва8 кГц, і мовний сигнал S30 смуги верхніх частот ти операцію трансформації на вибірках з кадроводискретизирований з частотою 7 кГц. У цьому виго буфера FB1 до запису їх в зсувний регістр SR3 падку, блок D110 відображення значень затримки (наприклад, згідно з функцією, описаною сигналом змінює величину кожного зсуву на 7/8. Реалізації SD10 даних регуляризації). блока D110 відображення значень затримки також Може виявитися бажаним, щоб лінія затримки можуть здійснювати таку операцію масштабування D120 застосовувала перетворення часового масспільно з округленням до цілого і/або описану тут штабу, основане на, але не ідентичне, трансфороперацію усереднення часового зсуву. мації, заданої сигналом SD10 даних регуляризації. У ще одній реалізації, лінія затримки D120 моНа Фіг. 28 показана блок-схема реалізації AD12 же інакше змінювати часову шкалу кадру або іншої широкосмугового мовного кодера AD10, який послідовності вибірок (наприклад, стискаючи одну включає в себе блок D110 відображення значень частину і розтягуючи іншу частину). Наприклад, затримки. Блок D110 відображення значень завузькосмуговий кодер А124 може здійснювати ретримки відображає трансформацію, вказану в сиггуляризацію згідно з такою функцією, як контур або налі SD10 даних регуляризації, у відображені знатраєкторія основного тону. У такому випадку, сигчення затримки SD10a. Лінія затримки D120 нал SD10 даних регуляризації може включати в створює мовний сигнал S30a смуги верхніх частот себе відповідний опис функції, наприклад набір з трансформованою часовою шкалою згідно з трапараметрів, і лінія затримки D120 може включати в нсформацією, вказаною відображеними значенням себе логіку, здатну трансформувати кадри або затримки SD10a. підкадри мовного сигналу S30 смуги верхніх часЧасовий зсув, який застосовується вузькосмутот згідно з функцією. У інших реалізаціях, блок говим кодером, ймовірно, змінюється плавно у відображення значень затримки D110 усереднює, часі. Тому звичайно буває достатньо обчислити масштабує і/або округляє функцію до її застосусередній вузькосмуговий часовий зсув, який застовання до мовного сигналу S30 смуги верхніх чассовується до підкадрів протягом кадру мови, і зсутот лінією затримки D120. Наприклад, блок D110 нений відповідний кадр мовного сигналу S30 смуги відображення значень затримки може обчислюваверхніх частот згідно з цим середнім значенням. У ти одне або декілька значень затримки згідно з одному такому прикладі, блок D110 відображення функцією, причому кожне значення затримки вказначень затримки обчислює середнє для значень зує кількість вибірок, які потім застосовуються лінізатримки підкадрів для кожного кадру, і лінія заєю затримки D120 для трансформації часового тримки D120 застосовує обчислене середнє до масштабу одного або декількох відповідних кадрів 47 92341 48 або підкадрів мовного сигналу S30 смуги верхніх сигнал S20 і мовний сигнал S30 смуги верхніх часчастот. тот незалежно один від одного, в результаті чого На Фіг. 29 показана логічна блок-схема спосомовний сигнал S30 смуги верхніхчастот кодується бу MD100 перетворення часового масштабу мовяк представлення спектральної обвідної смуги ного сигналу смуги верхніх частот згідно з перетверхніх частот і сигналу збудження смуги верхніх воренням часового масштабу, включеним у частот. Така реалізація може бути здатна здійснювідповідний кодований вузькосмуговий сигнал вати перетворення часового масштабу залишковозбудження. Задача TD100 обробляє широкосмугого сигналу смуги верхніх частот або інакше вклювий мовний сигнал для отримання вузькосмуговочати перетворення часового масштабу в го мовного сигналу і мовного сигналу смуги верхкодований сигнал збудження смуги верхніх частот, ніх частот. Наприклад, задача TD100 може згідно з інформацією, пов'язаною з перетворенням фільтрувати широкосмуговий мовний сигнал з вичасового масштабу, включеним в кодований вузькористанням гребінки фільтрів, що має низькочаскосмуговий сигнал збудження. Наприклад, кодер тотні і високочастотні фільтри, наприклад реалізасмуги верхніх частот може включати в себе реаліції гребінки фільтрів А110. Задача TD200 кодує зацію описаних тут лінії затримки D120 і/або блока вузькосмуговий мовний сигнал в щонайменше D110 відображення значень затримки, які застосокодований вузькосмуговий сигнал збудження і сувують перетворення часового масштабу до заликупність вузькосмугових параметрів фільтра. Кошкового сигналу смуги верхніх частот. Потенційні дований вузькосмуговий сигнал збудження і/або переваги такої операції включають в себе більш параметри фільтра можуть бути квантованими, і ефективне кодування залишкового сигналу смуги кодований вузькосмуговий мовний сигнал також верхніх частот і кращий збіг між синтезованими може включати в себе інші параметри, наприклад, вузькосмуговим мовним сигналом і мовним сигнапараметр мовного режиму. Задача TD200 також лом смуги верхніх частот. включає в себе перетворення часового масштабу Як відмічено вище, описані варіанти здійсненв кодованому вузькосмуговому сигналі збудження. ня включають в себе реалізації, які можна викориЗадача TD300 генерує сигнал збудження смустовувати для здійснення вбудованого кодування, ги верхніх частот на основі вузькосмугового сигнапідтримки сумісності з вузькосмуговими системами лу збудження. У цьому випадку, вузькосмуговий і виключення необхідності в транскодуванні. Підтсигнал збудження оснований на кодованому вузьримка кодування смуги верхніх частот також може космуговому сигналі збудження. Згідно з щонайслужити для диференціації, в залежності від варменше сигналом збудження смуги верхніх частот, тості, між чипами, чипсетами, пристроями і/або задача TD400 кодує мовний сигнал смуги верхніх мережами, що мають широкосмугову підтримку із частот в щонайменше сукупність параметрів фільзворотною сумісністю, і мають тільки вузькосмуготра смуги верхніх частот. Наприклад, задача ву підтримку. Описану тут підтримку кодування TD400 може кодувати мовний сигнал смуги верхніх смуги верхніх частот також можна використовувачастот в сукупність квантованих LSF. Задача ти спільно з методами підтримки кодування смуги TD500 застосовує часовий зсув до мовного сигнанижніх частот, і система, спосіб або пристрій згідно лу смуги верхніх частот, який оснований на інфорз таким варіантом здійснення може підтримувати мації, пов'язаній з перетворенням часового масшкодування частотних складових від, наприклад, табу, включеним в кодований вузькосмуговий близько 50 або 100 Гц до близько 7 або 8 кГц. сигнал збудження. Як відмічено вище, додання підтримки смуги Задача TD400 може здійснювати спектральверхніх частот до мовному кодеру може підвищити ний аналіз (наприклад, аналіз LPC) мовного сигнарозбірливість голосу, особливо відносно розрізлу смуги верхніх частот і/або обчислювати обвідну нення фрикативних звуків. Хоч слухач-людина підсилення мовного сигналу смуги верхніх частот. звичайно може розрізнювати такі звуки на основі У таких випадках, задача TD500 може застосовуконкретного контексту, підтримка смуги верхніх вати часовий зсув до мовного сигналу смуги верхчастот може служити потужним допоміжним засоніх частот до аналізу і/або обчислення обвідної бом в розпізнаванні мови і інших додатках машинпідсилення. ної інтерпретації, наприклад системах для автомаІнші реалізації широкосмугового мовного котичної навігації по голосовому меню і/або дера А100 обертають перетворення часового маавтоматичній обробці виклику. сштабу сигналу збудження S120 смуги верхніх Пристрій згідно з варіантом здійснення можна частот, зумовленого перетворенням часового мавбудувати в портативний пристрій безпровідного сштабу, включеним в кодований вузькосмуговий зв'язку, наприклад, стільниковий телефон або кисигнал збудження. Наприклад, можна реалізувати шеньковий персональний комп'ютер (PDA). Альтегенератор збудження A300 смуги верхніх частот, рнативно, такий пристрій може входити до складу що включає в себе реалізацію лінії затримки D120, іншого пристрою зв'язку, наприклад, телефонної яка приймає сигнал SD10 даних регуляризації або трубки VoIP, персонального комп'ютера, здатного відображені значення затримки SD10a, і застосопідтримувати зв'язок по стандарту VoIP, або мевує відповідний зворотний часовий зсув до вузькорежевого пристрою, здатного маршрутизувати смугового сигналу збудження S80 і/або до подателефонні або VoIP виклики. Наприклад, пристрій льшого сигналу на його основі, наприклад, згідно з варіантом здійснення можна реалізувати у гармонічно розширеного сигналу S160 або сигналу вигляді чипа або чипсету для пристрою зв'язку. У збудження S120 смуги верхніх частот. залежності від конкретного застосування, такий Додаткові реалізації широкосмугового мовного пристрій також може включати в себе такі особликодера можуть кодувати вузькосмуговий мовний вості, як аналогово-цифрове і/або цифрово 49 92341 50 аналогове перетворення мовного сигналу, схему го обмеження. Один або декілька елементів такого для здійснення підсилення і/або іншої операції пристрою можна реалізувати повністю або часткообробки мовного сигналу і/або радіочастотну схево у вигляді одного або декількох наборів команд, му для передачі і/або прийому кодованого мовного призначених для виконання на одній або декількох сигналу. фіксованих або програмованих матрицях логічних Передбачається, що варіанти здійснення моелементів (наприклад, транзисторів, вентилів), жуть включати в себе і/або використовувати одну наприклад мікропроцесорах, вбудованих процесоабо декілька інших особливостей, розкритих в порах, основних послугах IP, цифрових сигнальних передніх патентних заявках США №№ 60/667901 і процесорах, FPGA (вентильних матрицях, що про60/673965, на пріоритет яких претендує дана заявграмуються користувачем), ASSP (спеціалізованих ка. Такі особливості включають в себе видалення стандартних продуктах), і ASIC (спеціалізованих високоенергійних імпульсів малої тривалості, які інтегральних схемах). Один або декілька таких виникають у верхньому діапазоні і, по суті, відсутні елементів також можуть бути об'єднані в загальну у вузькому діапазоні. Такі особливості включають структуру (наприклад, процесор, що використовув себе фіксоване або адаптивне згладжування ється для виконання ділянок коду, відповідних представлень коефіцієнтів, наприклад LSF смуги різним елементам, в різний час, набір команд, що верхніх частот. Такі особливості включають в себе виконуються для здійснення задач, відповідних фіксоване або адаптивне перетворення форми різним елементам, в різний час, або конфігурацію шуму, пов'язаного з квантуванням представлень електронних і/або оптичних пристроїв, що здійскоефіцієнтів, наприклад LSF. Такі особливості танюють операції для різних елементів в різний час). кож включають в себе фіксоване або адаптивне Крім того, один або декілька таких елементів можзгладжування обвідної підсилення і адаптивне на використовувати для здійснення задач або випослаблення обвідної підсилення. конання інших наборів команд, які безпосередньо Вищенаведене представлення описаних варіне пов'язані з роботою пристрою, наприклад, заантів здійснення забезпечене для того, щоб фахідачі, що належить до іншої операції пристрою або вці в даній галузі могли використовувати даний системи, в яку вбудований пристрій. винахід. Можливі різні модифікації цих варіантів На Фіг. 30 показана логічна блок-схема спосоздійснення, і представлені тут загальні принципи бу МІ00, згідно з варіантом здійснення, кодування застосовні і до інших варіантів здійснення. Напричастини смуги верхніх частот мовного сигналу, що клад, варіант здійснення можна реалізувати повнімає вузькосмугову частину і частину смуги верхніх стю або частково у вигляді електронної схеми, у частот. Задача X100 обчислює набір параметрів вигляді конфігурації схем, скомпонованої на спеціфільтра, які характеризують спектральну обвідну алізованій інтегральній схемі, або у вигляді прочастини смуги верхніх частот. Задача Х200 обчисграмно-апаратного забезпечення, завантаженого в лює спектрально розширений сигнал шляхом заенергонезалежний запам'ятовуючий пристрій або стосування нелінійної функції до сигналу, отримапрограмного забезпечення, що завантажується з ного з вузькосмугової частини. Задача Х300 або на носій даних у вигляді машиннозчитуваного генерує синтезований сигнал смуги верхніх частот коду, причому такий код являє собою команди, які згідно (А) з набором параметрів фільтра і (В) сигвиконуються матрицею логічних елементів, наприналом збудження смуги верхніх частот, основаним клад, мікропроцесором або іншим блоком цифрона спектрально розширеному сигналі. Задача вої обробки сигналу. Носій даних може являти Х400 обчислює обвідну підсилення на основі співсобою матрицю елементів зберігання, наприклад відношення між (С) енергією частини смуги верхніх напівпровідникового ЗП (який може включати в частот і (D) енергією сигналу, отриманого з вузькосебе, без обмеження, динамічний або статичний смугової частини. ОЗП (оперативний ЗП), ПЗП (постійний ЗП), і/або На Фіг. 31а показана логічна блок-схема спофлеш-пам'ять), або сегнетоелектричний ЗП, магнісобу М200 генерації сигналу збудження смуги верторезистивний ЗП, ЗП на аморфних напівпровідхніх частот згідно з варіантом здійснення. Задача никах, полімерний ЗП або ЗП на основі фазових Y100 обчислює гармонічно розширений сигнал переходів; або дисковий носій, наприклад магнітшляхом застосування нелінійної функції до вузьний або оптичний диск. Термін "програмне забезкосмугового сигналу збудження, отриманого з вупечення" потрібно розуміти в значенні, що включає зькосмугової частини мовного сигналу. Задача в себе початковий код, код на мові асемблера, Y200 змішує гармонічно розширений сигнал з момашинний код, двійковий код, зашиту програму, дульованим шумовим сигналом для генерації сигмакрокод, мікрокод, один або декілька наборів або налу збудження смуги верхніх частот. На Фіг. 31b послідовностей команд, які виконуються матрицею показана логічна блок-схема способу М210 генелогічних елементів, і будь-яку комбінацію таких рації сигналу збудження смуги верхніх частот згідприкладів. но з іншим варіантом здійснення, що включає в Різні елементи реалізації генераторів збусебе задачі Y300 і Y400. Задача Y300 обчислює дження А300 і В300 смуги верхніх частот, кодера обвідну у часовому вимірюванні у вигляді розподіA100 смуги верхніх частот, декодера В200 смуги лу енергії у часі для одного з вузькосмугового сигверхніх частот, широкосмугового мовного кодера налу збудження і гармонічно розширеного сигналу. А100 і широкосмугового мовного декодера В100 Задача Y400 модулює шумовий сигнал згідно з можна реалізувати у вигляді електронних і/або обвідною у часовому вимірюванні для створення оптичних пристроїв, розміщених, наприклад, на модульованого шумового сигналу. одному і тому ж чипі або на двох або більш чипах На Фіг. 32 показана логічна блок-схема спосов чипсеті, хоч можливі і інші конфігурації без такобу М300 згідно з варіантом здійснення, декодуван 51 92341 52 ня частини смуги верхніх частот мовного сигналу, вої частини, до спектрально розширеного сигналу, що має вузькосмугову частину і частину смуги до сигналу збудження смуги верхніх частот або до верхніх частот. Задача Ζ100 приймає набір парасинтезованого сигналу смуги верхніх частот. метрів фільтра, які характеризують спектральну Варіанти здійснення також включають в себе обвідну частини смуги верхніх частот і набір коедодаткові способи мовного кодування, кодування і фіцієнтів підсилення, тих, що характеризують чадекодування, явно розкриті тут, наприклад, за досову обвідну частини смуги верхніх частот. Задача помогою описів структурних варіантів здійснення Z200 обчислює спектрально розширений сигнал таких способів. Кожний з цих способів також може шляхом застосування нелінійної функції до сигнабути матеріально реалізований (наприклад, на лу, отриманого з вузькосмугової частини. Задача одному або декількох з вищеперелічених носіїв Z300 генерує синтезований сигнал смуги верхніх даних) у вигляді одного або декількох наборів кочастот згідно (А) з набором параметрів фільтра і манд, які зчитуються і/або виконуються машиною, (В) сигналом збудження смуги верхніх частот, освключаючи матрицю логічних елементів (напринованим на спектрально розширеному сигналі. клад, процесор, мікропроцесор, мікроконтролер Задача Z400 модулює обвідну підсилення синтеабо інший кінцевий автомат). Таким чином, даний зованого сигналу смуги верхніх частот на основі винахід не передбачає обмеження вищеописанинабору коефіцієнтів підсилення. Наприклад, задами варіантами здійснення, але підлягає розгляду в ча Z400 може модулювати обвідну підсилення найширшому об'ємі, який узгоджується з принцисинтезованого сигналу смуги верхніх частот шляпами і новими ознаками, розкритими тут любим хом застосування набору коефіцієнтів підсилення чином, в тому числі в формулі винаходу, яка стадо сигналу збудження, отриманого з вузькосмугоновить частину початкового розкриття. 53 92341 54 55 92341 56 57 92341 58 59 92341 60
ДивитисяДодаткова інформація
Назва патенту англійськоюSystems, methods and wideband speech encoding
Автори англійськоюVos Kon Bernard, Kandkhadai Anantkhapadmanadkhan A.
Назва патенту російськоюСистемы, способы и устройство широкополосного речевого кодирования
Автори російськоюВос Кон Бернард, Кандхадай Анантхападманабхан А.
МПК / Мітки
МПК: G10L 21/00, G10L 19/00
Мітки: способи, мовного, системі, кодування, широкосмугового, пристрій
Код посилання
<a href="https://ua.patents.su/42-92341-sistemi-sposobi-i-pristrijj-shirokosmugovogo-movnogo-koduvannya.html" target="_blank" rel="follow" title="База патентів України">Системи, способи і пристрій широкосмугового мовного кодування</a>
Попередній патент: Похідні заміщених піридинів
Наступний патент: Курильна система зі створенням віртуальної реальності
Випадковий патент: Кришка люка оглядового колодязя