Спосіб і пристрій для кодування мовних сигналів з розщепленням смуги

Номер патенту: 92742

Опубліковано: 10.12.2010

Автори: Вос Кон Бернард, Кандхадай Анантхападманабхан А.

Є ще 47 сторінок.

Дивитися все сторінки або завантажити PDF файл.

Формула / Реферат

1. Пристрій для обробки сигналів, який містить

перший мовний кодер, виконаний з можливістю кодування мовного сигналу смуги низьких частот;

другий мовний кодер, виконаний з можливістю кодування мовного сигналу смуги високих частот; і

гребінку фільтрів, що має

(A) тракт обробки смуги низьких частот, виконаний з можливістю прийому широкосмугового мовного сигналу, що має частотний спектр щонайменше між 1000 і 6000 Гц, і формування мовного сигналу смуги низьких частот, який оснований на першій частині частотного спектра широкосмугового сигналу, причому перша частина включає в себе частину широкосмугового сигналу між 1000 і 3000 Гц, і

(B) тракт обробки смуги високих частот, виконаний з можливістю прийому широкосмугового мовного сигналу і формування мовного сигналу смуги високих частот, який оснований на другій частині частотного спектра широкосмугового сигналу,

який відрізняється тим, що

друга частина включає в себе частину широкосмугового сигналу між 4000 і 6000 Гц, і

кожний з мовного сигналу смуги низьких частот і мовного сигналу смуги високих частот оснований на третій частині частотного спектра широкосмугового сигналу, причому третя частина включає в себе частину широкосмугового сигналу між 3000 і 4000 Гц, яка має ширину щонайменше 400 Гц.

2. Пристрій за п. 1, в якому мовний сигнал смуги низьких частот включає в себе частотний спектр першої частини і частотний спектр третьої частини, а мовний сигнал смуги високих частот включає в себе частотний спектр другої частини і частотний спектр третьої частини.

3. Пристрій за п. 1, в якому мовний сигнал смуги низьких частот і мовний сигнал смуги високих частот мають різні частоти дискретизації.

4. Пристрій за п. 1, в якому сума частот дискретизації мовного сигналу смуги низьких частот і мовного сигналу смуги високих частот не перевищує частоту дискретизації широкосмугового сигналу.

5. Пристрій за п. 1, причому згаданий пристрій містить стільниковий телефон.

6. Пристрій за п. 1, в якому перший мовний кодер виконаний з можливістю кодування мовного сигналу смуги низьких частот щонайменше в кодований сигнал збудження смуги низьких частот і множину параметрів фільтра смуги низьких частот, і другий мовний кодер виконаний з можливістю формування сигналу збудження смуги високих частот на основі кодованого сигналу збудження смуги низьких частот і кодування сигналу смуги високих частот, згідно з сигналом збудження смуги високих частот, щонайменше у множину параметрів фільтра смуги високих частот.

7. Пристрій за п. 6, в якому другий мовний кодер виконаний з можливістю кодування сигналу смуги високих частот щонайменше у множину параметрів фільтра смуги високих частот і множину коефіцієнтів посилення.

8. Пристрій за п. 6, при цьому згаданий пристрій містить пристрій, сконфігурований з можливістю передачі множини пакетів, сумісних з версією Інтернет-протоколу, при цьому множина пакетів описує кодований сигнал збудження смуги низьких частот, множину параметрів фільтра смуги низьких частот і множину параметрів фільтра смуги високих частот.

9. Пристрій для обробки сигналів, який містить

гребінку фільтрів, що має (А) тракт обробки смуги низьких частот, виконаний з можливістю прийому широкосмугового мовного сигналу і формування мовного сигналу смуги низьких частот на основі низькочастотної частини широкосмугового мовного сигналу, і (В) тракт обробки смуги високих частот, виконаний з можливістю прийому широкосмугового мовного сигналу і формування мовного сигналу смуги високих частот на основі високочастотної частини широкосмугового мовного сигналу, при цьому смуга пропускання тракту обробки смуги низьких частот перекриває смугу пропускання тракту обробки смуги високих частот, причому перекриття рахують як відстань точки, в якій частота фільтра смуги високих частот падає до заданого значення, від точки, в якій частотна характеристика фільтра смуги низьких частот падає до заданого значення;

перший мовний кодер, виконаний з можливістю кодування мовного сигналу смуги низьких частот щонайменше в кодований сигнал збудження смуги низьких частот і множину параметрів фільтра смуги низьких частот; і

другий мовний кодер, виконаний з можливістю формування сигналу збудження смуги високих частот на основі кодованого сигналу збудження смуги низьких частот і кодування сигналу смуги високих частот, згідно з сигналом збудження смуги високих частот, щонайменше у множину параметрів фільтра смуги високих частот,

який відрізняється тим, що смуга пропускання тракту обробки смуги низьких частот перекриває смугу пропускання тракту обробки смуги високих частот приблизно на 400-1000 Гц.

10. Пристрій за п. 9, в якому другий мовний кодер виконаний з можливістю формування сигналу збудження смуги високих частот за допомогою застосування нелінійної функції до сигналу, який оснований на кодованому сигналі збудження смуги низьких частот, для формування спектрально розширеного сигналу, і при цьому сигнал збудження смуги високих частот оснований на спектрально розширеному сигналі.

11. Пристрій за п. 9, в якому другий мовний кодер виконаний з можливістю кодування огинаючої посилення сигналу смуги високих частот.

12. Пристрій за п. 11, в якому другий мовний кодер виконаний з можливістю формування синтезованого сигналу смуги високих частот згідно з сигналом збудження смуги високих частот і множиною параметрів фільтра смуги високих частот, і

при цьому другий мовний кодер виконаний з можливістю кодування обвідної посилення на основі синтезованого сигналу смуги високих частот.

13. Пристрій за п. 12, в якому другий кодер виконаний з можливістю кодування обвідної посилення на основі відношення між сигналом смуги високих частот і синтезованим сигналом смуги високих частот.

14. Пристрій за п. 9, в якому смуга пропускання тракту обробки смуги низьких частот перекриває смугу пропускання тракту обробки смуги високих частот щонайменше на 500 Гц.

15. Пристрій за п. 9, в якому смуга пропускання тракту обробки смуги низьких частот перекриває смугу пропускання тракту обробки смуги високих частот приблизно на 400-600 Гц.

16. Пристрій за п. 9, в якому перекриття включає в себе щонайменше частину частотного діапазону приблизно в 2000-5000 Гц.

17. Пристрій за п. 9, в якому перекриття включає в себе щонайменше частину частотного діапазону приблизно в 3000-4000 Гц.

18. Пристрій за п. 9, в якому мовний сигнал смуги низьких частот і мовний сигнал смуги високих частот мають різні частоти дискретизації.

19. Пристрій за п. 9, в якому сума частот дискретизації мовного сигналу смуги низьких частот і мовного сигналу смуги високих частот не перевищує частоту дискретизації широкосмугового сигналу.

20. Пристрій за п. 9, причому згаданий пристрій містить стільниковий телефон.

21. Пристрій за п. 9, причому згаданий пристрій містить пристрій, сконфігурований з можливістю передачі множини пакетів, сумісних з версією Інтернет-протоколу, при цьому множина пакетів описує кодований сигнал збудження смуги низьких частот, множину параметрів фільтра смуги низьких частот і множину параметрів фільтра смуги високих частот.

22. Пристрій за п. 9, в якому задане значення дорівнює 20 дБ.

23. Спосіб обробки сигналів, який містить етапи, на яких

формують мовний сигнал смуги низьких частот на основі широкосмугового мовного сигналу, що має частотний спектр щонайменше між 1000 і 6000 Гц;

кодують мовний сигнал смуги низьких частот;

формують мовний сигнал смуги високих частот на основі широкосмугового мовного сигналу; і

кодують мовний сигнал смуги високих частот;

при цьому етап формування мовного сигналу смуги низьких частот включає в себе етап, на якому формують мовний сигнал смуги низьких частот на основі (А) першої частини частотного спектра широкосмугового сигналу, при цьому перша частина включає в себе частину широкосмугового сигналу між 1000 і 2000 Гц, і (В) третьої частини частотного спектра широкосмугового сигналу,

який відрізняється тим, що

третя частина включає в себе частину широкосмугового сигналу між 2000 і 5000 Гц, яка має ширину щонайменше 400 Гц, і

етап формування мовного сигналу смуги високих частот включає в себе етап, на якому формують мовний сигнал смуги високих частот на основі (С) другої частини частотного спектра широкосмугового сигналу, при цьому друга частина включає в себе частину широкосмугового сигналу між 5000 і 6000 Гц, і (D) третьої частини частотного спектра широкосмугового сигналу.

24. Спосіб за п. 23, в якому перша частина широкосмугового сигналу включає в себе частину широкосмугового сигналу між 1000 і 3000 Гц, і

друга частина широкосмугового сигналу включає в себе частину широкосмугового сигналу між 4000 і 6000 Гц, а

третя частина широкосмугового сигналу включає в себе частину широкосмугового сигналу між 3000 і 4000 Гц, яка має ширину щонайменше 250 Гц.

25. Спосіб за п. 23, в якому мовний сигнал смуги низьких частот включає в себе частотний спектр першої частини і частотний спектр третьої частини, і

мовний сигнал смуги високих частот включає в себе частотний спектр другої частини і частотний спектр третьої частини.

26. Спосіб за п. 23, в якому мовний сигнал смуги низьких частот і мовний сигнал смуги високих частот мають різні частоти дискретизації.

27. Спосіб за п. 23, в якому сума частот дискретизації мовного сигналу смуги низьких частот і мовного сигналу смуги високих частот не перевищує частоту дискретизації широкосмугового сигналу.

28. Спосіб за п. 23, в якому перший мовний кодер виконаний з можливістю кодування мовного сигналу смуги низьких частот щонайменше в кодований сигнал збудження смуги низьких частот і множину параметрів фільтра смуги низьких частот, і

другий мовний кодер виконаний з можливістю формування сигналу збудження смуги високих частот на основі кодованого сигналу збудження смуги низьких частот і кодування сигналу смуги високих частот, згідно з сигналом збудження смуги високих частот, щонайменше у множину параметрів фільтра смуги високих частот.

29. Спосіб за п. 23, в якому другий мовний кодер виконаний з можливістю кодування сигналу смуги високих частот щонайменше у множину параметрів фільтра смуги високих частот і множину коефіцієнтів посилення.

Текст

1. Пристрій для обробки сигналів, який містить перший мовний кодер, виконаний з можливістю кодування мовного сигналу смуги низьких частот; другий мовний кодер, виконаний з можливістю кодування мовного сигналу смуги високих частот; і гребінку фільтрів, що має (A) тракт обробки смуги низьких частот, виконаний з можливістю прийому широкосмугового мовного сигналу, що має частотний спектр щонайменше між 1000 і 6000 Гц, і формування мовного сигналу смуги низьких частот, який оснований на першій частині частотного спектра широкосмугового сигналу, причому перша частина включає в себе частину широкосмугового сигналу між 1000 і 3000 Гц, і (B) тракт обробки смуги високих частот, виконаний з можливістю прийому широкосмугового мовного сигналу і формування мовного сигналу смуги високих частот, який оснований на другій частині частотного спектра широкосмугового сигналу, який відрізняється тим, що друга частина включає в себе частину широкосмугового сигналу між 4000 і 6000 Гц, і кожний з мовного сигналу смуги низьких частот і мовного сигналу смуги високих частот оснований на третій частині частотного спектра широкосмугового сигналу, причому третя частина включає в себе частину широкосмугового сигналу між 3000 і 4000 Гц, яка має ширину щонайменше 400 Гц. 2. Пристрій за п. 1, в якому мовний сигнал смуги низьких частот включає в себе частотний спектр 2 (19) 1 3 сигналу смуги високих частот на основі високочастотної частини широкосмугового мовного сигналу, при цьому смуга пропускання тракту обробки смуги низьких частот перекриває смугу пропускання тракту обробки смуги високих частот, причому перекриття рахують як відстань точки, в якій частота фільтра смуги високих частот падає до заданого значення, від точки, в якій частотна характеристика фільтра смуги низьких частот падає до заданого значення; перший мовний кодер, виконаний з можливістю кодування мовного сигналу смуги низьких частот щонайменше в кодований сигнал збудження смуги низьких частот і множину параметрів фільтра смуги низьких частот; і другий мовний кодер, виконаний з можливістю формування сигналу збудження смуги високих частот на основі кодованого сигналу збудження смуги низьких частот і кодування сигналу смуги високих частот, згідно з сигналом збудження смуги високих частот, щонайменше у множину параметрів фільтра смуги високих частот, який відрізняється тим, що смуга пропускання тракту обробки смуги низьких частот перекриває смугу пропускання тракту обробки смуги високих частот приблизно на 400-1000 Гц. 10. Пристрій за п. 9, в якому другий мовний кодер виконаний з можливістю формування сигналу збудження смуги високих частот за допомогою застосування нелінійної функції до сигналу, який оснований на кодованому сигналі збудження смуги низьких частот, для формування спектрально розширеного сигналу, і при цьому сигнал збудження смуги високих частот оснований на спектрально розширеному сигналі. 11. Пристрій за п. 9, в якому другий мовний кодер виконаний з можливістю кодування огинаючої посилення сигналу смуги високих частот. 12. Пристрій за п. 11, в якому другий мовний кодер виконаний з можливістю формування синтезованого сигналу смуги високих частот згідно з сигналом збудження смуги високих частот і множиною параметрів фільтра смуги високих частот, і при цьому другий мовний кодер виконаний з можливістю кодування обвідної посилення на основі синтезованого сигналу смуги високих частот. 13. Пристрій за п. 12, в якому другий кодер виконаний з можливістю кодування обвідної посилення на основі відношення між сигналом смуги високих частот і синтезованим сигналом смуги високих частот. 14. Пристрій за п. 9, в якому смуга пропускання тракту обробки смуги низьких частот перекриває смугу пропускання тракту обробки смуги високих частот щонайменше на 500 Гц. 15. Пристрій за п. 9, в якому смуга пропускання тракту обробки смуги низьких частот перекриває смугу пропускання тракту обробки смуги високих частот приблизно на 400-600 Гц. 16. Пристрій за п. 9, в якому перекриття включає в себе щонайменше частину частотного діапазону приблизно в 2000-5000 Гц. 17. Пристрій за п. 9, в якому перекриття включає в себе щонайменше частину частотного діапазону приблизно в 3000-4000 Гц. 92742 4 18. Пристрій за п. 9, в якому мовний сигнал смуги низьких частот і мовний сигнал смуги високих частот мають різні частоти дискретизації. 19. Пристрій за п. 9, в якому сума частот дискретизації мовного сигналу смуги низьких частот і мовного сигналу смуги високих частот не перевищує частоту дискретизації широкосмугового сигналу. 20. Пристрій за п. 9, причому згаданий пристрій містить стільниковий телефон. 21. Пристрій за п. 9, причому згаданий пристрій містить пристрій, сконфігурований з можливістю передачі множини пакетів, сумісних з версією Інтернет-протоколу, при цьому множина пакетів описує кодований сигнал збудження смуги низьких частот, множину параметрів фільтра смуги низьких частот і множину параметрів фільтра смуги високих частот. 22. Пристрій за п. 9, в якому задане значення дорівнює 20 дБ. 23. Спосіб обробки сигналів, який містить етапи, на яких формують мовний сигнал смуги низьких частот на основі широкосмугового мовного сигналу, що має частотний спектр щонайменше між 1000 і 6000 Гц; кодують мовний сигнал смуги низьких частот; формують мовний сигнал смуги високих частот на основі широкосмугового мовного сигналу; і кодують мовний сигнал смуги високих частот; при цьому етап формування мовного сигналу смуги низьких частот включає в себе етап, на якому формують мовний сигнал смуги низьких частот на основі (А) першої частини частотного спектра широкосмугового сигналу, при цьому перша частина включає в себе частину широкосмугового сигналу між 1000 і 2000 Гц, і (В) третьої частини частотного спектра широкосмугового сигналу, який відрізняється тим, що третя частина включає в себе частину широкосмугового сигналу між 2000 і 5000 Гц, яка має ширину щонайменше 400 Гц, і етап формування мовного сигналу смуги високих частот включає в себе етап, на якому формують мовний сигнал смуги високих частот на основі (С) другої частини частотного спектра широкосмугового сигналу, при цьому друга частина включає в себе частину широкосмугового сигналу між 5000 і 6000 Гц, і (D) третьої частини частотного спектра широкосмугового сигналу. 24. Спосіб за п. 23, в якому перша частина широкосмугового сигналу включає в себе частину широкосмугового сигналу між 1000 і 3000 Гц, і друга частина широкосмугового сигналу включає в себе частину широкосмугового сигналу між 4000 і 6000 Гц, а третя частина широкосмугового сигналу включає в себе частину широкосмугового сигналу між 3000 і 4000 Гц, яка має ширину щонайменше 250 Гц. 25. Спосіб за п. 23, в якому мовний сигнал смуги низьких частот включає в себе частотний спектр першої частини і частотний спектр третьої частини, і мовний сигнал смуги високих частот включає в себе частотний спектр другої частини і частотний спектр третьої частини. 5 92742 6 26. Спосіб за п. 23, в якому мовний сигнал смуги низьких частот і мовний сигнал смуги високих частот мають різні частоти дискретизації. 27. Спосіб за п. 23, в якому сума частот дискретизації мовного сигналу смуги низьких частот і мовного сигналу смуги високих частот не перевищує частоту дискретизації широкосмугового сигналу. 28. Спосіб за п. 23, в якому перший мовний кодер виконаний з можливістю кодування мовного сигналу смуги низьких частот щонайменше в кодований сигнал збудження смуги низьких частот і множину параметрів фільтра смуги низьких частот, і другий мовний кодер виконаний з можливістю формування сигналу збудження смуги високих частот на основі кодованого сигналу збудження смуги низьких частот і кодування сигналу смуги високих частот, згідно з сигналом збудження смуги високих частот, щонайменше у множину параметрів фільтра смуги високих частот. 29. Спосіб за п. 23, в якому другий мовний кодер виконаний з можливістю кодування сигналу смуги високих частот щонайменше у множину параметрів фільтра смуги високих частот і множину коефіцієнтів посилення. Мовний зв'язок по комутованій телефонній мережі загального користування (PSTN) традиційно обмежений по смузі пропускання в частотному діапазоні 300-3400КГц. Нові мережі для мовного зв'язку, такі як стільникова телефонія і "мова-поІР" (Інтернет-протокол, VoIP), можуть не мати такі ж обмеження по смузі пропускання, і можуть бути переважними для того, щоб передавати і приймати мовний зв'язок, який включає в себе широкосмуговий частотний діапазон, по таких мережах. Наприклад, може бути бажаним підтримувати діапазон звукових частот, який йде вниз до 50Гц і/або вгору до 7 або 8КГц. Також може бути бажаним підтримувати інші додатки, наприклад, високоякісний аудіо- або аудіо/відеоконференцзв'язок, які можуть мати звуковий мовний вміст в діапазонах за межами традиційних обмежень PSTN. Розширення діапазону, що підтримується за допомогою мовного кодера, до більш високих частот дозволяє підвищити розбірливість. Наприклад, інформація, яка розрізнює фрикативні звуки, такі як "s" і "f", в більшій мірі представлена у високих частотах. Високосмугове розширення також дозволяє поліпшити інші якості мови, такі як ефект присутності. Наприклад, навіть вокаліований голосний звук може мати спектральну енергію набагато більше обмеження PSTN. Один підхід до широкосмугового кодування мови приводить до масштабування методики вузькосмугового кодування мови (наприклад, сконфігурованої так, щоб кодувати діапазон 0-4КГц), щоб покривати широкосмуговий спектр. Наприклад, мовний сигнал може дискретизуватися на більш високій швидкості, щоб включати в себе компоненти на високих частотах, і методика вузькосмугового кодування може бути переконфігурована, щоб використовувати більше число коефіцієнтів фільтра, щоб представляти цей широкосмуговий сигнал. Методики вузькосмугового кодування, такі як CELP (кодування методом лінійного прогнозу з кодовим збудженням), є обчислювальноємними, проте, і широкосмуговий CELP-кодер може витрачати дуже велике число циклів обробки, щоб бути практичним для більшості мобільних і інших вкладених додатків. Кодування всього спектра широкосмугового сигналу до необхідної якості за допомогою цієї методики також може призводити до недопустимо великого збільшення смуги пропус кання. Більше того, перекодування цього закодованого сигналу повинно вимагатися до того, як навіть його вузькосмугова частина може бути передана і/або декодована за допомогою системи, яка підтримує тільки вузькосмугове кодування. Інший підхід до широкосмугового кодування мови приводить до екстраполювання огинаючої високосмугового спектра з кодованої огинаючої вузькосмугового спектра. Хоч цей підхід може бути реалізований без якого-небудь збільшення смуги пропускання і без необхідності перекодування, приблизна спектральна огинаюча або формантна структура високосмугової частини мовного сигналу, як правило, не може бути передбачена точно із спектральної огинаючої вузькосмугової частини. Може бути бажаним реалізувати широкосмугове кодування мови таким чином, що щонайменше вузькосмугова частина кодованого сигналу може бути відправлена за допомогою вузькосмугового каналу (такого як PSTN-канал) без перекодування або якої-небудь іншої суттєвої модифікації. Ефективність розширення широкосмугового кодування також може бути бажаною, наприклад, щоб не допустити суттєвого зниження числа користувачів, які можуть обслуговуватися в таких додатках, як безпровідний стільниковий телефонний зв'язок і широкомовна передача по провідних і безпровідних каналах. У одному варіанті здійснення пристрій включає в себе перший мовний кодер, виконаний з можливістю кодування мовного сигналу смуги низьких частот (низькосмугового мовного сигналу); другий мовний кодер, виконаний з можливістю кодування мовного сигналу смуги високих частот (високосмугового мовного сигналу); і гребінку фільтрів, що має (А) тракт обробки смуги низьких частот (тракт низькосмугової обробки), виконаний з можливістю прийому широкосмугового мовного сигналу, що має частотний спектр (частотний вміст) щонайменше між 1000 і 6000Гц, і формування мовного сигналу смуги низьких частот, і (В) тракт обробки смуги високих частот (тракт високосмугової обробки), виконаний з можливістю прийому широкосмугового мовного сигналу і формування мовного сигналу смуги високих частот. Мовний сигнал смуги низьких частот заснований на першій частині частотного спектра широкосмугового сигналу, причому перша частина включає в себе частину 7 широкосмугового сигналу між 1000 і 2000Гц. Мовний сигнал смуги високих частот заснований на другій частині частотного спектра широкосмугового сигналу, причому друга частина включає в себе частину широкосмугового сигналу між 5000 і 6000Гц. Кожний з мовного сигналу смуги низьких частот і мовного сигналу смуги високих частот заснований на третій частині частотного спектра широкосмугового сигналу, причому третя частина включає в себе частину широкосмугового сигналу між 2000 і 5000Гц, яка має ширину щонайменше 250Гц. У іншому варіанті здійснення пристрій включає в себе гребінку фільтрів, що має (А) тракт обробки смуги низьких частот, виконаний з можливістю прийому широкосмугового мовного сигналу і формування мовного сигналу смуги низьких частот на основі низькочастотної частини широкосмугового мовного сигналу, і (В) тракт обробки смуги високих частот, виконаний з можливістю прийому широкосмугового мовного сигналу і формування мовного сигналу смуги високих частот на основі високочастотної частини широкосмугового мовного сигналу. Смуга пропускання тракту обробки смуги низьких частот перекриває смугу пропускання тракту обробки смуги високих частот. Пристрій також включає в себе перший мовний кодер, виконаний з можливістю кодування мовного сигналу смуги низьких частот щонайменше в кодований сигнал збудження смуги низьких частот (низькосмуговий сигнал збудження) і множину параметрів фільтра смуги низьких частот (фільтра нижніх частот); і другий мовний кодер, виконаний з можливістю формування сигналу збудження смуги високих частот (високосмугового сигналу збудження) на основі кодованого сигналу збудження смуги низьких частот і кодування сигналу смуги високих частот, згідно з сигналом збудження смуги високих частот, щонайменше у множину параметрів фільтра смуги високих частот (фільтра верхніх частот). У іншому варіанті здійснення спосіб обробки сигналів включає в себе етапи, на яких формують мовний сигнал смуги низьких частот на основі широкосмугового мовного сигналу, що має частотний спектр щонайменше між 1000 і 6000Гц; кодують мовний сигнал смуги низьких частот; формують мовний сигнал смуги високих частот на основі широкосмугового мовного сигналу; і кодують мовний сигнал смуги високих частот. У цьому способі етап формування мовного сигналу смуги низьких частот включає в себе етап, на якому формують мовний сигнал смуги низьких частот на основі (А) першої частини частотного спектра широкосмугового сигналу, при цьому перша частина включає в себе частину широкосмугового сигналу між 1000 і 2000Гц, і (В) третьої частини частотного спектра широкосмугового сигналу, при цьому третя частина включає в себе частину широкосмугового сигналу між 2000 і 5000Гц, яка має ширину щонайменше 250Гц. У цьому способі етап формування мовного сигналу смуги високих частот включає в себе етап, на якому формують мовний сигнал смуги високих частот на основі (С) другої частини частотного спектра широкосмугового сигналу, при цьому друга частина включає в себе частину ши 92742 8 рокосмугового сигналу між 5000 і 6000Гц, і (D) третьої частини частотного спектра широкосмугового сигналу. Фіг.1а ілюструє блок-схему широкосмугового мовного кодера А100 згідно з варіантом здійснення. Фіг.1b ілюструє блок-схему реалізації А102 широкосмугового мовного кодера А100. Фіг.2а ілюструє блок-схему широкосмугового мовного декодера В100 згідно з варіантом здійснення. Фіг.2b ілюструє реалізацію В102 широкосмугового мовного декодера В100. Фіг.3а ілюструє блок-схему реалізації Α112 гребінки А110 фільтрів. Фіг.3b ілюструє блок-схему реалізації В122 гребінки В120 фільтрів. Фіг.4а ілюструє охоплення смуги пропускання по смугах низьких і високих частот для одного прикладу гребінки А110 фільтрів. Фіг.4b ілюструє охоплення смуги частот по смугах низьких і високих частот для іншого прикладу гребінки А110 фільтрів. Фіг.4с ілюструє блок-схему реалізації А114 гребінки А112 фільтрів. Фіг.4d ілюструє блок-схему реалізації В124 гребінки В122 фільтрів. Фіг.5а ілюструє приклад графіка частоти і логарифмічної амплітуди для мовного сигналу. Фіг.5b ілюструє блок-схему базової системи кодування з лінійним прогнозом. Фіг.6 ілюструє блок-схему реалізації А122 вузькосмугового кодера А120. Фіг.7 ілюструє блок-схему реалізації В112 вузькосмугового декодера В110. Фіг.8а ілюструє приклад графіка частоти і логарифмічної амплітуди для залишкового сигналу вокалізованої мови. Фіг.8b ілюструє приклад графіка часу і логарифмічної амплітуди для залишкового сигналу вокалізованої мови. Фіг.9 ілюструє блок-схему базової системи кодування з лінійним прогнозом, яка також виконує довгостроковий прогноз. Фіг.10 ілюструє блок-схему реалізації А202 кодера А200 смуги високих частот (високосмугового кодера А200). Фіг.11 ілюструє блок-схему реалізації А302 генератора А300 збудження смуги високих частот (високосмугового генератора А300 збудження). Фіг.12 ілюструє блок-схему реалізації А402 розширювача А400 спектра. Фіг.12а ілюструє графіки спектра сигналу в різних точках в одному прикладі операції розширення спектра. Фіг.12b ілюструє графіки спектра сигналу в різних точках в іншому прикладі операції розширення спектра. Фіг.13 ілюструє блок-схему реалізації A304 генератора A302 збудження смуги високих частот (високосмугового генератора А302 збудження). Фіг.14 ілюструє блок-схему реалізації A306 генератора A302 збудження смуги високих частот (високосмугового генератора A302 збудження). Фіг.15 ілюструє блок-схему послідовності опе 9 рацій задачі (програмного модуля) Τ100 обчислення огинаючої. Фіг.16 ілюструє блок-схему реалізації 492 об'єднувача 490. Фіг.17 ілюструє підхід до обчислення показника періодичності сигналу S30 смуги високих частот (високосмугового сигналу S30). Фіг.18 ілюструє блок-схему реалізації A312 генератора A302 збудження смуги високих частот (високосмугового генератора А302 збудження). Фіг.19 ілюструє блок-схему реалізації A314 генератора А302 збудження смуги високих частот (високосмугового генератора А302 збудження). Фіг.20 ілюструє блок-схему реалізації A316 генератора А302 збудження смуги високих частот (високосмугового генератора А302 збудження). Фіг.21 ілюструє блок-схему послідовності операцій задачі Т200 обчислення посилення. Фіг.22 ілюструє блок-схему послідовності операцій для реалізації Т210 задачі Т200 обчислення посилення. Фіг.23а ілюструє схему функції кадрування. Фіг.23b ілюструє застосування функції кадрування, показаної на Фіг.23а, до субкадрів мовного сигналу. Фіг.24 ілюструє блок-схему реалізації В202 декодера В200 смуги високих частот (високосмугового декодера В200). Фіг.25 ілюструє блок-схему реалізації AD10 широкосмугового мовного кодера А100. Фіг.26а ілюструє схематичне представлення реалізації D122 лінії D120 затримки. Фіг.26b ілюструє схематичне представлення реалізації D124 лінії D120 затримки. Фіг.27 ілюструє схематичне представлення реалізації D130 лінії D120 затримки. Фіг.28 ілюструє блок-схему реалізації AD12 широкосмугового мовного кодера AD10. Фіг.29 ілюструє блок-схему послідовності операцій способу обробки MD100 сигналів згідно з варіантом здійснення. Фіг.30 ілюструє блок-схему послідовності операцій способу Μ100 згідно з варіантом здійснення. Фіг.31а ілюструє блок-схему послідовності операцій способу М200 згідно з варіантом здійснення. Фіг.31b ілюструє блок-схему послідовності операцій для реалізації М210 способу М200. Фіг.32 ілюструє блок-схему послідовності операцій способу М300 згідно з варіантом здійснення. Фіг.33-36b показують частотну і імпульсну характеристики для операцій фільтрації, показаних на Фіг.4с. Фіг.37а-39b показують частотну і імпульсну характеристики для операцій фільтрації, показаних на Фіг.4d. На кресленнях і в прикладеному описі однакові позначення посилань посилаються на ті ж або аналогічні елементи або сигнали. Описані в даному документі варіанти здійснення включають в себе системи, способи і пристрої, які можуть бути сконфігуровані так, щоб надавати розширення для вузькосмугового мовного сигналу, щоб підтримувати передачу і/або зберігання широкосмугових мовних сигналів при збіль 92742 10 шенні пропускної здатності тільки до 800-1000 біт/с (бітів за секунду). Потенційні переваги цих реалізацій включають в себе вбудоване кодування, щоб підтримувати сумісність з вузькосмуговими системами, відносний простий розподіл і перерозподіл бітів між каналами вузькосмугового і високосмугового кодування, виключення обчислювальноємної операції широкосмугового синтезу і підтримка низької частоти дискретизації для сигналів, які повинні оброблятися за допомогою обчислювальноємних процедур кодування форми сигналів. Якщо не обмежений в явній формі контекстом, термін "обчислення" використовується в даному документі, щоб позначати будь-яке зі своїх звичайних значень, наприклад, розрахунок, формування і вибір зі списку значень. Якщо термін "що містить" використовується в даному описі і формулі винаходу, він не виключає інших елементів або операцій. Термін "А заснований на В" використовується для того, щоб означати будь-яке зі своїх звичайних значень, в тому числі випадки (і) "А дорівнює В" і (іі) "А заснований щонайменше на В". Термін "Інтернет-протокол" включає в себе версію 4, як описано в IETF (Інженерна група з розвитку Інтернету) RFC (Робочі пропозиції) 791, і подальші версії, такі як версія 6. Фіг.1а ілюструє блок-схему широкосмугового мовного кодера А100 згідно з варіантом здійснення. Гребінка А110 фільтрів сконфігурована таким чином, щоб фільтрувати широкосмуговий мовний сигнал S10, щоб формувати вузькосмуговий сигнал S20 і високосмуговий сигнал S30. Вузькосмуговий кодер А120 виконаний з можливістю кодувати вузькосмуговий сигнал S20, щоб формувати параметри S40 вузькосмугового (NB) фільтра і вузькосмуговий залишковий сигнал S50. Як детальніше описано в даному документі, вузькосмуговий кодер А120 в типовому варіанті виконаний з можливістю формувати параметри S40 вузькосмугового фільтра і кодований вузькосмуговий сигнал S50 збудження як індекси таблиці кодування або в іншій квантованій формі. Високосмуговий кодер А200 виконаний з можливістю кодувати високосмуговий сигнал S30 згідно з інформацією в кодованому вузькосмуговому сигналі S50 збудження, щоб сформувати параметри S60 високосмугового кодування. Як детально описується в даному документі, високосмуговий кодер А200 в типовому варіанті виконаний з можливістю формувати параметри S60 високосмугового кодування як індекси таблиці кодування або в іншій квантованій формі. Один конкретний приклад широкосмугового мовного кодера А100 виконаний з можливістю кодувати широкосмуговий мовний сигнал S10 на швидкості приблизно 8,55Кбіт/с (кілобіт за секунду), при цьому приблизно 7,55Кбіт/с використовуються для параметрів S40 вузькосмугового фільтра і кодованого вузькосмугового сигналу збудження S50, а приблизно 1Кбіт/с використовується для параметрів S60 високосмугового кодування. Може бути бажаним комбінувати кодовані вузькосмугові і високосмугові сигнали в один потік бітів. Наприклад, може бути бажаним мультиплексувати кодовані сигнали разом для передачі (на 11 приклад, по провідному, оптичному або безпровідному каналу передачі) або для зберігання як кодованого широкосмугового мовного сигналу. Фіг.1b ілюструє блок-схему реалізації А102 широкосмугового мовного кодера А100, який включає в себе мультиплексор А130, виконаний з можливістю комбінувати параметри S40 вузькосмугового фільтра, кодований вузькосмуговий сигнал S50 збудження і параметри S60 високосмугового фільтра в мультиплексований сигнал S70. Пристрій, що включає в себе кодер А102, також може включати в себе схему, сконфігуровану так, щоб передавати мультиплексований сигнал S70 в канал передачі, такий як провідний, оптичний або безпровідний канал. Цей пристрій також може бути сконфігурований так. щоб виконувати одну або більше операцій канального кодування з сигналом, таких як кодування з корекцією помилок (наприклад, узгоджене по швидкості згорткове кодування) і/або кодування з виявленням помилок (наприклад, кодування циклічним надмірним кодом), і/або кодування одного або більше рівнів мережних протоколів (наприклад, Ethernet (Езернет), TCP/IP, cdma2000). Може бути бажаним сконфігурувати мультиплексор А130 так, щоб вбудовувати кодований вузькосмуговий сигнал (що включає в себе параметри S40 вузькосмугового фільтра і кодований вузькосмуговий сигнал S50 збудження) як розділюваний субпотік мультиплексованого сигналу S70, з тим щоб кодований вузькосмуговий сигнал міг бути відновлений і декодований незалежно від іншої частини мультиплексованого сигналу S70, такого як високосмуговий і/або низькосмуговий сигнал. Наприклад, мультиплексований сигнал S70 може бути скомпонований таким чином, що кодований вузькосмуговий сигнал може бути відновлений за допомогою відсікання параметрів S60 високосмугового фільтра. Одна потенційна перевага такої ознаки полягає в тому, щоб уникати необхідності перекодування кодованого широкосмугового сигналу до передачі його в систему, яка підтримує декодування вузькосмугового сигналу, але не підтримує декодування високосмугової частини. Фіг.2а - це блок-схема широкосмугового мовного декодера В100 згідно з варіантом здійснення. Вузькосмуговий декодер В110 виконаний з можливістю кодувати параметри S40 вузькосмугового фільтра і декодований вузькосмуговий сигнал S50 збудження, щоб формувати вузькосмуговий сигнал S90. Високосмуговий декодер В200 виконаний з можливістю декодувати параметри S60 високосмугового кодування згідно з вузькосмуговим сигналом S80 збудження на основі кодованого вузькосмугового сигналу S50 збудження, щоб сформувати високосмуговий сигнал S100. У цьому прикладі вузькосмуговий декодер В110 виконаний з можливістю надавати вузькосмуговий сигнал S80 збудження у високосмуговий декодер В200. Гребінка В120 фільтрів сконфігурована так, щоб комбінувати вузькосмуговий сигнал S90 і високосмуговий сигнал S100, щоб формувати широкосмуговий мовний сигнал S110. Фіг.2b - це блок-схема реалізації В102 широко 92742 12 смугового мовного декодера В100, який включає в себе демультиплексор В130, виконаний з можливістю формувати кодовані сигнали S40, S50 і S60 з мультиплексованого сигналу S70. Пристрій, що включає в себе декодер В102, може включати в себе схему, сконфігуровану так, щоб приймати мультиплексований сигнал S70 з каналу передачі, такого як провідний, оптичний або безпровідний канал. Цей пристрій також може бути сконфігурований так, щоб виконувати одну або більше операцій канального декодування з сигналом, таких як декодування з корекцією помилок (наприклад, узгоджене по швидкості згорткове декодування) і/або декодування з виявленням помилок (наприклад, декодування циклічним надмірним кодом), і/або декодування одного або більше рівнів мережних протоколів (наприклад, Ethernet, TCP/IP, cdma2000). Гребінка Α110 фільтрів сконфігурована так, щоб фільтрувати вхідний сигнал згідно зі схемою розщеплення смуги, щоб формувати низькочастотний піддіапазон і високочастотний піддіапазон. Залежно від проектних критеріїв конкретного додатку, вихідні піддіапазони можуть мати рівні або нерівні смуги пропускання і можуть бути перекривними або неперекривними. Конфігурація гребінки А110 фільтрів, яка формує більше двох піддіапазонів, також можлива. Наприклад, ця гребінка фільтрів може бути сконфігурована так, щоб формувати один або більше низькосмугових сигналів, які включають в себе компоненти в частотному діапазоні нижче частотного діапазону вузькосмугового сигналу S20 (наприклад, діапазону 50-300Гц). Також можна сконфігурувати цю гребінку фільтрів таким чином, щоб формувати один або більше додаткових високосмугових сигналів, які включають в себе компоненти в частотному діапазоні вище частотного діапазону високосмугового сигналу S30 (наприклад, діапазону 14-20, 16-20 або 16-32КГц). У цьому випадку широкосмуговий мовний кодер А100 може бути реалізований таким чином, щоб кодувати цей сигнал або сигнали окремо, і мультиплексор А130 може бути виконаний з можливістю включати додатковий кодований сигнал або сигнали в мультиплексований сигнал S70 (наприклад, як розділювану частину). Фіг.3а ілюструє блок-схему реалізації А112 гребінки А110 фільтрів, яка сконфігурована так, щоб формувати сигнали двох піддіапазонів, що мають менші частоти дискретизації. Гребінка А110 фільтрів виконана з можливістю приймати широкосмуговий мовний сигнал S10, що має високочастотну (або високосмугову) частину і низькочастотну (або низькосмугову) частину. Гребінка А112 фільтрів включає в себе тракт низькосмугової обробки, виконаний з можливістю приймати широкосмуговий мовний сигнал S10 і формувати вузькосмуговий мовний сигнал S20, і тракт високосмугової обробки, виконаний з можливістю приймати широкосмуговий мовний сигнал S10 і формувати високосмуговий мовний сигнал S30. Низькочастотний фільтр 110 (фільтр нижніх частот) фільтрує широкосмуговий мовний сигнал S10, щоб пропускати вибраний низькочастотний піддіапазон, а високочастотний фільтр (фільтр верхніх частот) 130 фі 13 льтрує широкосмуговий мовний сигнал S10, щоб пропускати вибраний високочастотний піддіапазон. Оскільки сигнали обох піддіапазонів мають більш вузьку смугу пропускання, ніж широкосмуговий мовний сигнал S10, їх частоти дискретизації можуть бути знижені в деякій мірі без втрати інформації. Знижувальний дискретизатор 120 знижує частоту дискретизації низькочастотного сигналу згідно з необхідним коефіцієнтом проріджування (наприклад, за допомогою видалення вибірок сигналу і/або заміни вибірок середніми значеннями), а знижувальний дискретизатор 140 аналогічно знижує частоту дискретизації сигналу верхніх частот згідно з іншим необхідним коефіцієнтом проріджування. Фіг.3b ілюструє блок-схему відповідної реалізації В122 гребінки В120 фільтрів. Підвищувальний дискретизатор 150 підвищує частоту дискретизації вузькосмугового сигналу S90 (наприклад, за допомогою заповнення нулями і/або за допомогою дублювання вибірок), і низькочастотний фільтр 160 фільтрує сигнал з підвищеною дискретизацією, щоб пропускати тільки низькосмугову частину (наприклад, щоб уникнути накладання спектрів). Аналогічно, підвищувальний дискретизатор 170 збільшує частоту дискретизації високосмугового сигналу S100, а високочастотний фільтр 180 фільтрує сигнал з підвищеною дискретизацією, щоб пропускати тільки високосмугову частину. Сигнали двох смуг пропускання потім підсумовуються, щоб сформувати широкосмуговий мовний сигнал S110. У деяких реалізаціях декодера В100 гребінка В120 фільтрів сконфігурована так, щоб формувати зважену суму сигналів двох смуг пропускання згідно з одним або більше ваговими коефіцієнтами, прийнятими і/або обчисленими за допомогою високосмугового декодера В200. Конфігурація гребінки В120 фільтрів, яка комбінує сигнали більше ніж двох смуг пропускання, також можлива. Кожний з фільтрів 110, 130, 160, 180 може бути реалізований як фільтр з кінцевою імпульсною характеристикою (FIR) або як фільтр з нескінченною імпульсною характеристикою (IIR). Частотні характеристики фільтрів 110 і 130 кодера можуть мати симетричні перехідні області або перехідні області несхожої форми між смугою режекції і смугою пропускання. Аналогічно, частотні характеристики фільтрів 160 і 180 декодера можуть мати симетричні перехідні області або перехідні області несхожої форми між смугою режекції і смугою пропускання. Може бути бажаним, але не обов'язковим реалізувати фільтр 110 низьких частот з такою ж характеристикою, як і у фільтра 160 низьких частот, і реалізувати фільтр 130 високих частот з такою ж характеристикою, як і у фільтра 180 високих частот. У одному прикладі дві пари 110, 130 і 160, 180 фільтрів є гребінками квадратурних дзеркальних фільтрів (QMF), при цьому пара 110, 130 фільтрів має такі ж коефіцієнти, що і пара 160, 180 фільтрів. У типовому прикладі низькочастотний фільтр 110 має смугу пропускання, яка включає в себе обмежений PSTN-діапазон в 300-3400Гц (наприклад, смугу від 0 до 4КГц). Фіг.4а і 4b ілюструють 92742 14 відносні смуги пропускання широкосмугового мовного сигналу S10, вузькосмугового сигналу S20 і високосмугового сигналу S30 в двох різних прикладах реалізації. У обох з цих прикладів широкосмуговий мовний сигнал S10 має частоту дискретизації в 16КГц (представляючи частотні компоненти в діапазоні 0-8КГц), а вузькосмуговий сигнал S20 має частоту дискретизації в 8КГц (представляючи частотні компоненти в діапазоні 0-4КГц). У прикладі на Фіг.4а немає суттєвого перекриття між двома піддіапазонами. Високосмуговий сигнал S30, як показано в даному прикладі, може бути одержаний за допомогою високочастотного фільтра 130 зі смугою пропускання в 4-8КГц. У цьому випадку може бути бажаним знизити частоту дискретизації до 8КГц за допомогою зниження дискретизації фільтрованого сигналу на коефіцієнт два. Ця операція, яка, як очікується, може суттєво знизити обчислювальну складність додаткових операцій обробки сигналу, зменшує енергію смуги пропускання до діапазону в 0-4КГц без втрати інформації. У альтернативному прикладі за Фіг.4b верхні і нижні піддіапазони мають помітне перекриття, так що область 3,5-4КГц описується за допомогою сигналів обох піддіапазонів. Високосмуговий сигнал S30, як показано в даному прикладі, може бути одержаний за допомогою високочастотного фільтра 130 зі смугою пропускання в 3,5-7КГц. У цьому випадку може бути бажаним знизити частоту дискретизації до 7КГц за допомогою знижувальної дискретизації фільтрованого сигналу на коефіцієнт 16/7. Ця операція, яка, як очікується, може суттєво знизити обчислювальну складність додаткових операцій обробки сигналу, зменшує енергію смуги пропускання до діапазону 0-3,5КГц без втрати інформації. У типовій телефонній трубці для телефонного зв'язку один або більше перетворювачів (тобто мікрофон і навушник або динамік) мають значною мірою недостатню характеристику в частотному діапазоні 7-8КГц. У прикладі за Фіг.4b частина широкосмугового мовного сигналу S10 між 7 і 8КГц не включена в кодований сигнал. Інші конкретні приклади високочастотного фільтра 130 мають смуги пропускання в 3,5-7,5КГц і 3,5-8КГц. У деяких реалізаціях забезпечення перекриття між піддіапазонами, як в прикладі за Фіг.4b, дає можливість використання низькочастотного і/або високочастотного фільтра, що має плавний спад в перекривній області. Ці фільтри в типовому варіанті простіше проектувати, вони менш обчислювально складні і/або вносять меншу затримку, ніж фільтри з більш різкими або "крутими" характеристиками. Фільтри, що мають різкі перехідні області, часто мають більш високі бічні пелюстки (які можуть приводити до накладання спектрів), ніж фільтри аналогічного порядку, які мають плавний спад. Фільтри, що мають різкі перехідні області, також можуть мати імпульсні характеристики великої тривалості, які можуть приводити до ревербуючих перешкод. Для реалізацій гребінок фільтрів, які мають один або більше IIR-фільтрів, що надають плавний спад в перекривній області, можна дозволити використання фільтра або фільтрів, полюси 15 яких знаходяться далі від одиничної окружності, що може бути важливим для того, щоб забезпечувати стабільну реалізацію з фіксованою комою. Перекриття піддіапазонів надає плавне сполучення смуги низьких частот і смуги високих частот, що може приводити до менших чутних перешкод, зниження накладання спектрів і/або менш помітного переходу від однієї смуги до іншої. Більше того, ефективність кодування вузькосмугового кодера А120 (наприклад, кодера форми сигналів) може падати з підвищенням частоти. Наприклад, якість кодування вузькосмугового кодера може знижуватися при низьких швидкостях передачі бітів, особливо при наявності фонового шуму. У цих випадках забезпечення перекриття піддіапазонів дозволяє підвищувати якість частотних компонентів, що відтворюються в перекривній області. Крім того, перекриття піддіапазонів забезпечує плавне сполучення смуги низьких частот і смуги високих частот, що може приводити до менших чутних перешкод, зниження накладання спектрів і/або менш помітного переходу від однієї смуги до іншої. Ця ознака може бути особливо бажаною для реалізації, в якій вузькосмуговий кодер А120 і високосмуговий кодер А200 функціонують згідно з різними методологіями кодування. Наприклад, різні методики кодування можуть формувати сигнали, які звучать трохи по-різному. Кодер, який кодує спектральну огинаючу в формі індексів таблиці кодування, може формувати сигнал, що має звук, відмінний від звуку кодера, який кодує замість цього амплітудний спектр. Кодер часової області (наприклад, кодер з імпульсно-кодової модуляції, РСМ) може формувати сигнал, що має звук, відмінний від звуку кодера частотної області. Кодер, який кодує сигнал з представленням спектральної огинаючої і відповідного залишкового сигналу, може формувати сигнал, що має звук, відмінний від звуку кодера, який кодує сигнал тільки з представленням спектральної огинаючої. Кодер, який кодує сигнал як представлення його форми, може формувати виведення, що має звук, відмінний від звуку синусоїдального кодера. У цих випадках використання фільтрів, що мають різкі перехідні області, щоб задавати неперекривні піддіапазони, може приводити до раптового і перцепційно помітного переходу між піддіапазонами в синтезованому широкосмуговому сигналі. Хоч гребінки QMF-фільтрів, що мають доповнюючі перекривні частотні характеристики, часто використовуються в піддіапазонних методиках, такі фільтри не придатні щонайменше для деяких реалізацій широкосмугового кодування, описаних в даному документі. Гребінка QMF-фільтрів в код ері сконфігурована так, щоб створювати значну міру накладання спектрів, яке компенсується у відповідній гребінці QMF-фільтрів в декодері. Таке компонування може бути непридатним для варіанта застосування, в якому сигнал піддається значній величині спотворення між гребінками фільтрів, оскільки спотворення може знижувати ефективність властивості компенсації накладання спектрів. Наприклад, варіанти застосування, що описуються в даному документі, включають в себе реалізації кодування, сконфігуровані так, щоб функціонувати 92742 16 при дуже низьких швидкостях передачі бітів. Як наслідок дуже низької швидкості передачі бітів, декодований сигнал з великою часткою імовірності є значною мірою спотвореним в порівнянні з вихідним сигналом, так що використання гребінок QMF-фільтрів може приводити до некомпенсованого накладання спектрів. Варіанти застосування, які використовують гребінки QMF-фільтрів, в типовому варіанті мають більш високі швидкості передачі бітів (наприклад, більше 12Кбіт/с для AMR і 64Кбіт/с для G.722). Додатково, кодер може бути виконаний з можливістю формувати синтезований сигнал, який перцепційно аналогічний вихідному сигналу, але який фактично значно відрізняється від вихідного сигналу. Наприклад, кодер, який витягує високосмугове збудження з вузькосмугового залишку, як описано в даному документі, може формувати такий сигнал, оскільки фактичний високосмуговий залишок може повністю бути відсутнім в декодованому сигналі. Використання гребінок QMFфільтрів в цих додатках може приводити до значної міри спотворення, що викликається за допомогою некомпенсованого накладання спектрів. Величина спотворення, що викликається за допомогою QMF-накладання спектрів, може бути знижена, якщо порушуваний піддіапазон вузький, оскільки ефект від накладання спектрів обмежений смугою пропускання, яка дорівнює ширині піддіапазону. Наприклад, як описано в даному документі, кожний піддіапазон включає в себе приблизно половину широкосмугової смуги пропускання, проте, спотворення, що викликається за допомогою некомпенсованого накладання спектрів, може порушувати значну частину сигналу. Якість сигналу може також порушуватися за допомогою розміщення частотного діапазону, в якому виникає некомпенсоване накладання спектрів. Наприклад, спотворення, що створюється поруч з центром широкосмугового мовного сигналу (наприклад, між 3 і 4КГц), може бути набагато більш небажаним, ніж спотворення, яке виникає поруч з границею сигналу (наприклад, вище 6КГц). Хоч характеристики фільтрів гребінки QMFфільтрів тісно пов'язані одна з одною, низькосмугові і високосмугові тракти гребінок А110 і В120 фільтрів можуть бути сконфігуровані так, щоб мати спектри, які повністю не пов'язані, не враховуючи перекриття двох піддіапазонів. Ми задаємо перекриття двох піддіапазонів як відстань від точки, в якій частотна характеристика високосмугового фільтра падає до -20 дБ, до точки, в якій частотна характеристика низькосмугового фільтра падає до -20 дБ. У різних прикладах гребінки А110 і/або В120 фільтрів це перекриття варіюється від приблизно 200Гц до приблизно 1КГц. Діапазон від приблизно 400 до приблизно 600Гц може представляти необхідний компроміс між ефективністю кодування і перцепційною плавністю. У одному конкретному прикладі, як згадувалося вище, перекриття складає порядку 500Гц. Може бути бажаним реалізувати гребінку А112 і/або В122 фільтрів, щоб виконати операції, проілюстровані на Фіг.4а і 4b, в декілька стадій. Наприклад, Фіг.4с ілюструє блок-схему реалізації А114 17 гребінки А112 фільтрів, яка виконує функціональний еквівалент операцій високочастотної фільтрації і знижувальної дискретизації, використовуючи набір з інтерполяції, повторної дискретизації і проріджування, і інших операцій. Таку реалізацію може бути простіше спроектувати, і/або вона може надавати можливість повторного використання блоків логіки і/або коду. Наприклад, один функціональний блок може бути використаний для того, щоб виконувати операції проріджування до 14КГц і проріджування до 7КГц, як показано на Фіг.4с. Операція обернення спектра може бути реалізована за допомогою множення сигналу на функцію еin або послідовність (-1)n, значення якої чергуються між +1 і -1. Операція формування спектра може бути реалізована як фільтр нижніх частот, виконаний з можливістю сформувати сигнал, щоб одержати необхідну загальну характеристику фільтра. Фіг.33, 34а, 34b і 35а показують частотну і імпульсну характеристики для прикладів здійснення, відповідно, низькочастотного фільтра, інтерполяції до 34КГц, передискретизації до 28КГц і проріджування до 14КГц, як показано на Фіг.4с. Фіг.35b показує об'єднані частотну і імпульсну характеристики для таких варіантів здійснення при інтерполяції до 34КГц, передискретизації до 28КГц і проріджування до 14КГц. Фіг.36а і 36b показують частотну і імпульсну характеристики для прикладів здійснення, відповідно, проріджування до 7КГц і операції формування спектра, як показано на Фіг.4с. Потрібно зазначити, що як наслідок операції обернення спектра, спектр високосмугового сигналу S30 міняється на протилежний. Подальші операції в кодері і відповідному декодері можуть бути сконфігуровані належним чином. Наприклад, високосмуговий генератор A300 збудження, описаний в даному документі, може бути виконаний з можливістю формувати сигнал S120 високосмугового збудження, який також має спектрально обернену форму. Фіг.4d ілюструє блок-схему реалізації В124 гребінки В12 фільтрів, яка виконує функціональний еквівалент операцій підвищувальної дискретизації і високочастотної фільтрації, використовуючи набір з інтерполяції, повторної дискретизації і інших операцій. Гребінка В124 фільтрів включає в себе операцію обернення спектра в смузі високих частот, яка обертає аналогічну операцію, яка виконується, наприклад, в гребінці фільтрів кодера, такій як гребінка А114 фільтрів. У цьому конкретному прикладі гребінка В124 фільтрів також включає в себе режекторні фільтри в смузі низьких частот і смузі високих частот, які ослаблюють компонент сигналу при 7100Гц, хоч ці фільтри є необов'язковими і не обов'язково повинні бути включені. Фіг.36а і 36b показують частотну і імпульсну характеристики для прикладів здійснення, відповідно, низькочастотного фільтра і низькосмугового режекторного фільтра як показано на Фіг.4d. Фіг.38а, 38b, 39а і 39b показують частотну і імпульсну характеристики для прикладів здійснення, відповідно, інтерполяції до 14КГц, інтерполяції до 28КГц, передискретизації до 16КГц і високосмугового режекторного фільтра як показано на Фіг.4d. 92742 18 Вузькосмуговий кодер А120 реалізований згідно з моделлю вхідного фільтра, яка кодує вхідний мовний сигнал як (А) набір параметрів, які описують фільтр, і (В) сигнал збудження, який приводить в дію описаний фільтр, щоб сформувати синтезоване відтворення вхідного мовного сигналу. Фіг.5а ілюструє приклад спектральної огинаючої мовного сигналу. Піки, які характеризують цю спектральну огинаючу, представляють резонанси мовного тракту і називаються формантами. Більшість мовних кодерів кодують щонайменше цю приблизну спектральну структуру як набір параметрів, таких як коефіцієнти фільтра. Фіг.5b ілюструє приклад базового компонування вхідного фільтра, що застосовується до кодування спектральної огинаючої вузькосмугового сигналу S20. Аналізуючий модуль обчислює набір параметрів, які характеризують фільтр, відповідний мовному звуку, за період часу (типово 20мс). Відбілювальний фільтр (також званий аналізуючим фільтром або фільтром помилок прогнозу), сконфігурований згідно з цими параметрами фільтра, видаляє спектральну огинаючу, щоб спектрально згладити сигнал. Результуючий відбілений сигнал (також званий залишком) має менше енергії і тим самим меншу дисперсію, і його простіше кодувати, ніж вихідний мовний сигнал. Помилки, виникаючі внаслідок кодування залишкового сигналу, також можуть бути розподілені більш рівномірно по спектру. Параметри фільтра і залишок в типовому варіанті квантуються для ефективної передачі по каналу. У декодері синтезуючий фільтр, сконфігурований згідно з параметрами фільтра, збуджується за допомогою сигналу на основі залишку, щоб сформувати синтезовану версію вихідного мовного звуку. Синтезуючий фільтр в типовому варіанті виконаний з можливістю мати передавальну функцію, яка є інверсією передавальної функції відбілювального фільтра. Фіг.6 ілюструє блок-схему базової реалізації А122 вузькосмугового кодера А120. У цьому прикладі аналізуючий модуль 210 кодування з лінійним прогнозом (LPC) кодує спектральну огинаючу вузькосмугового сигналу S20 як набір коефіцієнтів лінійного прогнозу (LP) (наприклад, коефіцієнтів полюсного фільтра 1/A(z)). Аналізуючий модуль в типовому варіанті обробляє вхідний сигнал як послідовність неперекривних кадрів, при цьому новий набір коефіцієнтів обчислюється для кожного кадру. Період кадру - це, як правило, період протягом якого, як очікується, сигнал може бути локально стаціонарним; один загальний приклад - це 20 мілісекунд (еквівалентно 160 вибіркам при частоті дискретизації 8КГц). У одному прикладі аналізуючий LPC-модуль 210 виконаний з можливістю обчислювати набір з десяти коефіцієнтів LP-фільтра, щоб охарактеризувати формантну структуру кожного 20-мілісекундного кадру. Також можна реалізувати аналізуючий модуль так, щоб обробляти вхідний сигнал як послідовність перекривних кадрів. Аналізуючий модуль може бути виконаний з можливістю аналізувати вибірки кожного кадру безпосередньо, або вибірки можуть бути спочатку зважені згідно з функцією кадрування (наприклад, 19 зважувальної функції Хеммінга). Аналіз також може виконуватися для вікна, що перевищує кадр, наприклад, 30-мілісекундного вікна. Це вікно може бути симетричним (наприклад, 5-20-5, так що воно включає в себе 5 мілісекунд відразу перед і після 20-мілісекундного кадру) або асиметричним (наприклад, 10-20, так що воно включає в себе останні 10 мілісекунд попереднього кадру). Аналізуючий LPC-модуль в типовому варіанті виконаний з можливістю обчислювати коефіцієнти LPфільтра за допомогою рекурсії Левінсона-Дурбіна або алгоритму Леро-Гогена. У іншій реалізації аналізуючий модуль може бути виконаний з можливістю обчислювати набір коефіцієнтів косинусного перетворення Фур'є для кожного кадру замість набору коефіцієнтів LP-фільтра. Вихідна швидкість кодера А120 може бути значно знижена, з відносно невеликим впливом на якість відтворення, за допомогою квантування параметрів фільтра. Коефіцієнти фільтра з лінійним прогнозом важко ефективно квантувати, і звичайно вони перетворюються до іншого представлення, наприклад, пар спектральних ліній (LSP) або частот спектральних ліній (LSF) для квантування і/або кодування по ентропії. У прикладі за Фіг.6, перетворення 220 коефіцієнтів LP-фільтра в LSF перетворює набір коефіцієнтів LP-фільтра у відповідний набір LSF. Інші представлення "один-до-одного" коефіцієнтів LP-фільтра включають в себе коефіцієнти паркора; значення відношення логарифмічної площі; спектральні пари імітансів (ISP); і спектральні частоти імітансів (ISF), які використовуються в кодеку AMR-WB (адаптивне багатошвидкісне широкосмугове кодування) для GSM (глобальна система мобільного зв'язку). Типово перетворення між набором коефіцієнтів LPфільтра і відповідним набором LSF є оборотним, але варіанти здійснення також включають в себе реалізації кодера А120, в яких перетворення є безповоротним без помилок. Квантувач 230 виконаний з можливістю квантувати набір вузькосмугових LSF (або іншого представлення коефіцієнтів), а вузькосмуговий кодер А122 виконаний з можливістю виводити результат цього квантування як параметри S40 вузькосмугового фільтра. Даний квантувач в типовому варіанті включає в себе векторний квантувач, який кодує вхідний вектор як індекс до відповідного запису вектора в таблиці або таблиці кодування. Як показано на Фіг.6, вузькосмуговий кодер А122 також формує залишковий сигнал за допомогою передачі вузькосмугового сигналу S20 через відбілювальний фільтр 260 (також званий аналізуючим фільтром або фільтром помилок прогнозу), який сконфігурований згідно з набором коефіцієнтів фільтра. У цьому конкретному прикладі відбілювальний фільтр 260 реалізований як FIRфільтр, хоч також можуть бути використані IIRреалізації. Даний залишковий сигнал в типовому варіанті містить перцепційно важливу інформацію мовного кадру, таку як довгострокова структура, пов'язана з кроком, яка не представлена в параметрах S40 вузькосмугового фільтра. Квантувач 270 виконаний з можливістю обчислювати оцифроване представлення цього залишкового сигналу 92742 20 для виведення як кодованого вузькосмугового сигналу S50 збудження. Даний квантувач в типовому варіанті включає в себе векторний квантувач, який кодує вхідний вектор як індекс до відповідного запису вектора в таблиці або таблиці кодування. Альтернативно, даний квантувач може бути виконаний з можливістю відправляти один або більше параметрів, з яких вектор може бути сформований динамічно в декодері, а не витягнутий з пристрою зберігання, як в способі розрідженої таблиці кодування. Цей спосіб використовується в схемах кодування, таких як алгебраїчне CELP (кодування методом лінійного прогнозу з кодовим збудженням), і кодеках, таких як EVRC (вдосконалений кодек із змінною швидкістю) для 3GPP2 (Партнерський проект третього покоління 2). Бажано, щоб вузькосмуговий кодер А120 формував кодований вузькосмуговий сигнал збудження згідно з тими ж параметрами фільтра, які доступні для відповідного вузькосмугового декодера. Таким чином, результуючий кодований вузькосмуговий сигнал збудження може вже в деякій мірі враховувати неідеальність в цих значеннях параметрів, наприклад, помилку квантування. Отже, бажано конфігурувати відбілювальний фільтр з використанням тих же значень коефіцієнтів, що і доступні в кодері. У базовому прикладі кодера А122, як показано на Фіг.6, зворотний квантувач 240 деквантує параметри S40 вузькосмугового кодування, перетворення 250 LSF в коефіцієнти LP-фільтра перетворює результуючі значення зворотно до відповідного набору коефіцієнтів LPфільтра, і цей набір коефіцієнтів використовується для того, щоб конфігурувати відбілювальний фільтр 260, щоб формувати залишковий сигнал, який квантується за допомогою квантувача 270. Деякі реалізації вузькосмугового кодера А120 сконфігуровані так, щоб обчислювати кодований вузькосмуговий сигнал S50 збудження за допомогою ідентифікації одного з набору векторів таблиці кодування, який в найбільшій мірі співпадає із залишковим сигналом. Проте, потрібно зазначити, що вузькосмуговий кодер А120 також може бути реалізований так, щоб обчислювати квантоване представлення залишкового сигналу без фактичного формування залишкового сигналу. Наприклад, вузькосмуговий кодер А120 може бути виконаний з можливістю використовувати ряд векторів таблиці кодування, щоб формувати відповідні синтезовані сигнали (наприклад, згідно з поточним набором параметрів фільтра) і вибирати вектор таблиці кодування, асоціативно зв'язаний із сформованим сигналом, який в найбільшій мірі співпадає з вихідним вузькосмуговим сигналом S20 в перцепційно зваженій області. Фіг.7 ілюструє блок-схему реалізації В112 вузькосмугового декодера В110. Зворотний квантувач 310 деквантує параметри S40 вузькосмугового фільтра (в цьому випадку, до набору LSF), а перетворення 320 LSF в параметри LP-фільтра перетворює LSF в набір коефіцієнтів фільтра (наприклад, як описано вище з посиланням на зворотний квантувач 240 і перетворення 250 вузькосмугового кодера А122). Зворотний квантувач 340 деквантує вузькосмуговий залишковий сигнал S40, щоб сфо 21 рмувати вузькосмуговий сигнал S80 збудження. На основі коефіцієнтів фільтра і вузькосмугового сигналу S80 збудження вузькосмуговий синтезуючий фільтр 330 синтезує вузькосмуговий сигнал S90. Іншими словами, вузькосмуговий синтезуючий фільтр 330 виконаний з можливістю спектрально формувати вузькосмуговий сигнал S80 збудження згідно з деквантованими коефіцієнтами фільтра, щоб сформувати вузькосмуговий сигнал S90. Вузькосмуговий декодер В112 також надає вузькосмуговий сигнал S80 збудження у високосмуговий кодер А200, який використовує його для того, щоб витягувати високосмуговий сигнал S120 збудження, як описано в даному документі. У деяких реалізаціях, описаних нижче, вузькосмуговий декодер ВІЮ може бути виконаний з можливістю надавати додаткову інформацію у високосмуговий декодер В200, яка пов'язана з вузькосмуговим сигналом, таку як нахил спектра, посилення і запізнення основного тону і режим мови. Система вузькосмугового кодера А122 і вузькосмугового декодера В112 є базовим прикладом мовного кодера аналізу за допомогою синтезу. Кодування методом лінійного прогнозу з кодовим збудженням (CELP) є одним популярним сімейством кодування на основі аналізу за допомогою синтезу, і реалізації таких кодерів можуть виконувати кодування форми сигналу залишку, в тому числі такі операції, як вибір записів з фіксованих і адаптивних таблиць кодування, операції мінімізації помилок і/або операції перцепційного зважування. Інші реалізації кодування на основі аналізу за допомогою синтезу включають в себе кодування методом лінійного прогнозу зі змішаним збудженням (MELP), алгебраїчного CELP (ACELP), релаксаційного CELP (RCELP), регулярного збудження імпульсами (RPE), багатоімпульсного CELP (МРЕ) і лінійного прогнозу із збудженням векторною сумою (VSELP). Пов'язані способи кодування включають в себе кодування з багатосмуговим збудженням (МВЕ) і інтерполяцією прототипу форми сигналу (PWI). Приклади стандартизованих мовних кодеків на основі аналізу за допомогою синтезу включають в себе повношвидкісний GSM-кодек ETSI-GSM (Європейський інститут телекомунікаційний стандартів) (GSM 06.10), який використовує лінійний прогноз із залишковим збудженням (RELP); поліпшений повношвидкісний GSM-кодек (ETSI-GSM 06.60); кодер за стандартом ITU (Міжнародний союз телекомунікацій) 11,8Кбіт/с G.729 Додаток Е; кодеки IS (Interim Standard)-641 для IS-136 (схема множинного доступу з часовим розділенням каналів); адаптивні багатошвидкісні GSM-кодеки (GSM-AMR); і кодек 4GV™ (вокодер четвертого покоління) (QUALCOMM Incorporated, San Diego, CA). Вузькосмуговий кодер А120 і відповідний декодер В110 можуть бути реалізовані згідно з однією з цих методологій або будь-якою іншою технологією мовного кодування (відомою або розроблюваною), яка представляє мовний сигнал як (А) набір параметрів, які описують фільтр, і (В) сигнал збудження, що використовується для того, щоб приводити в дію описаний фільтр, щоб відтворити мовний сигнал. 92742 22 Навіть після того, як відбілювальний фільтр видалив приблизну спектральну огинаючу з вузькосмугового сигналу S20, значна частина тонкої гармонічної структури може залишатися, особливо для вокалізованої мови. Фіг.8а ілюструє спектральний графік одного прикладу залишкового сигналу, який може бути сформований за допомогою відбілювального фільтра, для мовного сигналу, наприклад, голосних звуків. Періодична структура, показана в цьому прикладі, пов'язана з основним тоном, і різні вокалізовані звуки, вимовні одним і тим же говорячим, можуть мати різні формантні структури, але схожі структури основного тону. Фіг.8b ілюструє графік часової області прикладу такого залишкового сигналу, який показує послідовність імпульсів основного тону у часі. Ефективність кодування і/або якість мови може бути підвищено за допомогою використання одного або більше значень параметрів для того, щоб кодувати характеристики структури основного тону. Однією важливою характеристикою структури основного тону є ефективність першої гармоніки (також званої власною частотою), яка в типовому варіанті знаходиться в діапазоні 60-400Гц. Ця характеристика в типовому варіанті кодується як інверсія власної частоти, також звана запізненням основного тону. Запізнення основного тону вказує число вибірок в одному періоді основного тону і може кодуватися як один або більше індексів таблиці кодування. Мовні сигнали від чоловіків часто мають більше запізнення основного тону, ніж мовні сигнали від жінок. Іншою характеристикою сигналу, пов'язаною зі структурою основного тону, є періодичність, яка вказує інтенсивність гармонічної структури або, іншими словами, міру, в якій сигнал є гармонічним або не гармонічним. Двома типовими індикаторами періодичності є переходи через нуль і функції нормалізованої автокореляції (NACF). Періодичність також може показуватися за допомогою посилення основного тону, яке, як правило, кодується як посилення таблиці кодування (наприклад, посилення квантованої адаптивної таблиці кодування). Вузькосмуговий кодер А120 може включати в себе один або більше модулів, сконфігурованих так, щоб кодувати довгострокову гармонічну структуру вузькосмугового сигналу S20. Як показано на Фіг.9, одна типова парадигма CELP, яка може бути використана, включає в себе аналізуючий LPCмодуль з розімкненим контуром, який кодує короткострокову характеристику або приблизну спектральну огинаючу, після чого іде аналізуюча стадія довгострокового прогнозу із замкненим контуром, яка кодує точний основний тон або гармонічну структуру. Короткострокові характеристики кодуються як коефіцієнти фільтра, а довгострокові характеристики кодуються як значення параметрів, наприклад, запізнення основного тону і посилення основного тону. Наприклад, вузькосмуговий кодер А120 може бути виконаний з можливістю виводити кодований вузькосмуговий сигнал S50 збудження в формі, яка включає в себе один або більше індексів таблиці кодування (наприклад, індекс фіксованої таблиці кодування або індекс адаптивної 23 таблиці кодування) і відповідні значення посилення. Обчислення цього квантованого представлення вузькосмугового залишкового сигналу (наприклад, за допомогою квантувача 270) може включати в себе вибір таких індексів і обчислення таких значень. Кодування структури основного тону також може включати в себе інтерполяцію форми сигналу прототипу основного тону, причому ця операція може включати в себе обчислення різниці між послідовними імпульсами основного тону. Моделювання довгострокової структури може бути відключене для кадрів, відповідних невокалізованій мові, які в типовому варіанті є шумоподібними і неструктурованими. Реалізація вузькосмугового декодера В110 згідно з парадигмою, проілюстрованою на Фіг.9, може бути сконфігурована так, щоб виводити вузькосмуговий сигнал S80 збудження у високосмуговий декодер В200 після того, як довгострокова структура (основний тон або гармонічна структура) відновлена. Наприклад, цей декодер може бути виконаний з можливістю виводити вузькосмуговий сигнал S80 збудження як деквантовану версію кодованого вузькосмугового сигналу S50 збудження. Зрозуміло, також можна реалізувати вузькосмуговий декодер В110, так що високосмуговий декодер В200 виконує деквантування кодованого вузькосмугового сигналу S50 збудження, щоб одержати вузькосмуговий сигнал збудження S80. У реалізації широкосмугового мовного кодера А100 згідно з парадигмою, показаною на Фіг.9, високосмуговий кодер А200 може бути виконаний з можливістю приймати вузькосмуговий сигнал збудження, що формується за допомогою короткострокового аналізуючого або відбілювального фільтра. Іншими словами, вузькосмуговий кодер А120 може бути виконаний з можливістю виводити вузькосмуговий сигнал збудження у високосмуговий кодер А200 до кодування довгострокової структури. Проте, бажано для високосмугового кодера А200 приймати з вузькосмугового каналу таку ж інформацію кодування, яка приймається за допомогою високосмугового декодера В200, з тим щоб параметри кодування, що формуються за допомогою високосмугового кодера А200, могли вже в деякій мірі враховувати неідеальність в цій інформації. Таким чином, може бути переважним для високосмугового кодера А200 відновлювати вузькосмуговий сигнал S80 збудження з такого ж параметризованого і/або квантованого кодованого вузькосмугового сигналу S50 збудження, який повинен бути виведений за допомогою широкосмугового мовного кодера А100. Одна потенційна перевага цього підходу полягає в більш точному обчисленні коефіцієнтів S60b високосмугового посилення, описаних нижче. Крім параметрів, які характеризують короткострокову і/або довгострокову структуру вузькосмугового сигналу S20, вузькосмуговий кодер А120 може формувати значення параметрів, які пов'язані з іншими характеристиками вузькосмугового сигналу S20. Ці значення, які можуть бути належним чином квантовані для виведення за допомогою широкосмугового мовного кодера А100, можуть бути включені в параметри S40 92742 24 вузькосмугового фільтра або виведені окремо. Високосмуговий кодер А200 також може бути виконаний з можливістю обчислювати параметри S60 високосмугового кодування згідно з одним або більше цих додаткових параметрів (наприклад, після деквантування). У широкосмуговому мовному кодері В100 високосмуговий декодер В200 може бути виконаний з можливістю приймати значення параметрів за допомогою вузькосмугового кодера В110 (наприклад, після деквантування). Альтернативно, високосмуговий кодер В200 може бути виконаний з можливістю приймати (і, можливо, деквантувати) значення параметрів безпосередньо. У одному прикладі додаткових параметрів вузькосмугового кодування, вузькосмуговий кодер А120 формує значення для параметрів нахилу спектра і мовного режиму для кожного кадру. Нахил спектра пов'язаний з формою спектральної огинаючої в смузі пропускання і в типовому варіанті представляється за допомогою квантованого першого коефіцієнта відображення. Для більшості вокалізованих звуків спектральна енергія знижується із збільшенням частоти, так що перший коефіцієнт відображення є негативним і може досягати -1. Більшість невокалізованих звуків мають спектр, який або плоский, так що перший коефіцієнт відображення близький до нуля, або має більше енергії при високих частотах, так що перший коефіцієнт відображення є позитивним і може досягати +1. Мовний режим (також званий голосовим режимом) вказує те, представляє поточний кадр вокалізовану або невокалізовану мову. Цей параметр може мати двійкове значення на основі одного або двох показників періодичності (наприклад, переходів через нуль, NACF, посилення основного тону) і/або активності мови для кадру, наприклад, відношення між таким показником і пороговим значенням. У інших реалізаціях параметр мовного режиму має один або більше станів, щоб вказувати такі режими, як мовчання або фоновий шум або перехід між мовчанням і вокалізованою мовою. Високосмуговий кодер А200 виконаний з можливістю кодувати високосмуговий сигнал S30 згідно з моделлю вхідного фільтра, при цьому збудження для цього фільтра засноване на кодованому вузькосмуговому сигналі збудження. Фіг.10 ілюструє блок-схему реалізації А202 високосмугового кодера А200, який виконаний з можливістю формувати потік параметрів S60 високосмугового кодування, в тому числі параметрів S60a високосмугового фільтра і коефіцієнтів S60b високосмугового посилення. Високосмуговий A300 генератор збудження витягує високосмуговий сигнал S120 збудження з кодованого вузькосмугового сигналу S50 збудження. Аналізуючий модуль А210 формує набір значень параметрів, які характеризують спектральну огинаючу високосмугового сигналу S30. У даному конкретному прикладі аналізуючий модуль А210 виконаний з можливістю виконувати LPC-аналіз, щоб формувати набір коефіцієнтів LP-фільтра для кожного кадру високосмугового сигналу S30. Перетворення 410 коефіці 25 єнтів фільтра з лінійним прогнозом в LSF перетворює набір коефіцієнтів LP-фільтра у відповідний набір LSF. Як указано вище з посиланням на аналізуючий модуль 210 і перетворення 220, аналізуючий модуль А210 і/або перетворення 410 можуть бути сконфігуровані так, щоб використовувати інші набори коефіцієнтів (наприклад, коефіцієнтів косинусного перетворення Фур'є) і/або представлення коефіцієнтів (наприклад, ISP). Квантувач 420 виконаний з можливістю квантувати набір високосмугових LSF (або іншого представлення коефіцієнтів, наприклад, ISP), а високосмуговий кодер А102 виконаний з можливістю виводити результат цього квантування як параметри S60a високосмугового фільтра. Даний квантувач в типовому варіанті включає в себе векторний квантувач, який кодує вхідний вектор як індекс до відповідного запису вектора в таблиці або таблиці кодування. Високосмуговий кодер А202 також включає в себе синтезуючий фільтр А220, виконаний з можливістю формувати синтезований високосмуговий сигнал S130 згідно з високосмуговим сигналом S120 збудження і кодованою спектральною огинаючою (наприклад, набір коефіцієнтів LP-фільтра), сформованою за допомогою аналізуючого модуля А210. Синтезуючий фільтр А220 в типовому варіанті реалізований як IIR-фільтр, хоч також можуть бути використані FIR-реалізації. У конкретному прикладі синтезуючий фільтр А220 реалізований як лінійний авторегресивний фільтр шостого порядку. Обчислювач А230 коефіцієнтів високосмугового посилення обчислює одну або більше різниць між рівнями вихідного високосмугового сигналу S30 і синтезованого високосмугового сигналу S130, щоб задавати огинаючу посилення для кадру. Квантувач 430, який може бути реалізований як векторний квантувач, який кодує вхідний вектор як індекс у відповідний запис вектора в таблиці або таблиці кодування, квантує значення або значення, що задають огинаючу посилення, а високосмуговий кодер А202 виконаний з можливістю виводити результат цього квантування як коефіцієнти S60b високосмугового посилення. У реалізації, показаній на Фіг.10, синтезуючий фільтр А220 виконаний з можливістю приймати коефіцієнти фільтра з аналізуючого модуля А210. Альтернативна реалізація високосмугового кодера А202 включає в себе зворотний квантувач і зворотне перетворення, сконфігуроване так, щоб декодувати коефіцієнти фільтра з параметрів S60a високосмугового фільтра, і в цьому випадку синтезуючий фільтр А220 виконаний з можливістю приймати замість цього декодовані коефіцієнти фільтра. Таке альтернативне компонування може підтримувати більш точне обчислення огинаючої посилення за допомогою обчислювача А230 високосмугового посилення. У одному конкретному прикладі аналізуючий модуль А210 і обчислювач А230 високосмугового посилення виводять набір з шести LSF і набір з п'яти значень посилення на кадр, відповідно, з тим щоб широкосмугове розширення вузькосмугового сигналу S20 могло здійснюватися тільки за допо 92742 26 могою одинадцяти додаткових значень на кадр. Слух часто менш чутливий до похибок частоти при високих частотах, так що високосмугове кодування при LPC низького порядку може формувати сигнал, що має порівнянну перцепційну якість з вузькосмуговим кодуванням при LPC більш високого порядку. Типова реалізація високосмугового кодера А200 може бути сконфігурована так, щоб виводити 8-12 бітів на кадр для високоякісного відновлення спектральної огинаючої і ще 8-12 бітів на кадр для високоякісного відтворення часової огинаючої. У іншому конкретному прикладі аналізуючий модуль А210 виводить набір з LSF на кадр. Деякі реалізації високосмугового кодера А200 сконфігуровані так, щоб формувати високосмуговий сигнал S120 збудження за допомогою формування сигналу випадкового шуму, що має високосмугові частотні компоненти, і амплітудної модуляції сигналу шуму згідно з огинаючою часової області вузькосмугового сигналу S20, вузькосмугового сигналу S80 збудження або високосмугового сигналу S30. Хоч цей заснований на шумі спосіб може формувати достатні результати для невокалізованих звуків, проте, він може бути непридатним для вокалізованих звуків, залишки яких звичайно гармонічні, і, отже, мають деяку періодичну структуру. Високосмуговий А300 генератор збудження виконаний з можливістю формувати високосмуговий сигнал S120 збудження за допомогою продовження спектра вузькосмугового сигналу S80 збудження до високосмугового частотного діапазону. Фіг.11 ілюструє блок-схему реалізації А302 високосмугового генератора А300 збудження. Зворотний квантувач 450 виконаний з можливістю деквантувати кодований вузькосмуговий сигнал S50 збудження, щоб формувати вузькосмуговий сигнал S80 збудження. Розширювач А400 спектра виконаний з можливістю формувати гармонічно розширений сигнал S160 на основі вузькосмугового сигналу S80 збудження. Об'єднувач 470 виконаний з можливістю комбінувати сигнал випадкового шуму, що формується за допомогою генератора 480 шуму, і огинаючу часової області, обчислену за допомогою обчислювача 460 огинаючої, щоб сформувати модульований сигнал S170 шуму. Об'єднувач 490 виконаний з можливістю змішувати гармонічно розширений сигнал S60 і модульований сигнал S170 шуму, щоб сформувати високосмуговий сигнал S120 збудження. У одному прикладі розширювач А400 спектра виконаний з можливістю виконувати операцію спектрального накладання (також званого дзеркалюванням) для вузькосмугового сигналу S80 збудження, щоб формувати гармонічно розширений сигнал S160. Спектральне накладання може виконуватися за допомогою доповнення нулями сигналу S80 збудження і подальшого застосування високочастотного фільтра, щоб зберегти побічну низькочастотну складову. У іншому прикладі розширювач А400 спектра виконаний з можливістю формувати гармонічно розширений сигнал S160 за допомогою спектрального перетворення вузькосмугового сигналу S80 збудження у високосмуговий (наприклад, за допомогою підвищувальної дискре 27 тизації і подальшого множення з косинусоїдальним сигналом постійної частоти). Способи спектрального накладання і перетворення можуть формувати спектрально розширені сигнали, гармонічна структура яких є безперервною з вихідною гармонічною структурою вузькосмугового сигналу S80 збудження по фазі і/або частоті. Наприклад, ці способи можуть формувати сигнали, що мають піки, які, як правило, не є кратними власній частоті, що може викликати перешкоди різких звуків у відновленому мовному сигналі. Ці способи також часто формують високочастотні гармоніки, які мають неприродно сильні тональні характеристики. Крім того, оскільки PSTN-сигнал може дискретизуватися при 8КГц, але обмежений по смузі пропускання не більше ніж 3400Гц, верхній спектр вузькосмугового сигналу S80 збудження може містити мало або взагалі не містити енергії, так що розширений сигнал, сформований згідно з операцією спектрального накладання або спектрального перетворення, може мати спектральний провал вище 3400Гц. Інші способи формування гармонічно розширеного сигналу S160 включають в себе ідентифікацію однієї або більше власних частот вузькосмугового сигналу S80 збудження і формування гармонічних тонів згідно з цією інформацією. Наприклад, гармонічна структура сигналу збудження може характеризуватися за допомогою власної частоти нарівні з інформацією по амплітуді і фазі. Інша реалізація високосмугового генератора A300 збудження формує гармонічно розширений сигнал S160 на основі власної частоти і амплітуди (як указано, наприклад, за допомогою запізнення основного тону і посилення основного тону). Проте, крім випадків, коли гармонічно розширений сигнал є фазово-когерентним з вузькосмуговим сигналом S80 збудження, якість результуючої декодованої мови може бути неприйнятною. Нелінійна функція може бути використана для того, щоб створити високосмуговий сигнал збудження, який є фазово-когерентним з вузькосмуговим збудженням і зберігає гармонічну структуру без стрибка фази. Нелінійна функція також може надавати підвищений рівень шуму між високочастотними гармоніками, які часто звучать більш природно, ніж тональні високочастотні гармоніки, що формуються за допомогою таких способів, як спектральне накладання і спектральне перетворення. Типові нелінійні функції без запам'ятовування, які можуть бути застосовані за допомогою різних реалізацій розширювача А400 спектра, включають в себе функцію абсолютних значень (також звану повноперіодним випрямленням), напівперіодне випрямлення, піднесення в квадрат, піднесення в куб і відсікання. Інші реалізації розширювача А400 спектра можуть бути сконфігуровані так, щоб застосовувати нелінійну функцію із запам'ятовуванням. Фіг.12 - це блок-схема реалізації А402 розширювача А400 спектра, який виконаний з можливістю застосовувати нелінійну функцію для того, щоб розширити вузькосмуговий сигнал S80 збудження. Підвищувальний дискретизатор 510 виконаний з можливістю виконувати підвищувальну дискрети 92742 28 зацію вузькосмугового сигналу S80 збудження. Може бути бажаним провести підвищувальну дискретизацію сигналу в достатній мірі для того, щоб мінімізувати накладання спектрів при застосуванні нелінійної функції. У одному конкретному прикладі підвищувальний дискретизатор 510 виконує підвищувальну дискретизацію сигналу на коефіцієнт 8. Підвищувальний дискретизатор 510 може бути виконаний з можливістю виконувати операцію підвищувальної дискретизації за допомогою заповнення нулями вхідного сигналу і низькочастотної фільтрації результату. Обчислювач 520 нелінійних функцій виконаний з можливістю застосовувати нелінійну функцію до сигналу з підвищеною дискретизацією. Одна потенційна перевага функції абсолютних значень над іншими нелінійними функціями для спектрального розширення, такими як піднесення в квадрат, полягає в тому, що не потрібна нормалізація енергії. У деяких реалізаціях функція абсолютних значень може бути ефективно застосована за допомогою відсікання або очищення знакового біта для кожної вибірки. Обчислювач 520 нелінійних функцій також може бути виконаний з можливістю виконувати амплітудне деформування сигналу з підвищеною дискретизацією або розширеним спектром. Знижувальний дискретизатор 530 виконаний з можливістю виконувати знижувальну дискретизацію спектрально розширеного результату застосування нелінійної функції. Може бути бажаним для знижувального дискретизатора 530 виконати операцію смугової фільтрації, щоб вибрати необхідну смугу частот спектрально розширеного сигналу до зниження частоти дискретизації (наприклад, щоб зменшити або усунути накладання спектрів або пошкодження за допомогою дзеркальної бічної смуги частот). Також може бути бажаним для знижувального дискретизатора 530 знижувати частоту дискретизації за декілька стадій. Фіг.12а - це схема, яка ілюструє спектр сигналу в різних точках в одному прикладі операції спектрального розширення, при цьому шкала частоти однакова для всіх графіків. Графік (а) ілюструє спектр одного прикладу вузькосмугового сигналу S80 збудження. Графік (b) ілюструє спектр після того, як над сигналом S80 виконана підвищувальна дискретизація з коефіцієнтом 8. Графік (с) ілюструє приклад розширеного спектра після застосування нелінійної функції. Графік (d) ілюструє спектр після низькочастотної фільтрації. У цьому прикладі смуга пропускання йде до верхньої частотної межі високосмугового сигналу S30 (наприклад, 7КГц або 8КГц). Графік (e) ілюструє спектр після першої стадії знижувальної дискретизації, при якій частота дискретизації знижується на коефіцієнт 2 або 4, щоб одержати широкосмуговий сигнал. Графік (f) ілюструє спектр після операції високочастотної фільтрації, щоб вибрати високочастотну частину розширеного сигналу, а графік (g) ілюструє спектр після другої стадії знижувальної дискретизації, на якій частота дискретизації знижується на коефіцієнт 2. В одному конкретному прикладі знижувальний дискретизатор 530 виконує високочастотну фільтрацію і другу стадію знижувальної дискрети 29 зації за допомогою передачі широкосмугового сигналу через високочастотний фільтр 130 і знижувальний дискретизатор 140 гребінки А112 фільтрів (або інші структури або процедури, що мають таку ж характеристику), щоб сформувати спектрально розширений сигнал, що має частотний діапазон і частоту дискретизації високосмугового сигналу S30. Як можна бачити на графіку (g), знижувальна дискретизація високочастотного сигналу, показаного на графіку (f), викликає обернення спектра. У цьому прикладі знижувальний дискретизатор 530 також виконаний з можливістю виконувати операцію спектрального обернення для сигналу. Графік (h) ілюструє результат застосування операції спектрального обернення, яка може бути виконана за допомогою множення сигналу на функцію еin або послідовність (-1)n, значення якої чергуються між +1 і -1. Ця операція еквівалентна зсуву цифрового спектра сигналу в частотній області на інтервал . Потрібно зазначити, що такий же результат також може бути одержаний за допомогою застосування операцій знижувальної дискретизації і спектрального обернення в іншому порядку. Операції підвищувальної дискретизації і/або знижувальної дискретизації також можуть бути сконфігуровані так, щоб включати в себе повторну дискретизацію, щоб одержати спектрально розширений сигнал, що має частоту дискретизації високосмугового сигналу S30 (наприклад, 7КГц). Як указано вище, гребінки А110 і В120 фільтрів можуть бути реалізовані, так щоб один або обидва з вузькосмугового і широкосмугового сигналу S20, S30 мали спектрально обернену форму на виході гребінки А110 фільтрів, кодувалися і декодувалися в спектрально оберненій формі і повторно спектрально оберталися в гребінці В120 фільтрів до виведення в широкосмуговому мовному сигналі S110. У цьому випадку, зрозуміло, операція спектрального обернення, проілюстрована на Фіг.12а, необов'язкова, оскільки бажано для високосмугового сигналу S120 збудження також мати спектрально обернену форму. Різні задачі підвищувальної дискретизації і знижувальної дискретизації операції спектрального розширення, що виконується за допомогою розширювача А402 спектра, можуть бути сконфігуровані і скомпоновані множиною різних способів. Наприклад, Фіг.12b це схема, яка ілюструє спектр сигналу в різних точках в одному прикладі операції спектрального розширення, при цьому шкала частоти однакова для всіх графіків. Графік (а) ілюструє спектр одного прикладу вузькосмугового сигналу S80 збудження. Графік (b) ілюструє спектр після того, як над сигналом S80 виконана підвищувальна дискретизація з коефіцієнтом 2. Графік (с) ілюструє приклад розширеного спектра після застосування нелінійної функції. У цьому випадку накладання спектрів, яке може виникати при більш високих частотах, допускається. Графік (d) ілюструє спектр після операції спектрального обернення. Графік (e) ілюструє спектр після однієї стадії знижувальної дискретизації, при якій частота дискретизації знижується на коефіцієнт 2, щоб одержати необхідний спектрально роз 92742 30 ширений сигнал. У цьому прикладі сигнал знаходиться в спектрально оберненій формі і може бути використаний в реалізації високосмугового кодера А200, який обробив високосмуговий сигнал S30 в цій формі. Спектрально розширений сигнал, сформований за допомогою обчислювача 520 нелінійних функцій, з великою часткою імовірності має помітне падіння амплітуди по мірі того, як частота зростає. Розширювач А402 спектра включає в себе блок 540 згладжування спектра, виконаний з можливістю виконувати операцію відбілювання для сигналу із зниженою дискретизацією. Блок 540 згладжування спектра може бути виконаний з можливістю виконувати фіксовану операцію відбілювання або виконувати адаптивну операцію відбілювання. У конкретному прикладі адаптивного відбілювання блок 540 згладжування спектра включає в себе аналізуючий LPC-модуль, виконаний з можливістю обчислювати набір з чотирьох коефіцієнтів фільтра з сигналу із зниженою дискретизацією, і аналізуючий модуль четвертого порядку, виконаний з можливістю відбілювати сигнал згідно з цими коефіцієнтами. Інші реалізації розширювача А400 спектра включають в себе конфігурації, в яких блок 540 згладжування спектра керує спектрально розширеним сигналом до знижувального дискретизатора 530. Високосмуговий генератор A300 збудження може бути реалізований так, щоб виводити гармонічно розширений сигнал S160 як високосмуговий сигнал S120 збудження. Проте, в деяких випадках використання тільки гармонічно розширеного сигналу як високосмугового збудження може приводити до чутних перешкод. Гармонічна структура мови, як правило, менш різко виражена в смузі високих частот, ніж в смузі низьких частот, і надмірне використання гармонічної структури у високосмуговому сигналі збудження може приводити до зашумленого звуку. Ця перешкода може бути особливо помітною в мовних сигналах від жінок. Варіанти здійснення включають в себе реалізації високосмугового генератора A300 збудження, які сконфігуровані так, щоб змішувати гармонічно розширений сигнал S160 з сигналом шуму. Як проілюстровано на Фіг.11, високосмуговий генератор А302 збудження включає в себе генератор 480 шуму, який виконаний з можливістю формувати сигнал випадкового шуму. У одному прикладі генератор 480 шуму виконаний з можливістю формувати сигнал білого псевдовипадкового шуму з одиничною дисперсією, хоч в інших варіантах здійснення сигнал шуму не обов'язково повинен бути білим і може мати щільність потужності, яка варіюється з частотою. Може бути бажаним для генератора 480 шуму бути сконфігурованим так, щоб виводити сигнал шуму як детерміновану функцію, з тим щоб його стан міг дублюватися в декодері. Наприклад, генератор 480 шуму може бути виконаний з можливістю виводити сигнал шуму як детерміновану функцію інформації, закодованої раніше в рамках того ж кадру, наприклад, параметрів S40 вузькосмугового фільтра і/або кодованого вузькосмугового сигналу S50 збудження. До змішування з гармонічно розширеним сиг 31 92742 налом S160 сигнал випадкового шуму, що формується за допомогою генератора 480 шуму, може амплітудно модулюватися, щоб мати огинаючу часової області, яка апроксимує розподіл у часі енергії вузькосмугового сигналу S20, високосмугового сигналу S30, вузькосмугового сигналу S80 збудження або гармонічно розширеного сигналу S160. Як проілюстровано на Фіг.11, високосмуговий генератор А302 збудження включає в себе об'єднувач 470, виконаний з можливістю виконувати амплітудну модуляцію сигналу шуму, сформованого за допомогою генератора 480 шуму, згідно з огинаючою часової області, обчисленою за допомогою обчислювача 460 огинаючої. Наприклад, об'єднувач 470 може бути реалізований як помножувач, виконаний з можливістю масштабувати виведення 480 шуму згідно з огинаючою часової області, обчисленої за допомогою обчислювача 460 огинаючої, щоб сформувати модульований сигнал S170 шуму. У реалізації A304 високосмугового генератора A302 збудження, як показано на блок-схемі за Фіг.13, обчислювач 460 огинаючої виконаний з можливістю обчислювати огинаючу гармонічно розширеного сигналу S160. У реалізації А306 високосмугового генератора A302 збудження, як показано на блок-схемі за Фіг.14, обчислювач 460 огинаючої виконаний з можливістю обчислювати огинаючу вузькосмугового сигналу S80 збудження. Додаткові реалізації високосмугового генератора A302 збудження можуть бути сконфігуровані іншим чином, щоб додавати шум в гармонічно розширений сигнал S160 згідно з позиціями вузькосмугових імпульсів основного тону у часі. Обчислювач 460 огинаючої може бути виконаний з можливістю виконувати обчислення огинаючої як задачі, яка має послідовність підзадач. Фіг.15 ілюструє блок-схему послідовності операцій прикладу Т110 такої задачі. Підзадача Т110 обчислює квадрат кожної вибірки в кадрі сигналу, огинаюча якого повинна бути змодельована (наприклад, вузькосмугового сигналу S80 збудження або гармонічно розширеного сигналу S160), щоб сформувати послідовність піднесених в квадрат значень. Підзадача Τ120 виконує операцію згладжування над послідовністю піднесених в квадрат значень. У одному прикладі підзадача Τ120 застосовує низькочастотний IIR-фільтр першого порядку до послідовності згідно з виразом: ( у(n)=ах(n)+(1-а)у(n-1) 1) де x - це вхідний сигнал фільтра, у - це вихідний сигнал фільтра, n - це індекс часової області, а а - це коефіцієнт згладжування, що має значення між 0,5 і 1. Значення коефіцієнта згладжування а може бути фіксованим або, в альтернативній реалізації, може бути адаптивним згідно з індикацією шуму у вхідному сигналі, так щоб а було ближче до 1 за відсутності шуму і ближче до 0,5 за наявності шуму. Підзадача Τ130 застосовує функцію квадратного кореня до кожної вибірки згладженої послідовності, щоб сформувати огинаючу часової області. Ця реалізація обчислювача 460 огинаючої може бути сконфігурована так, щоб виконувати різні 32 підзадачі задачі Т110 послідовно і/або паралельно. У додаткових реалізаціях задачі Т110 підзадачі Т110 може передувати операція смуги пропускання, сконфігурованої так, щоб вибирати необхідну частину частоти сигналу, огинаюча якого повинна бути змоделювати, наприклад, в діапазоні 3-4КГц. Об'єднувач 490 виконаний з можливістю змішувати гармонічно розширений сигнал S160 і модульований сигнал S170 шуму, щоб сформувати високосмуговий сигнал S120 збудження. Реалізації об'єднувача 490 можуть бути сконфігуровані, наприклад, так, щоб обчислювати високосмуговий сигнал S120 збудження як суму гармонічно розширеного сигналу S160 і модульованого сигналу S170 шуму. Така реалізація об'єднувача 490 може бути сконфігурована так, щоб обчислювати високосмуговий сигнал S120 збудження як зважену суму за допомогою застосування вагового коефіцієнта до гармонічно розширеного сигналу S160 і/або модульованого сигналу S170 шуму до підсумовування. Кожний подібний ваговий коефіцієнт може бути обчислений згідно з одним або більше критеріїв і може бути фіксованим значенням або, альтернативно, може бути адаптивним значенням, яке обчислюється на основі кадр-за-кадром або субкадр-за-субкадром. Фіг.16 ілюструє блок-схему реалізації 492 об'єднувача 490, який виконаний з можливістю обчислювати високосмуговий сигнал S120 збудження як зважену суму гармонічно розширеного сигналу S160 і модульованого сигналу S170 шуму. Об'єднувач 492 виконаний з можливістю зважувати гармонічно розширений сигнал S160 згідно з ваговим коефіцієнтом S180 гармонік, щоб зважувати модульований сигнал S170 шуму згідно з ваговим коефіцієнтом S190 шуму і виводити високосмуговий сигнал S120 збудження як суму зважених сигналів. У цьому прикладі об'єднувач 492 включає в себе обчислювач 550 вагових коефіцієнтів, який виконаний з можливістю обчислювати ваговий коефіцієнт S180 гармонік і ваговий коефіцієнт 190 шуму. Обчислювач 550 вагових коефіцієнтів може бути виконаний з можливістю обчислювати вагові коефіцієнти S180 і S190 згідно з необхідним співвідношенням рівня гармонік до рівня шуму у високосмуговому сигналі S120 збудження. Наприклад, може бути бажаним для об'єднувача 492 формувати високосмуговий сигнал S120 збудження так, щоб мати співвідношення енергії гармонік до енергії шуму аналогічним цьому співвідношенню високосмугового сигналу S30. У деяких реалізаціях обчислювача 550 вагових коефіцієнтів, вагові коефіцієнти S180, S190 обчислюються згідно з одним або більше параметрів, що належать до періодичності вузькосмугового сигналу S20 або вузькосмугового залишкового сигналу, наприклад, посилення основного тону і/або мовний режим. Така реалізація обчислювача 550 вагових коефіцієнтів може бути сконфігурована так, щоб призначати значення ваговому коефіцієнту S180 гармонік, яке пропорційне посиленню основного тону, наприклад, і/або призначати більш високе значення ваговому коефіцієнту S190 шуму для сигналів невокалізованої мови, ніж для сигналів вокалізо 33 ваної мови. У інших реалізаціях обчислювач 550 вагових коефіцієнтів виконаний з можливістю обчислювати значення вагового коефіцієнта S180 гармонік і/або вагового коефіцієнта S190 шуму згідно з показником періодичності високосмугового сигналу S30. У одному такому прикладі обчислювач 550 вагових коефіцієнтів обчислює ваговий коефіцієнт S180 гармонік як максимальне значення коефіцієнта автокореляції високосмугового сигналу S30 для поточного кадру або субкадру, де автокореляція виконується для діапазону пошуку, який включає в себе затримку в одне запізнення основного тону і не включає в себе затримку в нульові вибірки. Фіг.17 ілюструє приклад такого діапазону пошуку довжиною n вибірок, який центрований навколо затримки в одне запізнення основного тону і має ширину не більше одного запізнення основного тону. Фіг.17 також ілюструє приклад іншого підходу, в якому обчислювач 550 вагових коефіцієнтів обчислює показник періодичності високосмугового сигналу S30 за декілька стадій. На першій стадії поточний кадр ділиться на ряд субкадрів, і затримка, для якої коефіцієнт автокореляції є максимальним, ідентифікується окремо для кожного субкадру. Як згадувалося вище, автокореляція виконується для діапазону пошуку, який включає в себе затримку в одне запізнення основного тону і не включає в себе затримку в нульові вибірки. На другій стадії затриманий кадр складається за допомогою застосування відповідної ідентифікованої затримки до кожному субкадру, конкатенації результуючих субкадрів, щоб скласти оптимально затриманий кадр, і обчислення вагового коефіцієнта S180 гармонік як коефіцієнта кореляції між вихідним кадром і оптимально затриманим кадром. У додатковій альтернативі обчислювач 550 вагових коефіцієнтів обчислює ваговий коефіцієнт S180 гармонік як середнє максимальних коефіцієнтів автокореляції, одержане на першій стадії для кожного субкадру. Реалізації обчислювача 550 вагових коефіцієнтів також можуть бути сконфігуровані так, щоб масштабувати коефіцієнт кореляції і/або об'єднувати його з іншим значенням, щоб обчислювати значення вагового коефіцієнта S180 гармонік. Може бути бажаним для обчислювача 550 вагових коефіцієнтів обчислювати показник періодичності високосмугового сигналу S30 тільки у випадках, коли наявність періодичності в кадрі вказана іншим чином. Наприклад, обчислювач 550 вагових коефіцієнтів може бути виконаний з можливістю обчислювати показник періодичності високосмугового сигналу S30 згідно з відношенням між іншим індикатором періодичності поточного кадру, наприклад, посиленням основного тону, і пороговим значенням. У одному прикладі обчислювач 550 вагових коефіцієнтів виконаний з можливістю виконувати операцію автокореляції для високосмугового сигналу S30, тільки якщо посилення основного тону кадру (наприклад, посилення адаптивної таблиці кодування вузькосмугового залишку) має значення більше 0,5 (альтернативно, щонайменше, 0,5). У іншому прикладі обчислювач 550 ваго 92742 34 вих коефіцієнтів виконаний з можливістю виконувати операцію автокореляції для високосмугового сигналу S30 тільки для кадрів, що мають конкретні стани мовного режиму (наприклад, тільки для вокалізованих сигналів). У цих випадках обчислювач 550 вагових коефіцієнтів може бути виконаний з можливістю призначати ваговий коефіцієнт за умовчанням для кадрів, що мають інші стани мовного режиму і/або менші значення посилення основного тону. Варіанти здійснення включають в себе додаткові реалізації обчислювача 550 вагових коефіцієнтів, які сконфігуровані так, щоб обчислювати вагові коефіцієнти згідно з характеристиками, відмінними або на додачу до періодичності. Наприклад, ця реалізація може бути сконфігурована так, щоб призначати більш високе значення коефіцієнту S190 посилення шуму для мовних сигналів, що мають велике запізнення основного тону, ніж для мовних сигналів, що мають невелике запізнення основного тону. Інша така реалізація обчислювача 550 вагових коефіцієнтів сконфігурована так, щоб визначати показник гармонічності широкосмугового мовного сигналу S10 або високосмугового сигналу S30 згідно з показником енергії сигналу в кратних значеннях власної частоти відносно енергії сигналу в інших частотних компонентах. Деякі реалізації широкосмугового мовного кодера А100 сконфігуровані так, щоб виводити індикацію періодичності або гармонічності (наприклад, однобітову ознаку, яка вказує те, є кадр гармонічним або негармонічним), на основі посилення основного тону і/або іншого показника періодичності або гармонічності, описаного в даному документі. У одному прикладі, відповідний широкосмуговий мовний декодер В100 використовує цю індикацію для того, щоб конфігурувати таку операцію, як обчислення вагових коефіцієнтів. У іншому прикладі ця індикація використовується в кодері і/або декодері при обчисленні значення параметра мовного режиму. Може бути бажаним для високосмугового генератора A302 збудження формувати високосмуговий сигнал S120 збудження, так щоб на енергію сигналу збудження практично не впливали конкретні значення вагових коефіцієнтів S180 і S190. У цьому випадку обчислювач 550 вагових коефіцієнтів може бути виконаний з можливістю обчислювати значення вагового коефіцієнта S180 гармонік для вагового коефіцієнта S190 шуму (або приймати це значення із запам'ятовуючого пристрою або іншого елемента високосмугового кодера А200) і витягувати значення іншого вагового коефіцієнта згідно, наприклад, з таким виразом: ( (Wharmonic)2+(Wnoise)2=1 2) Де Wharmonic означає ваговий коефіцієнт S180 гармонік, a Wnoise означає ваговий коефіцієнт S190 шуму. Альтернативно, обчислювач 550 вагових коефіцієнтів може бути виконаний з можливістю вибирати, згідно із значенням показника періодичності поточного кадру або субкадру, відповідну одну з множини пар вагових коефіцієнтів S180, S190, де пари попередньо обчислюються так, щоб 35 задовольняти відношенню постійності енергії, такому як вираз (2). Для реалізації обчислювача 550 вагових коефіцієнтів, в якій спостерігається вираз (2), типові значення вагового коефіцієнта S180 гармонік варіюються від приблизно 0,7 до приблизно 1,0, а типові значення вагового коефіцієнта S190 шуму варіюються від приблизно 0,1 до приблизно 0,7. Інші реалізації обчислювача 550 вагових коефіцієнтів можуть бути сконфігуровані так, щоб функціонувати згідно з версією виразу (2), яка модифікована згідно з необхідним базовим зважуванням між гармонічно розширеним сигналом S160 і модульованим сигналом S170 шуму. Перешкоди можуть виникати в синтезованому сигналі, коли розріджена таблиця кодування (таблиця, записи якої переважно є нульовими значеннями) використана для того, щоб обчислювати квантоване представлення залишку. Розрідженість таблиці кодування виникає особливо тоді, коли вузькосмуговий сигнал кодується з низькою швидкістю передачі бітів. Перешкоди, що викликаються розрідженістю таблиці кодування, в типовому варіанті є квазіперіодичними у часі і виникають головним чином вище 3КГц. Оскільки людський слух має кращу часову розрізнювальну здатність при більш високих частотах, ці перешкоди можуть бути більш помітні в смузі високих частот. Варіанти здійснення включають в себе реалізації високосмугового генератора A300 збудження, які сконфігуровані так, щоб виконувати фільтрацію, що усуває розрідженість. Фіг.18 ілюструє блок-схему реалізації A312 високосмугового генератора A302 збудження, який включає в себе фільтр 600, що усуває розрідженість, виконаний з можливістю фільтрувати деквантований вузькосмуговий сигнал збудження, сформований за допомогою зворотного квантувача 450. Фіг.19 ілюструє блок-схему реалізації A314 високосмугового генератора A302 збудження, який включає в себе фільтр 600, що усуває розрідженість, виконаний з можливістю фільтрувати спектрально розширений сигнал, сформований за допомогою розширювача А400 спектра. Фіг.20 ілюструє блок-схему реалізації A316 високосмугового генератора A302 збудження, який включає в себе фільтр 600, що усуває розрідженість, виконаний з можливістю фільтрувати виведення об'єднувача 490, щоб сформувати високосмуговий сигнал S120 збудження. Зрозуміло, реалізації високосмугового генератора A300 збудження, які комбінують ознаки будь-якої з реалізацій А304 і А306 з ознаками будь-якої з реалізацій A312, A314 і A316, маються на увазі і тим самим явно розкриваються. Фільтр 600, що усуває розрідженість, може бути також виконаний в складі розширювача А400 спектра: наприклад, після будь-якого з елементів 510, 520, 530 і 540 в розширювачі А402 спектра. Потрібно особливо підкреслити, що фільтр 600, що усуває розрідженість, також може бути використаний з реалізаціями розширювача А400 спектра, які виконують спектральне накладання, спектральне перетворення або гармонічне продовження. Фільтр 600, що усуває розрідженість, може бути виконаний з можливістю змінювати фазу свого вхідного сигналу. Наприклад, може бути бажаним 92742 36 для фільтра 600, що усуває розрідженість, бути сконфігурованим і розміщеним так, щоб фаза високосмугового сигналу S120 збудження була рандомізована або іншим чином більш рівномірно розподілена у часі. Також може бути бажаним для характеристики фільтра 600, що усуває розрідженість, бути більш спектрально плоскою, з тим щоб спектр гучності фільтрованого сигналу не змінювався значною мірою. У одному прикладі фільтр 600, що усуває розрідженість, реалізований як всечастотний фільтр, що має передавальну функцію згідно з наступним виразом: 0,7 z 4 0,6 z 6 ( H( z ) 3) 4 1 0,6z 6 1 0,7z Один ефект такого фільтра може полягати в тому, щоб розповсюджувати енергію вхідного сигналу так, що вона більше не концентрується тільки в невеликому числі вибірок. Перешкоди, що викликаються розрідженістю таблиці кодування, звичайно більш помітні для шумоподібних сигналів, де залишок включає в себе менше інформації основного тону, а також для мови в фоновому шумі. Розрідженість в типовому варіанті викликає менше перешкод у випадках, якщо збудження має довгострокову структуру, і фактична модифікація фази може викликати зашумленість у вокалізованих сигналах. Таким чином, може бути бажаним сконфігурувати фільтр 600, що усуває розрідженість, так, щоб фільтрувати невокалізовані сигнали і пропускати щонайменше деякі вокалізовані сигнали без зміни. Невокалізовані сигнали відрізняються низьким посиленням основного тону (наприклад, посиленням квантованої вузькосмугової адаптивної таблиці кодування) і нахилом спектра (наприклад, квантованим першим коефіцієнтом відображення), який близький до нуля або позитивний, показуючи спектральну огинаючу, яка плоска або нахиляється вгору з підвищенням частоти. Типові реалізації фільтра 600, що усуває розрідженість, сконфігуровані так, щоб фільтрувати невокалізовані звуки (наприклад, як указано за допомогою значення нахилу спектра), фільтрувати вокалізовані звуки, коли посилення основного тону нижче порогового значення (альтернативно, не перевищує порогове значення), а в іншому випадку пропускати сигнал без зміни. Додаткові реалізації фільтра 600, що усуває розрідженість, включають в себе два або більше фільтрів, які сконфігуровані так, щоб мати різні максимальні кути модифікації фази (наприклад, до 180 градусів). У цьому випадку фільтр 600, що усуває розрідженість, може бути виконаний з можливістю вибирати з цих компонентних фільтрів згідно із значенням посилення основного тону (наприклад, посилення квантованої адаптивної таблиці кодування або LTP), з тим щоб більший максимальний кут модифікації фази використовувався для кадрів, що мають менші значення посилення основного тону. Реалізація фільтра 600, що усуває розрідженість, також може включати в себе різні компонентні фільтри, які сконфігуровані так, щоб модифікувати фазу по більшій або меншій частині частотного спектра, з тим щоб фільтр, виконаний з 37 можливістю модифікувати фазу по більш широкому частотному діапазону вхідного сигналу, використовувався для кадрів, що мають менші значення посилення основного тону. Для точного відтворення кодованого мовного сигналу може бути бажаним для співвідношення між рівнями високосмугової і вузькосмугової частин синтезованого мовного сигналу S100 бути аналогічним цьому співвідношенню у вихідному широкосмуговому мовному сигналі S10. Крім спектральної огинаючої, представленої за допомогою параметрів S60a високосмугового кодування, високосмуговий кодер А200 може бути виконаний з можливістю характеризувати високосмуговий сигнал S30 за допомогою задавання огинаючої часу або посилення. Як проілюстровано на Фіг.10, високосмуговий кодер А202 включає в себе обчислювач А230 коефіцієнтів високосмугового посилення, який сконфігурований і виконаний з можливістю обчислювати один або більше коефіцієнтів посилення згідно з відношенням між високосмуговим сигналом S3 0 і синтезованим високосмуговим сигналом S130, таким як різниця або співвідношення між енергіями двох сигналів протягом кадру або якої-небудь його частини. У інших реалізаціях високосмугового кодера А202 обчислювач А230 високосмугового посилення може бути аналогічно сконфігурований, але виконаний з можливістю обчислювати замість цього огинаючу посилення згідно з даним змінюваним у часі відношенням між високосмуговим сигналом S30 і вузькосмуговим сигналом S80 збудження або високосмуговим сигналом S120 збудження. Часові огинаючі вузькосмугового сигналу S80 збудження і високосмугового сигналу S30 з великою часткою імовірності аналогічні. Отже, кодування огинаючої посилення, яке засноване на відношенні між високосмуговим сигналом S30 і вузькосмуговим сигналом S80 збудження (або сигналом, витягнутим з нього, наприклад, високосмуговим сигналом S120 збудження або синтезованим високосмуговим сигналом S130), як правило, більш ефективне, ніж кодування огинаючої посилення на основі тільки високосмугового сигналу S30. У типовій реалізації високосмуговий кодер А202 виконаний з можливістю виводити квантований індекс з восьми-дванадцяти бітів, який задає п'ять коефіцієнтів посилення для кожного кадру. Обчислювач А230 коефіцієнтів високосмугового посилення може бути виконаний з можливістю виконувати обчислення коефіцієнтів посилення як задачу, яка включає в себе одну або більше послідовностей підзадач. Фіг.21 ілюструє блок-схему послідовності операцій прикладу Т200 такої задачі, яка обчислює значення посилення для відповідного субкадру згідно з відносними енергіями високосмугового сигналу S30 і синтезованого високосмугового сигналу S130. Задачі 220а і 220b обчислюють енергії відповідних субкадрів належних сигналів. Наприклад, задачі 220а і 220Ь можуть бути сконфігуровані так, щоб обчислювати енергію як суму квадратів вибірок відповідного субкадру. Задача Т230 обчислює коефіцієнт посилення для субкадру як квадратний корінь співвідношення цих енергій. У цьому прикладі задача 92742 38 Т230 обчислює коефіцієнт посилення як квадратний корінь відношення енергії високосмугового сигналу S30 до енергії синтезованого високосмугового сигналу S130 протягом субкадру. Може бути бажаним для обчислювача А230 коефіцієнтів високосмугового посилення бути сконфігурованим так, щоб обчислювати енергії субкадрів згідно з функцією кадрування. Фіг.22 ілюструє блок-схему послідовності операцій такої реалізації Т210 задачі Т200 обчислення коефіцієнта посилення. Задача Т215а застосовує функцію кадрування до високосмугового сигналу S30, а задача Т215b застосовує таку ж функцію кадрування до синтезованого високосмугового сигналу S130. Реалізації 222а і 222b задач 220а і 220b обчислюють енергії відповідних вікон, а задача Т230 обчислює коефіцієнт посилення для субкадру як квадратний корінь відношення енергій. Може бути бажаним застосовувати функцію кадрування, яка перекриває сусідні вікна. Наприклад, функція кадрування, яка формує коефіцієнти посилення, які можуть бути застосовані за допомогою перекриття з підсумовуванням, може допомогти знизити або усунути розривність між субкадрами. У одному прикладі обчислювач А230 коефіцієнтів високосмугового посилення виконаний з можливістю застосовувати трапецієподібну функцію кадрування, як показано на Фіг.23 а, в якій вікно перекриває кожний з двох сусідніх субкадрів на одну мілісекунду. Фіг.23b ілюструє застосування цієї функції кадрування до кожного з п'яти субкадрів 20-мілісекундного кадру. Інші реалізації обчислювача А230 коефіцієнтів високосмугового посилення можуть бути сконфігуровані так, щоб застосовувати функції кадрування, що мають інші періоди перекриття і/або інші форми вікон (наприклад, прямокутне, Хеммінга), які можуть бути симетричними або асиметричними. Також можливо для реалізації обчислювача А230 коефіцієнтів високосмугового посилення бути сконфігурованим так, щоб застосовувати різні функції кадрування до різних субкадрів в рамках кадру і/або для кадру, щоб включати в себе субкадри різної довжини. Без обмеження, наступні значення представлені як приклади для конкретних реалізацій. 20мілісекундний кадр передбачається для цих випадків, хоч будь-яка інша тривалість може бути використана. Для високосмугового сигналу, дискретизованого при 7КГц, кожний кадр має 140 вибірок. Якщо такий кадр ділиться на п'ять субкадрів рівної довжини, кожний кадр повинен мати 28 вибірок, і вікно, показане на Фіг.23а, повинно мати ширину 42 вибірки. Для високосмугового сигналу, дискретизованого при 8КГц, кожний кадр має 160 вибірок. Якщо такий кадр ділиться на п'ять субкадрів рівної довжини, кожний кадр повинен мати 32 вибірки, і вікно, показане на Фіг.23а, повинно мати ширину 48 вибірок. У інших реалізаціях субкадри будь-якої ширини можуть бути використані, і навіть можливо для реалізації обчислювача А230 високосмугового посилення бути сконфігурованою так, щоб формувати різний коефіцієнт посилення для кожної вибірки кадру. Фіг.24 ілюструє блок-схему реалізації В202 високосмугового декодера В200. Високосмуговий 39 декодер В202 включає в себе високосмуговий декодер В300 збудження, який виконаний з можливістю формувати високосмуговий сигнал S120 збудження на основі вузькосмугового сигналу S80 збудження. Залежно від конкретних варіантів проектування системи, високосмуговий генератор В300 збудження може бути реалізований згідно з будь-якою з реалізацій високосмугового генератора A300 збудження, описаних в даному документі. Типово бажано реалізувати високосмуговий генератор В300 збудження, щоб мати таку ж характеристику, як високосмуговий генератор збудження високосмугового кодера конкретної системи кодування. Оскільки вузькосмуговий декодер В110 в типовому варіанті виконує деквантування кодованого вузькосмугового сигналу S50 збудження, проте, в більшості випадків високосмуговий генератор В300 збудження може бути реалізований так, щоб приймати вузькосмуговий сигнал S80 збудження від вузькосмугового кодера В110, і не обов'язково повинен включати в себе зворотний квантувач, виконаний з можливістю деквантувати кодований вузькосмуговий сигнал S50 збудження. Також можна для вузькосмугового декодера В110 бути реалізованим так, щоб включати в себе екземпляр фільтра 600, що усуває розрідженість, виконаного з можливістю фільтрації деквантованного вузькосмугового сигналу збудження до того, як він входить у вузькосмуговий синтезуючий фільтр, такий як фільтр 330. Зворотний квантувач 560 виконаний з можливістю деквантувати параметри S60a високосмугового фільтра (в даному прикладі, до набору LSF), а перетворення 570 LSF в параметри LP-фільтра перетворює LSF в набір коефіцієнтів фільтра (наприклад, як описано вище з посиланням на зворотний квантувач 240 і перетворення 250 вузькосмугового кодера А122). У інших реалізаціях, як згадувалося вище, інші набори коефіцієнтів (наприклад, коефіцієнтів косинусного перетворення Фур'є) і/або представлення коефіцієнтів (наприклад, ISP) можуть бути використані. Високосмуговий синтезуючий фільтр В200 виконаний з можливістю формувати синтезований високосмуговий сигнал згідно з високосмуговим сигналом S120 збудження і набором коефіцієнтів фільтра. Для системи, в якій високосмуговий кодер включає в себе синтезуючий фільтр (наприклад, як у випадку кодера А202, описаного вище), може бути бажаним реалізувати високосмуговий синтезуючий фільтр В200 так, щоб мати таку ж характеристику (наприклад, таку ж передавальну функцію), що і характеристика синтезуючого фільтра. Високосмуговий декодер В202 також включає в себе зворотний квантувач 580, виконаний з можливістю деквантувати коефіцієнти S60b високосмугового посилення, і елемент 590 регулювання посилення (наприклад, помножувач або підсилювач), сконфігурований і виконаний з можливістю застосовувати деквантовані коефіцієнти посилення до синтезованого високосмугового сигналу, щоб формувати високосмуговий сигнал S100. Для випадку, в якому огинаюча посилення кадру задана за допомогою декількох коефіцієнтів посилення, елемент 590 регулювання посилення може 92742 40 включати в себе логіку, сконфігуровану так, щоб застосовувати коефіцієнти посилення до відповідних субкадрів, можливо, згідно з функцією кадрування, яка може бути такою ж або іншою функцією кадрування, як та, що застосовується за допомогою обчислювача посилення (наприклад, обчислювача А230 високосмугового посилення) відповідного високосмугового кодера. У інших реалізаціях високосмугового кодера В202 елемент 590 регулювання посилення сконфігурований аналогічно, але виконаний з можливістю застосовувати замість цього деквантовані коефіцієнти посилення до вузькосмугового сигналу S80 збудження або високосмугового сигналу S120 збудження. Як згадувалося вище, може бути бажаним одержати один стан у високосмуговому кодері і високосмуговому декодері (наприклад, за допомогою використання деквантованих значень в ході кодування). Таким чином, може бути бажаним в системі кодування згідно з цією реалізацією забезпечити однаковий стан відповідних генераторів шуму у високосмугових генераторах A300 і В300 збудження. Наприклад, високосмугові генератори А300 і В300 збудження цієї реалізації можуть бути сконфігуровані так, що режим генератора шуму є детермінованою функцією від інформації, вже закодованої в рамках цього кадру (наприклад, параметрів S40 вузькосмугового фільтра або їх частини і/або кодованого вузькосмугового сигналу S50 збудження або його частини). Один або більше квантувачів елементів, описаних в даному документі (наприклад, квантувач 230, 420 або 430), можуть бути сконфігуровані так, щоб виконувати класифіковане векторне квантування. Наприклад, цей квантувач може бути виконаний з можливістю вибирати одну з набору таблиць кодування на основі інформації, яка вже закодована в тому ж кадрі у вузькосмуговому каналі і/або у високосмуговому каналі. Дана методика в типовому варіанті надає велику ефективність кодування за рахунок додаткового місця для зберігання таблиці кодування. Як описано вище з посиланням, наприклад, на Фіг.8 і 9, значна частина періодичної структури може залишатися в залишковому сигналі після видалення приблизної спектральної огинаючої з вузькосмугового мовного сигналу S20. Наприклад, залишковий сигнал може містити послідовність приблизно періодичних імпульсів або викидів у часі. Ця структура, яка в типовому варіанті пов'язана з основним тоном, з особливо великою імовірністю може виникати у вокалізованих мовних сигналах. Обчислення квантованого представлення вузькосмугового залишкового сигналу може включати в себе кодування цієї структури основного тону згідно з моделлю довгострокової періодичності, як представлена за допомогою, наприклад, однієї або більше таблиць кодування. Структура основного тону фактичного залишкового сигналу може не співпадати точно з моделлю періодичності. Наприклад, залишковий сигнал може включати в себе невеликі тремтіння фази стосовно регулярності позицій імпульсів основного тону так, що відстані між послідовними імпульсами основного тону в кадрі не співпадають в точності, і 41 структура не є досить регулярною. Ця нерегулярність часто знижує ефективність кодування. Деякі реалізації вузькосмугового кодера А120 сконфігуровані так, щоб виконувати регуляризацію структури основного тону за допомогою застосування адаптивного передспотворення шкали часу до залишку до або в ході квантування, або за допомогою включення в іншому випадку адаптивного передспотворення шкали часу в кодований сигнал збудження. Наприклад, цей кодер може бути виконаний з можливістю вибирати або іншим чином обчислювати міру передспотворення шкали часу (наприклад, згідно з одним або більше критеріїв перцепційного зважування і/або мінімізацією помилок), з тим щоб результуючий сигнал збудження оптимально відповідав моделі довгострокової періодичності. Регуляризація структури основного тону виконується за допомогою піднабору CELPкодерів, званих кодерами за допомогою лінійного прогнозу із збудженням релаксаційним кодом (RCELP). RCELP-кодер в типовому варіанті виконаний з можливістю виконувати передспотворення шкали часу як адаптивний зсув за часом. Зсувом за часом може бути затримка, що варіюється від декількох мілісекунд зі знаком мінус до декількох мілісекунд зі знаком плюс, а вона звичайно змінюється плавно, щоб не допустити чутних розривностей. У деяких реалізаціях цей кодер виконаний з можливістю застосовувати регуляризацію кусковолінійним методом, при якому кожний кадр або субкадр передспотворюється за допомогою відповідного фіксованого зсуву за часом. У інших реалізаціях кодер виконаний з можливістю застосовувати регуляризацію як безперервну функцію передспотворення шкали, з тим, щоб кадр або субкадр передспотворювався згідно з контуром основного тону (також званого траєкторією основного тону). У деяких випадках (наприклад, як описано в Патентній заявці (США) 2004/0098255) кодер виконаний з можливістю включати передспотворення шкали часу в кодований сигнал збудження за допомогою застосування зсуву до перцепційно зваженого вхідного сигналу, який використовується для того, щоб обчислювати кодований сигнал збудження. Кодер обчислює кодований сигнал збудження, який регуляризований і квантований, а декодер деквантує кодований сигнал збудження, щоб одержати сигнал збудження, який використовується для того, щоб синтезувати декодований мовний сигнал. Таким чином, декодований вихідний сигнал надає таку ж затримку варіювання, що і включена в кодований сигнал збудження за допомогою регуляризації. У типовому варіанті, інформація, що задає величини регуляризації, не передається в декодер. Регуляризація часто спрощує кодування залишкового сигналу, що збільшує продуктивність кодування довгострокового передбачувача і тим самим підвищує загальну ефективність кодування, як правило, без формування перешкод. Може бути бажаним виконувати регуляризацію тільки для кадрів, які є вокалізованими. Наприклад, вузькосмуговий кодер А124 може бути виконаний з можливістю зсувати тільки кадри або субкадри, що 92742 42 мають довгострокову структуру, такі як вокалізовані сигнали. Може бути бажаним навіть виконувати регуляризацію тільки для субкадрів, які включають в себе енергію імпульсів основного тону. Різні реалізації RCELP-кодування описані в Патентах (США) номера 5704003 (Kleijn і ін.) і 6879955 (Rao), а також в Патентній заявці (США) 2004/0098255 (Kovesi і ін.). Існуючі реалізації RCELP-кодерів включають в себе вдосконалений кодек із змінною швидкістю (EVRC), описаний в Асоціації промисловості засобів зв'язку (ТІА) IS127, і вокодер з вибираним режимом (SMV) для Партнерського проекту третього покоління 2 (3GPP2). На жаль, регуляризація може викликати проблеми для широкосмугового мовного кодера, в якому високосмугове збудження витягується з кодованого вузькосмугового сигналу збудження (наприклад, системи, що включає в себе широкосмуговий мовний кодер А100 і широкосмуговий мовний декодер В100). Внаслідок його витягання з сигналу з передспотвореною шкалою часу високосмуговий сигнал збудження, загалом, може мати часову залежність, яка відрізняється від часової залежності вихідного високосмугового мовного сигналу. Іншими словами, високосмуговий сигнал збудження більше не є синхронним з вихідним високосмуговим мовним сигналом. Розузгодження за часом між передспотвореним високосмуговим сигналом збудження і вихідним високосмуговим мовним сигналом може викликати деякі проблеми. Наприклад, передспотворений високосмуговий сигнал збудження може більше не надавати належного вхідного збудження для синтезуючого фільтра, який сконфігурований згідно з параметрами фільтра, витягнутими з вихідного високосмугового мовного сигналу. Як результат, синтезований високосмуговий сигнал може містити чутні перешкоди, які знижують сприйману якість декодованого широкосмугового мовного сигналу. Розузгодження у часі також може приводити до неефективності кодування огинаючої посилення. Як згадувалося вище, кореляція з великою часткою імовірності існує між огинаючими часу вузькосмугового сигналу S80 збудження і високосмугового сигналу S30. За допомогою кодування огинаючої посилення високосмугового сигналу згідно з відношенням між цими двома часовими огинаючими підвищення ефективності кодування може бути реалізоване, в порівнянні з кодуванням безпосередньо огинаючої посилення. Коли кодований вузькосмуговий сигнал збудження регуляризований, проте, ця кореляція може бути ослаблена. Розузгодження у часі між вузькосмуговим сигналом S80 збудження і високосмуговим сигналом S30 може примушувати флуктуації з'являтися в коефіцієнтах S60b високосмугового посилення, і ефективність кодування може впасти. Варіанти здійснення включають в себе способи широкосмугового кодування мови, які виконують передспотворення шкали часу високосмугового мовного сигналу згідно з передспотворенням шкали часу, включеним у відповідний кодований вузькосмуговий сигнал збудження. Потенційні пе 43 реваги цих способів включають в себе підвищення якості декодованого широкосмугового мовного сигналу і/або підвищення ефективності кодування огинаючої високосмугового посилення. Фіг.25 ілюструє блок-схему реалізації AD10 широкосмугового мовного кодера А100. Кодер AD 10 включає в себе реалізацію А124 вузькосмугового кодера А120, яка сконфігурована так, щоб виконувати регуляризацію в ході обчислення кодованого вузькосмугового сигналу S50 збудження. Наприклад, вузькосмуговий кодер А124 може бути сконфігурований згідно з однією або більше реалізаціями RCELP, поясненими вище. Вузькосмуговий кодер А124 також виконаний з можливістю виводити сигнал SD10 даних регуляризації, який задає міру застосовуваного передспотворення шкали часу. Для різних випадків, в яких вузькосмуговий кодер А124 виконаний з можливістю застосовувати фіксований зсув за часом до кожного кадру або субкадру, сигнал SD10 даних регуляризації може включати в себе послідовність значень, що вказують величину кожного зсуву за часом як ціле або неціле значення в показниках вибірок, мілісекунд або якого-небудь іншого приросту часу. Для випадку, коли вузькосмуговий кодер А124 виконаний з можливістю іншим чином модифікувати часову шкалу кадру або іншої послідовності вибірок (наприклад, за допомогою стиснення однієї частини і розширення іншої частини), сигнал SD10 інформації регуляризації може включати в себе відповідний опис модифікації, наприклад, набір параметрів функції. У одному конкретному прикладі вузькосмуговий кодер А124 виконаний з можливістю розділити кадр на три субкадри і обчислити фіксований зсув за часом для кожного субкадру, з тим щоб сигнал SD10 даних регуляризації вказував три величини зсуву за часом для кожного регуляризованого кадру кодованого вузькосмугового сигналу. Широкосмуговий мовний кодер AD10 включає в себе лінію D120 затримки, сконфігуровану так, щоб просувати уперед або сповільнювати частини високосмугового мовного сигналу S30 згідно з величинами затримки, вказаними за допомогою вхідного сигналу, щоб формувати високосмуговий мовний сигнал S30a з передспотворенням шкали часу. У прикладі, показаному на Фіг.25, лінія D120 затримки сконфігурована так, щоб передспотворювати шкалу часу високосмугового мовного сигналу S30 згідно з передспотворенням, вказаним за допомогою сигналу SD10 даних регуляризації. Таким чином, таке ж значення передспотворення шкали часу, що включено в кодований вузькосмуговий сигнал S50 збудження, також застосовується до відповідної частини високосмугового мовного сигналу S30 до аналізу. Хоч цей приклад ілюструє лінію D120 затримки як елемент, окремий від високосмугового кодера А200, в інших реалізаціях лінія D120 затримки розміщена як частина високосмугового кодера. Додаткові реалізації високосмугового кодера А200 можуть бути сконфігуровані так, щоб виконувати спектральний аналіз (наприклад, LPC-аналіз) неспотвореного високосмугового мовного сигналу S30, щоб здійснювати передспотворення шкали 92742 44 часу високосмугового мовного сигналу S30 до обчислення параметрів S60b високосмугового посилення. Даний кодер може включати в себе, наприклад, реалізацію лінії D120 затримки, виконану з можливістю виконувати передспотворення шкали часу. У цих випадках, проте, параметри S60a високосмугового фільтра на основі сигналу S30 без передспотворення шкали часу можуть описувати спектральну огинаючу, яка розузгоджена за часом з високосмуговим сигналом S120 збудження. Лінія D120 затримки може бути сконфігурована згідно з будь-якою комбінацією логічних елементів і елементів запам'ятовуючого пристрою, придатною для застосування необхідних операцій передспотворення шкали часу до високосмугового мовного сигналу S30. Наприклад, лінія D120 затримки може бути сконфігурована так, щоб зчитувати високосмуговий мовний сигнал S30 з буфера згідно з необхідними зсувами за часом. Фіг.26а ілюструє схематичне представлення такої реалізації D122 лінії D120 затримки, яка включає в себе зсувний регістр SR1. Зсувний регістр SR1 це буфер деякої довжини т, який виконаний з можливістю приймати і зберігати m останніх вибірок високосмугового мовного сигналу S30. Значення m дорівнює щонайменше сумі максимальних позитивних (або "просування уперед") і негативних (або "сповільнення") зсувів за часом, які повинні підтримуватися. Може бути зручним, щоб значення m дорівнювало довжині кадру або субкадру високосмугового сигналу S30. Лінія D122 затримки сконфігурована так, щоб виводити високосмуговий сигнал S30a з передспотвореною шкалою часу з позиції OL зміщення зсувного регістра SR1. Позиція OL зміщення змінюється відносно опорної позиції (нульовий зсув за часом) згідно з поточним зсувом за часом, вказаним, наприклад, за допомогою сигналу SD10 даних регуляризації. Лінія D122 затримки може бути сконфігурована так, щоб підтримувати однакові обмеження на просування уперед і сповільнення або, альтернативно, одне обмеження більшим іншого, так щоб міг виконуватися більший зсув в одному, ніж в іншому напрямі. Фіг.26а ілюструє конкретний приклад, який підтримує більший позитивний, ніж негативний зсув за часом. Лінія D122 затримки може бути сконфігурована так, щоб виводити одну або більше вибірок одночасно (в залежності, наприклад, від ширини вихідної шини). Зсув за часом регуляризації, що має гучність більше декількох мілісекунд, може приводити до чутних перешкод в декодованому сигналі. У типовому варіанті, гучність зсуву за часом регуляризації, що виконується за допомогою вузькосмугового кодера А124, не перевищує декількох мілісекунд, так щоб зсуви за часом, вказані за допомогою сигналу SD10 даних регуляризації, обмежувалися. Проте, в цих випадках може бути бажаним для лінії D122 затримки бути сконфігурованою так, щоб накладати максимальне обмеження на зсуви за часом в позитивному і/або негативному напрямі (наприклад, щоб надавати більш суворе обмеження, ніж те, що накладається за допомогою вузькосмугового кодера). Фіг.26b ілюструє схематичне представлення 45 реалізації D124 лінії D122 затримки, яка включає в себе зсувне вікно SW. У цьому прикладі позиція OL зміщення обмежена зсувним вікном SW. Хоч Фіг.26b ілюструє випадок, в якому довжина буфера m перевищує ширину зсувного вікна SW, лінія D124 затримки також може бути реалізована таким чином, щоб ширина зсувного вікна SW дорівнювала m. У інших реалізаціях лінія D120 затримки сконфігурована так, щоб записувати високосмуговий мовний сигнал S30 в буфер згідно з необхідними зсувами за часом. Фіг.27 ілюструє схематичне представлення такої реалізації D130 лінії D120 затримки, яка включає в себе два зсувних регістри SR2 і SR3, сконфігурованих так, щоб приймати і зберігати високосмуговий мовний сигнал S30. Лінія D130 затримки сконфігурована так, щоб записувати кадр або субкадр з зсувного регістра SR2 в зсувний регістр SR3 згідно із зсувом за часом, вказаним, наприклад, за допомогою сигналу SD10 даних регуляризації. Зсувний регістр SR3 сконфігурований як FIFO-буфер, виконаний з можливістю виводити високосмуговий сигнал S30 з передспотворенням шкали часу. У конкретному прикладі, показаному на Фіг.27, зсувний регістр SR2 включає в себе частину FB1 буфера кадрів і частину DB буфера затримки, а зсувний регістр SR3 включає в себе частину FB2 буфера кадрів, частину АВ буфера просування уперед і частину буфера RB сповільнення. Довжина буфера АВ просування уперед і буфера RB сповільнення може співпадати або один може бути довше за інший, так що підтримується більший зсув в одному напрямі, ніж в іншому. Буфер DB затримки і частина RB буфера сповільнення можуть бути сконфігуровані так, щоб мати однакову довжину. Альтернативно, буфер DB затримки може бути коротшим за буфер RB сповільнення, щоб враховувати інтервал часу, необхідний для того, щоб передавати вибірки з буфера FB1 кадрів в зсувний регістр SR3, який може включати в себе інші операції обробки, такі як передспотворення вибірок до збереження в зсувний регістр SR3. У прикладі за Фіг.27 буфер FB1 кадрів виконаний з можливістю мати довжину, яка дорівнює довжині одного кадру високосмугового сигналу S30. У іншому прикладі буфер FB1 кадрів виконаний з можливістю мати довжину, яка дорівнює довжині субкадру високосмугового сигналу S30. У цьому випадку лінія D130 затримки може бути сконфігурована так, щоб включати в себе логіку, щоб застосовувати однакову (наприклад, середню) затримку до всім субкадрів кадру, який повинен бути зсунутий. Лінія D130 затримки також може включати в себе логіку, щоб усереднювати значення з буфера FB1 кадрів зі значеннями, які повинні бути перезаписані в буфер RB сповільнення або буфер АВ просування уперед. У додатковому прикладі зсувний регістр SR3 може бути виконаний з можливістю приймати значення високосмугового сигналу S30 тільки за допомогою буфера FB1 кадрів, і в цьому випадку лінія D130 затримки може включати в себе логіку, щоб інтерполювати по проміжках між послідовними кадрами або субкадрами, записаними в зсувний регістр SR3. У інших реалі 92742 46 заціях лінія D130 затримки може бути сконфігурована так, щоб виконувати операцію передспотворення для вибірок з буфера FB1 кадрів до запису їх в зсувний регістр SR3 (наприклад, згідно з функцією, описаною за допомогою сигналу SD10 даних регуляризації). Може бути бажаним для лінії D120 затримки застосовувати передспотворення шкали часу, яке засноване на, але не ідентичне передспотворенню, заданому за допомогою сигналу SD10 даних регуляризації. Фіг.28 ілюструє блок-схему реалізації AD12 широкосмугового мовного кодера AD 10, яка включає в себе перетворювач (засіб відображення) D110 значень затримки. Перетворювач D110 значень затримки виконаний з можливістю відображати передспотворення, вказане за допомогою сигналу SD10 даних регуляризації, у відображені значення SD10a затримки. Лінія D120 затримки виконана з можливістю формувати високосмуговий мовний сигнал S30a з передспотворенням шкали часу згідно з передспотворенням, вказаним за допомогою відображених значень SD10а затримки. Зсув за часом, що застосовується за допомогою вузькосмугового кодера, як очікується, може плавно розвиватися з часом. Отже, в типовому варіанті досить обчислити середній вузькосмуговий зсув за часом, що застосовується до субкадрів протягом кадру мови, і зсунути відповідний кадр високосмугового мовного сигналу S30 згідно з цим середнім. У одному такому прикладі перетворювач D110 значень затримки виконаний з можливістю обчислювати середнє значень затримки субкадрів для кожного кадру, а лінія D120 затримки сконфігурована так, щоб застосовувати обчислене середнє до відповідного кадру високосмугового сигналу S30. У інших прикладах середнє за більш короткий період (наприклад, два субкадри або половина кадру) або більш довгий період (наприклад, два кадри) може бути обчислене і застосоване. У випадку, якщо середнє є нецілим значенням вибірок, перетворювач D110 значень затримки може бути виконаний з можливістю округляти значення до цілого числа вибірок до виведення в лінію D120 затримки. Вузькосмуговий кодер А124 може бути виконаний з можливістю включати в себе зсув за часом регуляризації нецілого числа вибірок в кодованому вузькосмуговому сигналі збудження. У цьому випадку може бути бажаним для перетворювача D110 значень затримки бути сконфігурованим так, щоб округляти вузькосмуговий зсув за часом цілим числом виборів, а для лінії D120 затримки - застосовувати округлений зсув за часом до високосмугового мовного сигналу S30. У деяких реалізаціях широкосмугового мовного кодера AD 10 частоти дискретизації вузькосмугового мовного сигналу S20 і широкосмугового мовного сигналу S30 можуть розрізнюватися. У цих випадках перетворювач D110 значень затримки може бути виконаний з можливістю коректувати величини зсуву за часом, вказані в сигналі SD10 даних регуляризації, щоб враховувати різницю між частотами дискретизації вузькосмугового мовного сигналу S20 (або вузькосмугового сигналу S80 47 збудження) і високосмугового мовного сигналу S30. Наприклад, перетворювач D110 значень затримки може бути виконаний з можливістю масштабувати величини зсуву за часом згідно зі співвідношенням частот дискретизації. У одному конкретному прикладі, наведеному вище, вузькосмуговий мовний сигнал S20 дискретизується при 8КГц, а високосмуговий мовний сигнал S30 дискретизується при 7КГц. У цьому випадку перетворювач D110 значень затримки виконаний з можливістю множити кожну величину затримки на 7/8. Реалізації перетворювача D110 значень затримки також можуть бути сконфігуровані так, щоб виконувати цю операцію масштабування разом з операцією округлення до цілого числа і/або усереднення зсувів за часом, описаною в даному документі. У додаткових реалізаціях лінія D120 затримки сконфігурована так, щоб іншим чином модифікувати шкалу часу кадру або іншої послідовності вибірок (наприклад, за допомогою стиснення однієї частини і розширення іншої частини). Наприклад, вузькосмуговий кодер А124 може бути виконаний з можливістю виконувати регуляризацію згідно з такою функцією, як контур або траєкторія основного тону. У цьому випадку сигнал SD10 даних регуляризації може включати в себе відповідний опис функції, наприклад, набір параметрів, а лінія D120 затримки може включати в себе логіку, сконфігуровану так, щоб передспотворювати кадри або субкадри високосмугового мовного сигналу S30 згідно з функцією. У інших реалізаціях перетворювач D110 значень затримки виконаний з можливістю усереднювати, масштабувати і/або округляти функцію до того, як вона застосовується до високосмугового мовного сигналу S30 за допомогою лінії D120 затримки. Наприклад, перетворювач D110 значень затримки може бути виконаний з можливістю обчислювати одне або більше значень затримки згідно з функцією, причому кожне значення затримки включає в себе ряд вибірок, які потім застосовуються за допомогою лінії D120 затримки, щоб передспотворювати шкалу часу одного або більше відповідних кадрів або субкадрів високосмугового сигналу S30. Фіг.29 ілюструє блок-схему послідовності операцій способу MD100 передспотворення шкали часу високосмугового мовного сигналу згідно з передспотворенням шкали часу, включеним у відповідний кодований вузькосмуговий сигнал збудження. Задача TD100 обробляє широкосмуговий мовний сигнал, щоб одержати вузькосмуговий мовний сигнал і високосмуговий мовний сигнал. Наприклад, задача TD100 може бути сконфігурована так, щоб фільтрувати широкосмуговий мовний сигнал за допомогою гребінки фільтрів, що має низькочастотні і високочастотні фільтри, наприклад, реалізації гребінки фільтрів А110. Задача TD200 кодує вузькосмуговий мовний сигнал щонайменше в кодований вузькосмуговий сигнал збудження і множину параметрів вузькосмугового фільтра. Кодований вузькосмуговий сигнал збудження і/або параметри фільтра можуть бути квантовані, і кодований вузькосмуговий мовний сигнал також може включати в себе інші параметри, 92742 48 наприклад, параметр мовного режиму. Задача TD200 також включає в себе передспотворення шкали часу в кодованому вузькосмуговому сигналі збудження. Задача TD300 формує високосмуговий сигнал збудження на основі вузькосмугового сигналу збудження. У цьому випадку вузькосмуговий сигнал збудження заснований на кодованому вузькосмуговому сигналі збудження. Згідно з щонайменше високосмуговим сигналом збудження, задача TD400 кодує високосмуговий мовний сигнал щонайменше у множину параметрів високосмугового фільтра. Наприклад, задача TD400 може бути сконфігурована так, щоб кодувати високосмуговий мовний сигнал щонайменше у множину квантованих LSF. Задача TD500 застосовує зсув за часом до високосмугового мовного сигналу, який заснований на інформації, пов'язаній з передспотворенням шкали часу, включеній в кодований вузькосмуговий сигнал збудження. Задача TD400 може бути сконфігурована так, щоб виконувати спектральний аналіз (наприклад, LPC-аналіз) високосмугового мовного сигналу і/або обчислювати огинаючу посилення високосмугового мовного сигналу. У цих випадках задача TD500 може бути сконфігурована так, щоб застосовувати зсув за часом до високосмугового мовного сигналу до аналізу і/або обчислення огинаючої посилення. Інші реалізації широкосмугового мовного кодера А100 сконфігуровані так, щоб виконувати протилежне передспотворення шкали часу високосмугового сигналу S120 збудження, викликане за допомогою передспотворення шкали часу, включеного в кодований вузькосмуговий сигнал збудження. Наприклад, високосмуговий генератор A300 збудження може бути реалізований так, щоб включати в себе реалізацію лінії D120 затримки, яка сконфігурована так, щоб приймати сигнал SD10 даних регуляризації або перетворені значення SD10a затримки або застосовувати відповідний зворотний зсув за часом до вузькосмугового сигналу S80 збудження і/або до подальшого сигналу на основі нього, такого як гармонічно розширений сигнал S160 або високосмуговий сигнал S120 збудження. Додаткові реалізації широкосмугового мовного кодера можуть бути сконфігуровані так, щоб кодувати вузькосмуговий мовний сигнал S20 і високосмуговий мовний сигнал S30 незалежно один від одного, з тим щоб високосмуговий мовний сигнал S30 кодувався як представлення високосмугової спектральної огинаючої і високосмугового сигналу збудження. Ця реалізація може бути сконфігурована так, щоб виконувати передспотворення шкали часу високосмугового залишкового сигналу або іншим чином включати передспотворення шкали часу в кодований високосмуговий сигнал збудження згідно з інформацією, пов'язаною з передспотворенням шкали часу, включеною в кодований вузькосмуговий сигнал збудження. Наприклад, високосмуговий кодер може включати в себе реалізацію лінії D120 затримки і/або перетворювач D110 значень затримки, описані в даному документі, які сконфігуровані так, щоб застосовувати пе 49 редспотворення шкали часу до високосмугового залишкового сигналу. Потенційні переваги цієї операції включають в себе більш ефективне кодування високосмугового залишкового сигналу і кращий збіг між синтезованими вузькосмуговим і високосмуговим мовними сигналами. Як згадувалося вище, варіанти здійснення, описані в даному документі, включають в себе реалізації, які можуть бути використані для того, щоб виконувати вбудоване кодування, підтримуючи сумісність з вузькосмуговими системами і усуваючи потребу в перекодуванні. Підтримка високосмугового кодування також може служити для того, щоб провести відмінності на основі витрат між мікросхемами, наборами мікросхем, пристроями і/або мережами, що мають широкосмугову підтримку із зворотною сумісністю, а також мають тільки вузькосмугову підтримку. Підтримка високосмугового кодування, описана в даному документі, також може бути використана в зв'язку з методикою підтримки низькосмугового кодування, і система, спосіб або пристрій згідно з цим варіантом здійснення можуть підтримувати кодування частотних компонентів, наприклад, від приблизно 50 або 100Гц до приблизно 7 або 8КГц. Як згадувалося вище, додавання високосмугової підтримки в мовний кодер дозволяє підвищити розбірливість, особливо відносно розрізнення фрикативних звуків. Хоч це розрізнення звичайно може бути витягнуте слухаючою стороною з конкретного вмісту, підтримка смуги високих частот може виступати як розрізнювальна ознака в розпізнаванні мови і інших додатках машинної інтерпретації, наприклад, систем автоматичної мовної навігації по меню і/або автоматичної обробки викликів. Пристрій згідно з варіантом здійснення може бути вбудований в портативний пристрій мобільного зв'язку, наприклад, стільниковий телефон або особистий цифровий пристрій (PDA). Альтернативно, цей пристрій може бути включений в інші пристрої зв'язку, такі як телефонна трубка VoIP, персональна обчислювальна машина, сконфігурована так, щоб підтримувати VoIP-зв'язок, або мережний пристрій, сконфігурований так, щоб маршрутизувати телефонний або VoIP-зв'язок. Наприклад, пристрій згідно з варіантом здійснення може бути реалізований в мікросхемі або наборі мікросхем для пристрою зв'язку. Залежно від конкретного варіанта застосування, цей пристрій також може включати в себе такі ознаки, як аналого-цифрове і/або цифро-аналогове перетворення мовного сигналу, схема для здійснення посилення і/або інших операцій обробки мовного сигналу і/або радіочастотна схема для передачі і/або прийому кодованого мовного сигналу. Явно передбачається і розкривається, що варіанти здійснення можуть включати в себе і/або бути використані з однією або більше іншими ознаками, розкритими в Попередніх патентних заявках (США) номера 60/667901 і 60/673965, пріоритет яких вимагається даною заявкою. Ці ознаки включають в себе видалення викидів високої енергії короткої тривалості, які виникають в смузі високих частот і практично відсутні в смузі 92742 50 вузьких частот. Такі ознаки включають в себе фіксоване або адаптивне згладжування представлень коефіцієнтів, наприклад, високосмугових LSF. Такі ознаки включають в себе фіксоване або адаптивне формування шуму, асоціативно зв'язаного з квантуванням представлень коефіцієнтів, таких як LSF. Такі ознаки також включають в себе фіксоване або адаптивне згладжування огинаючої посилення і адаптивне ослаблення огинаючої посилення. Вищенаведене представлення описаних варіантів здійснення надане для того, щоб дати можливість будь-якому фахівцеві в даній галузі техніки створювати або використовувати даний винахід. Різні модифікації в цих варіантах здійснення допускаються, а представлені в даному документі загальні принципи можуть бути застосовані також до інших варіантів здійснення. Наприклад, варіант здійснення може бути реалізований частково або як провідна схема, як схемна конфігурація, виготовлена в спеціалізованій інтегральній схемі, або як мікропрограмне забезпечення, завантажене в енергонезалежний запам'ятовуючий пристрій, або програмний додаток, завантажений з або в носій зберігання даних як машиночитаний код, причому таким кодом є інструкції, що приводяться у виконання за допомогою матриці логічних елементів, такої як мікропроцесор або інший блок обробки цифрових сигналів. Носієм зберігання даних може бути матриця елементів зберігання, наприклад, напівпровідниковий запам'ятовуючий пристрій (який може включати в себе, без обмежень, динамічний або статичний ОЗП (оперативний запам'ятовуючий пристрій), ПЗП (постійний запам'ятовуючий пристрій) і/або флеш-ОЗП) або сегнетоелектричний, магніторезистивний, на аморфних напівпровідниках, полімерний або фазозсувний запам'ятовуючий пристрій; або дисковий носій, наприклад, магнітний або оптичний диск. Термін "програмне забезпечення" повинен розумітися так, щоб включати в себе вихідний код, код мови асемблера, машинний код, двійковий код, мікропрограмне забезпечення, макрокод, мікрокод, будь-який один або більше наборів або послідовностей інструкцій, що приводяться у виконання за допомогою матриці логічних елементів, і будь-яке поєднання вищезазначених прикладів. Різні елементи реалізацій високосмугових генераторів А300 і В300 збудження, високосмуговий кодер А200, високосмуговий декодер В200, широкосмуговий мовний кодер А100 і широкосмуговий мовний декодер В100 можуть бути реалізовані як електронні і/або оптичні пристрої, що постійно розміщуються, наприклад, на одній мікросхемі або на двох або більше мікросхемах в наборі мікросхем, хоч інше компонування без обмеження також мається на увазі. Один або більше елементів такого пристрою можуть бути реалізовані повністю або частково як один або більше наборів інструкцій, виконаних з можливістю приводитися у виконання на одній або більше фіксованих або програмованих матрицях логічних елементів (наприклад, транзисторів, логічних схем), таких як мікропроцесори, вбудовані процесори, IP-осердя, процесори цифрових сигналів, FPGA (програмовані користувачем матричні БІС), ASSP (спеціалізовані стан 51 дартні продукти) і ASIC (спеціалізовані інтегровані схеми). Також можливо для одного або більше таких елементів мати загальну структуру (наприклад, процесор, що використовується для того, щоб приводити у виконання частини коду, відповідні різним елементам в різні моменти часу, набір інструкцій, що приводиться у виконання для того, щоб виконувати задачі, відповідні різним елементам в різні моменти часу, або компонування електронних і/або оптичних пристроїв, що виконують операції для різних елементів в різні моменти часу). Більше того, можливо для одного або більше таких елементів виконувати задачі або приводити у виконання інші набори інструкцій, які не пов'язані безпосередньо з роботою пристрою, наприклад, задачу, пов'язану з іншою операцією пристрою або системи, в яку вбудований пристрій. Фіг.30 ілюструє блок-схему послідовності операцій способу М100, згідно з варіантом здійснення, кодування високосмугової частини мовного сигналу, що має вузькосмугову частину і високосмугову частину. Задача X100 обчислює набір параметрів фільтра, які характеризують спектральну огинаючу високосмугової частини. Задача Х200 обчислює спектрально розширений сигнал за допомогою застосування нелінійної функції до сигналу, витягнутого з вузькосмугової частини. Задача Х300 формує синтезований високосмуговий сигнал згідно з (А) набором параметрів фільтра, і (В) високосмуговим сигналом збудження на основі спектрально розширеного сигналу. Задача Х400 обчислює спектральну огинаючу на основі відношення між (С) енергією високочастотної частини і (D) енергією сигналу, витягнутих з вузькосмугової частини. Фіг.31а ілюструє блок-схему послідовності операцій способу М200 формування високосмугового сигналу збудження згідно з варіантом здійснення. Задача Υ100 обчислює гармонічно розширений сигнал за допомогою застосування нелінійної функції до вузькосмугового сигналу збудження, витягнутого з вузькосмугової частини мовного сигналу. Задача Υ200 змішує гармонічно розширений сигнал з модульованим сигналом шуму, щоб сформувати високосмуговий сигнал збудження. Фіг.3ІЬ ілюструє блок-схему послідовності операцій способу М210 формування високосмугового сигналу збудження згідно з іншим варіантом здійснення, що включає в себе задачі Υ300 і Υ400. Задача Υ300 обчислює огинаючу часової області згідно з енергією у часі одного з вузькосмугового сигналу збудження і гармонічно розширеного сиг 92742 52 налу. Задача Υ400 модулює сигнал шуму згідно з огинаючою часової області, щоб сформувати модульований сигнал шуму. Фіг.32 ілюструє блок-схему послідовності операцій способу М300, згідно з варіантом здійснення, декодування високосмугової частини мовного сигналу, що має вузькосмугову частину і високосмугову частину. Задача Ζ100 приймає набір параметрів фільтра, які характеризують спектральну огинаючу високосмугової частини, і набір коефіцієнтів посилення, які характеризують часову огинаючу високосмугової частини. Задача Ζ200 обчислює спектрально розширений сигнал за допомогою застосування нелінійної функції до сигналу, витягнутого з вузькосмугової частини. Задача Ζ300 формує синтезований високосмуговий сигнал згідно з (А) набором параметрів фільтра, і (В) високосмуговим сигналом збудження на основі спектрально розширеного сигналу. Задача Ζ400 модулює огинаючу посилення синтезованого високосмугового сигналу на основі набору коефіцієнтів посилення. Наприклад, задача Ζ400 може бути сконфігурована так, щоб модулювати огинаючу посилення синтезованого високосмугового сигналу за допомогою застосування набору коефіцієнтів посилення до сигналу збудження, витягнутого з вузькосмугової частини, до спектрально розширеного сигналу, до високосмугового сигналу збудження або до синтезованого високосмугового сигналу. Варіанти здійснення також включають в себе додаткові способи мовного кодування, шифрування і декодування як явно розкриті в даному документі, наприклад, за допомогою опису структурних варіантів здійснення, сконфігурованих так, щоб виконувати ці способи. Кожний з цих способів також може бути матеріально здійснений (наприклад, на одному або більше носіїв даних, перерахованих вище) як один або більше наборів команд, що читаються і/або приводяться у виконання за допомогою машини, яка включає в себе матрицю логічних елементів (наприклад, процесор, мікропроцесор, мікроконтролер або інший кінцевий автомат). Таким чином, даний винахід не призначений для того, щоб бути обмеженим проілюстрованими вище варіантами здійснення, а навпаки, повинен допускати найбільш широкий об'єм, узгоджений з принципами і новими ознаками, розкритими яким-небудь чином в даному документі, в тому числі в прикладеній формулі винаходу, яка становить частину первинного розкриття. 53 92742 54 55 92742 56 57 92742 58 59 92742 60

Дивитися

Додаткова інформація

Назва патенту англійською

Method and splitting of band - wideband speech encoder

Автори англійською

Vos Kon Bernard, Kandkhadai Anantkhapadmanadkhan A.

Назва патенту російською

Способ и устройство для кодирования речевых сигналов с расщеплением полосы

Автори російською

Вос Кон Бернард, Кандхадай Анантхападманабхан А.

МПК / Мітки

МПК: G10L 19/00, G10L 21/00

Мітки: розщепленням, смуги, сигналів, пристрій, мовних, спосіб, кодування

Код посилання

<a href="https://ua.patents.su/55-92742-sposib-i-pristrijj-dlya-koduvannya-movnikh-signaliv-z-rozshheplennyam-smugi.html" target="_blank" rel="follow" title="База патентів України">Спосіб і пристрій для кодування мовних сигналів з розщепленням смуги</a>

Подібні патенти