Звукові кодувальний пристрій і декодувальний пристрій

Номер патенту: 114967

Опубліковано: 28.08.2017

Автори: Хеделін Пер, Віллемоес Ларс, Клейса Януш

Є ще 36 сторінок.

Дивитися все сторінки або завантажити PDF файл.

Формула / Реферат

1. Мовний кодер (100, 170) на основі перетворення, сконфігурований для кодування мовного сигналу в бітовий потік, при цьому кодер (100, 170) містить:

модуль (101) кадрування, сконфігурований для приймання набору (132, 332) блоків; при цьому зазначений набір (132, 332) блоків містить ряд послідовних блоків (131) коефіцієнтів перетворення; при цьому зазначений ряд блоків (131) служить ознакою дискретних значень мовного сигналу; при цьому блок (131) коефіцієнтів перетворення містить ряд коефіцієнтів перетворення для відповідного ряду елементів (301), розділених за частотою;

модуль (102) оцінювання огинальної, сконфігурований для визначення поточної огинальної (133) на основі ряду послідовних блоків (131) коефіцієнтів перетворення; при цьому зазначена поточна огинальна (133) служить ознакою ряду значень (303) спектральної енергії для відповідного ряду елементів (301), розділених за частотою;

модуль (103) квантування огинальної, сконфігурований для визначення квантованої поточної огинальної (134) шляхом квантування поточної огинальної (133);

модуль (104) інтерполяції огинальних, сконфігурований для визначення ряду інтерпольованих огинальних (136), відповідно, для ряду блоків (131) коефіцієнтів перетворення на основі квантованої поточної огинальної (134) і на основі квантованої попередньої огинальної (134); і

модуль (108) вирівнювання, сконфігурований для визначення ряду блоків (140) вирівняних коефіцієнтів перетворення шляхом вирівнювання відповідного ряду блоків (131) коефіцієнтів перетворення з використанням відповідного ряду інтерпольованих огинальних (136), відповідно; при цьому бітовий потік визначається на основі зазначеного ряду блоків (140) вирівняних коефіцієнтів перетворення.

2. Мовний кодер (100, 170) на основі перетворення за п. 1, що додатково містить:

модуль (105, 106) визначення коефіцієнтів підсилення огинальної, сконфігурований для визначення ряду коефіцієнтів (137) підсилення огинальної, відповідно, для ряду блоків (131) коефіцієнтів перетворення;

модуль (107) уточнення огинальної, сконфігурований для визначення ряду скоректованих огинальних (139) шляхом зміщення значень (303) спектральної енергії ряду інтерпольованих огинальних (136), згідно з зазначеним рядом коефіцієнтів (137) підсилення огинальної, відповідно;

модуль (108) вирівнювання, сконфігурований для визначення ряду блоків (140) вирівняних коефіцієнтів перетворення шляхом вирівнювання відповідного ряду блоків (131) коефіцієнтів перетворення з використанням відповідного ряду скоректованих огинальних (139), відповідно.

3. Мовний кодер (100, 170) на основі перетворення за п. 2, де модуль (105, 106) визначення коефіцієнтів підсилення огинальної сконфігурований для визначення першого коефіцієнта (137) підсилення огинальної для першого блока (131) коефіцієнтів перетворення так, щоб дисперсія вирівняних коефіцієнтів перетворення з відповідного першого блока (140) вирівняних коефіцієнтів перетворення, отриманого з використанням першої скоректованої огинальної (139), була скоректована в порівнянні з дисперсією вирівняних коефіцієнтів перетворення з відповідного першого блока (140) вирівняних коефіцієнтів перетворення, отриманого з використанням першої інтерпольованої огинальної (139).

4. Мовний кодер (100, 170) на основі перетворення за п. 3, де модуль (105, 106) визначення коефіцієнтів підсилення огинальної сконфігурований для визначення першого коефіцієнта (137) підсилення огинальної для першого блока (131) коефіцієнтів перетворення так, щоб дисперсія вирівняних коефіцієнтів перетворення з відповідного першого блока (140) вирівняних коефіцієнтів перетворення, отриманого з використанням першої скоректованої огинальної (139), дорівнювала одиниці.

5. Мовний кодер (100, 170) на основі перетворення за п. 2, де модуль (105, 106) визначення коефіцієнтів підсилення огинальної сконфігурований для вставлення даних (162) коефіцієнтів підсилення, що служать ознакою ряду коефіцієнтів (137) підсилення огинальної, у бітовий потік.

6. Мовний кодер (100, 170) на основі перетворення за п. 1, де:

зазначена поточна огинальна (133) служить ознакою ряду значень (303) спектральної енергії для відповідного ряду смуг (302) частот;

смуга (302) частот містить один або декілька елементів (301) розділення за частотою;

модуль (102) оцінювання огинальної сконфігурований для визначення значення (303) спектральної енергії для конкретної смуги (302) частот на основі коефіцієнтів перетворення з ряду послідовних блоків (131) для даної конкретної смуги (302) частот.

7. Мовний кодер (100, 170) на основі перетворення за п. 1, де модуль (103) квантування огинальної сконфігурований для вставлення даних (161) огинальної в бітовий потік, що служить ознакою квантованої поточної огинальної (134).

8. Мовний кодер (100, 170) на основі перетворення за п. 1, де:

блок (131) коефіцієнтів перетворення містить коефіцієнти MDCT; і/або

блок (131) коефіцієнтів перетворення містить 256 коефіцієнтів перетворення в 256 елементах (301) розділення за частотою; і/або

набір (132, 332) блоків містить чотири або більшу кількість блоків (131) коефіцієнтів перетворення.

9. Мовний кодер (100, 170) на основі перетворення за п. 1, де:

мовний кодер (100, 170) на основі перетворення сконфігурований для роботи в ряді різних режимів, що включає режим короткого кроку й режим довгого кроку;

модуль (101) кадрування, модуль (102) оцінювання огинальної й модуль (104) інтерполяції огинальних сконфігуровані для обробки набору (132, 332) блоків, що містить ряд послідовних блоків (131) коефіцієнтів перетворення, коли мовний кодер (100, 170) на основі перетворення діє в режимі короткого кроку; і

модуль (101) кадрування, модуль (102) оцінювання огинальної й модуль (104) інтерполяції огинальних сконфігуровані для обробки набору (132, 332) блоків, що містять єдиний блок (131) коефіцієнтів перетворення, коли мовний кодер (100, 170) на основі перетворення діє в режимі довгого кроку.

10. Мовний кодер (100, 170) на основі перетворення за п. 9, де в режимі довгого кроку:

модуль (102) оцінювання огинальної сконфігурований для визначення поточної огинальної (133) зазначеного єдиного блока (131) коефіцієнтів перетворення, що міститься в зазначеному наборі (132, 133) блоків; і

модуль (104) інтерполяції огинальних сконфігурований для визначення інтерпольованої огинальної (136) для цього єдиного блока (131) коефіцієнтів перетворення як поточної огинальної (133) цього єдиного блока (131) коефіцієнтів перетворення.

11. Мовний декодер (500) на основі перетворення, сконфігурований для декодування бітового потоку, для створення відновленого мовного сигналу, при цьому декодер (500) містить:

модуль (531) декодування огинальної, сконфігурований для визначення квантованої поточної огинальної (134) на основі даних (161) огинальної, що містяться в бітовому потоці; при цьому зазначена квантована поточна огинальна (134) служить ознакою ряду значень (303) спектральної енергії для відповідного ряду елементів (301) розділених за частотою; при цьому бітовий потік містить дані (163, 164), що служать ознакою ряду послідовних блоків (148) відновлених вирівняних коефіцієнтів перетворення; при цьому блок (148) відновлених вирівняних коефіцієнтів перетворення містить ряд відновлених вирівняних коефіцієнтів перетворення для відповідного ряду елементів (301) розділених за частотою;

модуль (104) інтерполяції огинальних, сконфігурований для визначення ряду інтерпольованих огинальних (136), відповідно, для зазначеного ряду блоків (148) відновлених вирівняних коефіцієнтів перетворення на основі квантованої поточної огинальної (134) і на основі квантованої попередньої огинальної (134); і

модуль (108) зворотного вирівнювання, сконфігурований для визначення ряду блоків (149) відновлених коефіцієнтів перетворення шляхом надання відповідному ряду блоків (148) відновлених вирівняних коефіцієнтів перетворення форми спектра з використанням відповідного ряду інтерпольованих огинальних (136), відповідно; при цьому зазначений відновлений мовний сигнал визначається на основі зазначеного ряду блоків (149) відновлених коефіцієнтів перетворення.

12. Мовний декодер (500) на основі перетворення за п. 11, де квантована попередня огинальна (134) пов'язана з рядом попередніх блоків (149) відновлених коефіцієнтів перетворення, що безпосередньо передує зазначеному ряду блоків (149) відновлених коефіцієнтів перетворення.

13. Мовний декодер (500) на основі перетворення за п. 11, де:

ряд послідовних блоків (148) відновлених вирівняних коефіцієнтів перетворення містить перший блок (148) відновлених вирівняних коефіцієнтів перетворення в перший проміжний момент часу;

модуль (104) інтерполяції огинальних сконфігурований для визначення значення (303) спектральної енергії для конкретного елемента (301), розділеного за частотою першої інтерпольованої огинальної (136), шляхом інтерполяції значень (303) спектральної енергії для даного конкретного елемента (301), розділеного за частотою квантованої поточної огинальної (135) і квантованої попередньої огинальної (134) у зазначений перший проміжний момент часу;

перша інтерпольована огинальна (136) пов'язана з зазначеним першим блоком (148) відновлених вирівняних коефіцієнтів перетворення.

14. Мовний декодер (500) на основі перетворення за п. 13, де модуль (104) інтерполяції огинальних сконфігурований для визначення значення (303) спектральної енергії для конкретного елемента (301), розділеного за частотою першої інтерпольованої огинальної (136), шляхом квантування інтерполяції між значеннями (303) спектральної енергії для даного конкретного елемента (301), розділеного за частотою квантованої поточної огинальної (135) і квантованої попередньої огинальної (134).

15. Мовний декодер (500) на основі перетворення за п. 13, де:

ряд послідовних блоків (148) відновлених вирівняних коефіцієнтів перетворення містить другий блок (148) відновлених вирівняних коефіцієнтів перетворення в другий проміжний момент часу;

модуль (104) інтерполяції огинальних сконфігурований для визначення значення (303) спектральної енергії для конкретного елемента (301), розділеного за частотою другої інтерпольованої огинальної (136), шляхом інтерполяції значень (303) спектральної енергії для даного конкретного елемента (301), розділеного за частотою квантованої поточної огинальної (135) і квантованої попередньої огинальної (134) у зазначений другий проміжний момент часу;

друга проміжна огинальна (136) зв'язана з зазначеним другим блоком (148) відновлених вирівняних коефіцієнтів перетворення;

цей другий блок (148) відновлених вирівняних коефіцієнтів перетворення йде за зазначеним першим блоком (148) відновлених вирівняних коефіцієнтів перетворення; і

зазначений другий проміжний момент часу йде за зазначеним першим проміжним моментом часу; при цьому різниця між зазначеними другим проміжним моментом часу й першим проміжним моментом часу відповідає проміжку часу між другим блоком відновлених вирівняних коефіцієнтів перетворення й першим блоком (148) відновлених вирівняних коефіцієнтів перетворення.

16. Мовний декодер (500) на основі перетворення за п. 11, де:

бітовий потік служить ознакою ряду коефіцієнтів (137) підсилення огинальної, відповідно, для ряду блоків (148) відновлених вирівняних коефіцієнтів перетворення;

додатково містить модуль (107) уточнення огинальної, сконфігурований для визначення ряду скоректованих огинальних (139) шляхом застосування зазначеного ряду коефіцієнтів (137) підсилення огинальної, відповідно, до зазначеного ряду інтерпольованих огинальних (136);

модуль (108) зворотного вирівнювання сконфігурований для визначення ряду блоків (149) відновлених коефіцієнтів перетворення шляхом додання до відповідного ряду блоків (148) відновлених вирівняних коефіцієнтів перетворення форми спектра з використанням відповідного ряду скоректованих огинальних (139), відповідно.

17. Спосіб кодування мовного сигналу в бітовий потік, при цьому спосіб включає:

приймання набору (132, 332) блоків; при цьому набір (132, 332) блоків містить ряд послідовних блоків (131) коефіцієнтів перетворення; при цьому зазначений ряд послідовних блоків (131) служить ознакою дискретних значень мовного сигналу; при цьому блок (131) коефіцієнтів перетворення містить ряд коефіцієнтів перетворення для відповідного ряду елементів (301) розділених за частотою;

визначення поточної огинальної (133) на основі ряду послідовних блоків коефіцієнтів перетворення; при цьому поточна огинальна (133) служить ознакою ряду значень (303) спектральної енергії для відповідного ряду елементів (301) розділених за частотою;

визначення квантованої поточної огинальної (134) шляхом квантування поточної огинальної (133);

визначення ряду інтерпольованих огинальних (136), відповідно, для зазначеного ряду блоків (131) коефіцієнтів перетворення на основі квантованої поточної огинальної (133) і на основі квантованої попередньої огинальної (134);

визначення ряду блоків (140) вирівняних коефіцієнтів перетворення шляхом вирівнювання зазначеного відповідного ряду блоків (131) коефіцієнтів перетворення з використанням відповідного ряду інтерпольованих огинальних (136), відповідно; і

визначення бітового потоку на основі зазначеного ряду блоків (140) вирівняних коефіцієнтів перетворення.

18. Спосіб декодування бітового потоку для створення відновленого мовного сигналу, при цьому спосіб включає:

визначення квантованої поточної огинальної (134) на основі даних (161) огинальної, що містяться у бітовому потоці; при цьому квантована поточна огинальна (134) служить ознакою ряду значень (303) спектральної енергії для відповідного ряду елементів (301) розділених за частотою; при цьому бітовий потік містить дані (163, 164), що служать ознакою ряду послідовних блоків (148) відновлених вирівняних коефіцієнтів перетворення; при цьому блок (148) відновлених вирівняних коефіцієнтів перетворення містить ряд відновлених вирівняних коефіцієнтів перетворення для відповідного ряду елементів (301) розділених за частотою;

визначення ряду інтерпольованих огинальних (136), відповідно, для зазначеного ряду блоків (148) відновлених вирівняних коефіцієнтів перетворення на основі квантованої поточної огинальної (134) і на основі квантованої попередньої огинальної (134);

визначення ряду блоків (149) відновлених коефіцієнтів перетворення шляхом надання зазначеному відповідному ряду блоків (148) відновлених вирівняних коефіцієнтів перетворення форми спектра з використанням відповідного ряду інтерпольованих огинальних (136), відповідно; і

визначення відновленого мовного сигналу на основі зазначеного ряду блоків (149) відновлених коефіцієнтів перетворення.

19. Спосіб кодування звукового сигналу, що містить мовний сегмент, у бітовий потік; при цьому спосіб включає:

ідентифікацію зазначеного мовного сегмента у звуковому сигналі;

визначення ряду послідовних блоків (131) коефіцієнтів перетворення на основі зазначеного мовного сегмента з використанням модуля перетворення; при цьому блок (131) коефіцієнтів перетворення містить ряд коефіцієнтів перетворення для відповідного ряду елементів (301) розділених за частотою; при цьому зазначений модуль перетворення сконфігурований для визначення довгих блоків, що містять першу кількість коефіцієнтів перетворення, і коротких блоків, що містять другу кількість коефіцієнтів перетворення; при цьому зазначена перша кількість більша за зазначену другу кількість; при цьому блоки (131) з ряду послідовних блоків (131) являють собою короткі блоки; і

кодування зазначеного ряду послідовних блоків (131) у бітовий потік, кодований способом за п. 17.

20. Спосіб декодування бітового потоку, що служить ознакою звукового сигналу, що містить мовний сегмент, при цьому спосіб включає:

визначення ряду послідовних блоків (149) відновлених коефіцієнтів перетворення на основі даних (161, 162, 163, 164), що містяться у бітовому потоці, отриманому способом за п. 18; і

визначення відновленого мовного сегмента на основі зазначеного ряду послідовних блоків (149) відновлених коефіцієнтів перетворення з використанням модуля зворотного перетворення; при цьому блок (149) відновлених коефіцієнтів перетворення містить ряд відновлених коефіцієнтів перетворення для відповідного ряду елементів (301) розділених за частотою; при цьому модуль (504) зворотного перетворення сконфігурований для обробки довгих блоків, що містять першу кількість відновлених коефіцієнтів перетворення, і коротких блоків, що містять другу кількість відновлених коефіцієнтів перетворення; при цьому зазначена перша кількість більша за зазначену другу кількість; при цьому блоки (149) з ряду послідовних блоків (149) являють собою короткі блоки.

Текст

УКРАЇНА (19) UA (11) 114967 (13) C2 (51) МПК G10L 19/02 (2013.01) G10L 19/06 (2013.01) G10L 19/032 (2013.01) МІНІСТЕРСТВО ЕКОНОМІЧНОГО РОЗВИТКУ І ТОРГІВЛІ УКРАЇНИ ОПИС ДО ПАТЕНТУ НА ВИНАХІД (21) Номер заявки: a 2015 10735 (22) Дата подання заявки: 04.04.2014 (24) Дата, з якої є чинними 28.08.2017 права на винахід: (31) Номер попередньої 61/808,675, 61/875,553 (32) Дата подання 05.04.2013, 09.09.2013 заявки відповідно до Паризької конвенції: попередньої заявки відповідно до Паризької конвенції: (33) Код держави-учасниці US, Паризької конвенції, US до якої подано попередню заявку: (41) Публікація відомостей 25.12.2015, Бюл.№ 24 про заявку: (46) Публікація відомостей 28.08.2017, Бюл.№ 16 про видачу патенту: (86) Номер та дата подання міжнародної заявки, поданої відповідно до Договору PCT PCT/EP2014/056851, 04.04.2014 (72) Винахідник(и): Віллемоес Ларс (SE), Клейса Януш (SE), Хеделін Пер (SE) (73) Власник(и): ДОЛБІ ІНТЕРНЕШНЛ АБ, Apollo Building, 3E, Herikerbergweg 1-35, NL1101 CN Amsterdam, The Netherlands (NL) (74) Представник: Михайлюк Ганна Валентинівна, реєстр. №184 (56) Перелік документів, взятих до уваги експертизою: Grant A. Davidson ET AL, "Digital Audio Coding: Dolby AC-3", The Digital Signal Processing Handbook, CRC Press LLC - IEEE Press, pages 41 - 1, ISBN 978-0-84-938572-8, XP055140739 [X] 1,6-7,9,11,14,68-70,76 * section 41.2; page 6 * * figure 41.4 * * section 41.4; page 10 - page 13 * * page 11, line 4 line 7 * * section 41.3.2; page 9 * * section "Frequency Banding"; page 18 * [I] 25,8,10,12-13,23 EP 0673014 A2, 20.09.1995 WO 2012146757 A1, 01.11.2012 (54) ЗВУКОВІ КОДУВАЛЬНИЙ ПРИСТРІЙ І ДЕКОДУВАЛЬНИЙ ПРИСТРІЙ (57) Реферат: Цей документ належить до системи звукового кодування й декодування (іменованої системою звукового кодека). Зокрема, цей документ стосується системи звукового кодека на основі перетворення, що особливо добре підходить для голосового кодування/декодування. Описується мовний кодер (100, 170) на основі перетворення, сконфігурований для кодування мовного сигналу в бітовий потік. Кодер (100, 170) містить модуль (101) кадрування, сконфігурований для приймання набору (132, 332) блоків; при цьому зазначений набір (132, 332) блоків містить ряд послідовних блоків (131) коефіцієнтів перетворення; при цьому зазначений набір блоків (131) служить ознакою дискретних значень мовного сигналу; при цьому блок (131) коефіцієнтів перетворення містить ряд коефіцієнтів перетворення для відповідного ряду елементів (301) розділення за частотою. Крім цього, кодер (100, 170) містить модуль (102) оцінювання огинальної, сконфігурований для визначення поточної огинальної (133) на основі ряду послідовних блоків (131) коефіцієнтів перетворення; при цьому зазначена поточна огинальна (133) служить ознакою ряду значень (303) спектральної енергії для відповідного ряду елементів (301) розділених за частотою. На додаток, кодер (100, 170) містить модуль (104) інтерполяції огинальних, сконфігурований для визначення ряду інтерпольованих огинальних (136), на основі ряду послідовних блоків (131) коефіцієнтів перетворення, відповідно, на основі UA 114967 C2 (12) UA 114967 C2 поточної огинальної (133); крім того кодер (100, 170) містить модуль (108) вирівнювання, сконфігурований для визначення ряду блоків (140) вирівняних коефіцієнтів перетворення шляхом вирівнювання відповідного ряду блоків (131) коефіцієнтів перетворення з використанням відповідного ряду інтерпольованих огинальних (136), відповідно; при цьому бітовий потік визначається на основі зазначеного ряду блоків (140) вирівняних коефіцієнтів перетворення. UA 114967 C2 5 10 15 20 25 30 35 40 45 50 55 60 ОБЛАСТЬ ТЕХНІЧНОГО ЗАСТОСУВАННЯ Цей документ відноситься до системи звукового кодування й декодування (іменованої системою звукового кодека). Зокрема, цей документ відноситься до системи звукового кодека на основі перетворення, що особливо добре підходить для голосового кодування/декодування. ПЕРЕДУМОВИ Перцепційні звукові кодери загального призначення досягають відносно високих ефективностей кодування шляхом використання таких перетворень, як модифіковане дискретне косинусне перетворення (MDCT) з розмірами блоків дискретних значень, що охоплюють кілька десятків мілісекунд (наприклад, 20 мс). Одним із прикладів такої системи звукового кодека на основі перетворення є Advanced Audio Coding (AAC) або High Efficiency (HE)-AAC. Проте при використанні таких систем звукових кодеків на основі перетворення для голосових сигналів якість голосових сигналів у напрямку більш низьких бітових швидкостей передачі даних погіршується швидше, ніж для музичних сигналів, особливо у випадку сухих (нереверберуючих) мовних сигналів. Тому системи звукових кодеків на основі перетворення у своїй сутності не є добре підходящими для кодування голосових сигналів або для кодування звукових сигналів, що містять голосову складову. Іншими словами, системи звукових кодеків на основі перетворення проявляють асиметрію відносно ефективності кодування, що досягається для музичних сигналів, у порівнянні з ефективністю кодування, що досягається для голосових сигналів. До цієї асиметрії можна звернутися, передбачаючи доповнення до кодування на основі перетворення, у якому ці доповнення націлені на поліпшення формування спектра або збігу сигналів. Прикладами таких доповнень є попереднє/наступне формування, часове обмеження шуму (TNS) і MDCT з деформацією шкали часу. Крім того, до цієї асиметрії можна звернутися шляхом додавання класичного мовного кодера в часовій області, що ґрунтується на фільтрації з короткостроковим передбаченням (LPC) і довгостроковим передбаченням (LTP). Можна показати, що поліпшення, які досягаються шляхом забезпечення доповненнями кодування на основі перетворення, як правило, недостатні для вирівнювання пробілу в продуктивності між кодуванням музичних сигналів і мовних сигналів. З іншого боку, додавання класичного мовного кодера в часовій області заповнює цей пробіл у продуктивності, проте лише в тій мірі, у якій асиметрія продуктивності спрямована в протилежному напрямку. Це викликане тим, що такі класичні мовні кодери в часовій області моделюють систему мовотворення людини й були оптимізовані для кодування мовних сигналів. За умов вищесказаного звуковий кодек на основі перетворення можна використовувати разом із класичним мовним кодеком у часовій області, при цьому класичний мовний кодек у часовій області використовується для мовних сегментів звукового сигналу, і при цьому кодек на основі перетворення використовується для інших сегментів цього звукового сигналу. Проте співіснування кодеків у часовій області й в області перетворення в єдиній системі кодека вимагає надійних інструментальних засобів для перемикання між різними кодеками на основі властивостей звукового сигналу. На додаток, це фактичне перемикання між кодеком у часовій області (для мовного вмісту) і кодеком в області перетворення (для іншого вмісту) може бути важким для реалізації. Зокрема, може бути важко забезпечити плавний перехід між кодеком у часовій області й кодеком в області перетворення (і навпаки). Крім того, для того щоб зробити кодек у часовій області більш стійким до зовнішніх впливів при неминучому випадковому кодуванні немовних сигналів, наприклад при кодуванні співаючого голосу з інструментальним фоном, можуть знадобитися модифікації цього кодека в часовій області. Цей документ спрямований на вищезгадані технічні проблеми систем звукових кодеків. Зокрема, цей документ описує систему звукового кодека, що транслює тільки критичні характерні ознаки мовного кодека та за допомогою цього досягає рівномірної продуктивності для мови й музики, у той же час залишаючись у межах архітектури кодека на основі перетворення. Іншими словами, цей документ описує звуковий кодек на основі перетворення, що особливо добре підходить для кодування мовних або голосових сигналів. КОРОТКИЙ ОПИС СУТНОСТІ ВИНАХОДУ Відповідно до одного з аспектів описується мовний кодер на основі перетворення. Цей мовний кодер сконфігурований для кодування мовного сигналу в бітовий потік. Слід зазначити, що згодом описуються різні аспекти цього мовного кодера на основі перетворення. Ясно вказується, що ці аспекти можуть різними способами сполучатися один з одним. Зокрема, аспекти, описувані згідно з різними незалежними пунктами формули винаходу, можуть сполучатися з іншими незалежними пунктами формули винаходу. Крім того, аспекти, описувані в контексті кодера, аналогічним образом застосовні й до відповідного декодера. Мовний кодер може містити модуль кадрування, сконфігурований для приймання набору блоків. Цей набір блоків може відповідати зміщеному набору блоків, описуваному в докладному 1 UA 114967 C2 5 10 15 20 25 30 35 40 45 50 55 60 описі цього документа. У якості альтернативи, цей набір блоків може відповідати поточному набору блоків, описуваному в докладному описі цього документа. Цей набір блоків містить ряд послідовних блоків коефіцієнтів перетворення, і цей ряд послідовних блоків служить ознакою дискретних значень мовного сигналу. Зокрема, цей набір блоків може містити чотири або більшу кількість блоків коефіцієнтів перетворення. Блок із цього ряду послідовних блоків міг бути визначений, виходячи з мовного сигналу з використанням модуля перетворення, сконфігурованого для перетворення попередньо визначеної кількості дискретних значень мовного сигналу з часової області в частотну область. Зокрема, цей модуль перетворення може бути сконфігурований для виконання такого перетворення з часової області в частотну область, як модифіковане дискретне косинусне перетворення (MDCT). Як такий, блок коефіцієнтів перетворення може містити ряд коефіцієнтів перетворення (також іменованих частотними коефіцієнтами або спектральними коефіцієнтами) для відповідного ряду елементів розділення за частотою. Зокрема, блок коефіцієнтів перетворення може містити коефіцієнти MDCT. Кількість елементів розділення за частотою, або розмір блока, як правило, залежить від розміру перетворення, виконуваного модулем перетворення. В одному з переважних прикладів блоки із зазначеного ряду послідовних блоків відповідають так званим коротким блокам, що містять, наприклад, 256 елементів розділення за частотою. На додаток до коротких блоків, модуль перетворення може бути сконфігурований для генерування так званих довгих блоків, що містять, наприклад, 1024 елементів розділення за частотою. Ці довгі блоки можуть бути використані звуковим кодером для кодування стаціонарних сегментів вхідного звукового сигналу. Проте ряд послідовних блоків, використовуваних для кодування мовного сигналу (або мовного сегмента, що міститься у вхідному звуковому сигналі), може містити тільки короткі блоки. Зокрема, блоки коефіцієнтів перетворення можуть містити 256 коефіцієнтів перетворення в 256 елементах розділення за частотою. У більш загальних вираженнях, кількість елементів розділення за частотою, або розмір блока, може бути таким, щоб блок коефіцієнтів перетворення охоплював діапазон 3-7 мілісекунд мовного сигналу (наприклад, 5 мс мовного сигналу). Розмір блока можна обирати так, щоб мовний кодер міг діяти в синхронному режимі з кадрами відеозображення, що кодуються відеокодером. Модуль перетворення може бути сконфігурований для генерування блоків коефіцієнтів перетворення, що містять різну кількість елементів розділення за частотою. Наприклад, модуль перетворення може бути сконфігурований для генерування блоків, що містять 1920, 960, 480, 240, 120 елементів розділення за частотою при частоті дискретизації 48 кГц. Для мовного кодера можна використовувати розмір блока, що охоплює діапазон 3-7 мс мовного сигналу. У наведеному вище прикладі для мовного кодера можна використовувати блок, що містить 240 елементів розділення за частотою. Мовний кодер також може містити модуль оцінювання огинальної сконфігурований для визначення поточної огинальної на основі ряду послідовних блоків коефіцієнтів перетворення. Цю поточну огинальну можна визначити на основі ряду послідовних блоків із цього набору блоків. Можна враховувати додаткові блоки, наприклад блоки з набору блоків, що безпосередньо передує цьому набору блоків. У якості альтернативи або на додаток, можна враховувати так звані блоки попереднього перегляду. У цілому, це може бути корисним для забезпечення безперервності між послідовними наборами блоків. Поточна огинальна може служити ознакою ряду значень спектральної енергії для відповідного ряду елементів розділення за частотою. Іншими словами, поточна огинальна може мати такий же розмір, як кожний блок у ряді послідовних блоків. Іншими словами, для ряду блоків (тобто для більш ніж одного блока) мовного сигналу можна визначити єдину огинальну. Це є корисним для мети створення репрезентативної статистики відносно спектральних даних, що містяться у ряді послідовних блоків. Поточна огинальна може служити ознакою ряду значень спектральної енергії для відповідного ряду смуг частот. Смуга частот може містити один або декілька елементів розділення за частотою. Зокрема, одна або кілька смуг частот можуть містити більше одного елемента розділення за частотою. Кількість елементів розділення за частотою, що припадають на смугу частот, може збільшуватися при підвищенні частоти. Іншими словами, кількість елементів розділення за частотою, що припадають на смугу частот, може залежати від психоакустичних міркувань. Модуль оцінювання огинальної може бути сконфігурований для визначення значення спектральної енергії для конкретної смуги частот на основі коефіцієнтів перетворення з ряду послідовних блоків, що перебувають у межах даної конкретної смуги частот. Зокрема, модуль оцінювання огинальної може бути сконфігурований для визначення значення спектральної енергії для конкретної смуги частот на основі середньоквадратичного 2 UA 114967 C2 5 10 15 20 25 30 35 40 45 50 55 значення коефіцієнтів перетворення з ряду послідовних блоків, що перебувають у межах даної конкретної смуги частот. Як така, поточна огинальна може служити ознакою середньої огинальної спектра для огинальних спектра ряду послідовних блоків. Крім того, поточна огинальна може мати смугову роздільність за частотою. Мовний кодер також може містити модуль інтерполяції огинальних, сконфігурований для визначення ряду інтерпольованих огинальних відповідно для ряду послідовних блоків коефіцієнтів перетворення на основі поточної огинальної. Зокрема, цей ряд інтерпольованих огинальних можна визначити на основі квантованої поточної огинальної, також доступної і у відповідному декодері. Діючи таким чином, забезпечують те, що зазначений ряд інтерпольованих огинальних можна визначати однаковим шляхом у мовному кодері й у відповідному мовному декодері. Таким чином, характерні ознаки модуля інтерполяції огинальної, описувані в контексті мовного кодера, також застосовні й до мовного декодера, і навпаки. У цілому, модуль інтерполяції огинальних може бути сконфігурований для визначення на основі поточної огинальної наближення огинальної спектра (тобто інтерпольованої огинальної) кожного блока з ряду послідовних блоків. Мовний кодер також може містити модуль вирівнювання, сконфігурований для визначення ряду блоків вирівняних коефіцієнтів перетворення шляхом вирівнювання відповідного ряду блоків коефіцієнтів перетворення, відповідно, з використанням відповідного ряду інтерпольованих огинальних. Зокрема, для вирівнювання, тобто для видалення форми спектра, коефіцієнтів перетворення, що містяться в даному конкретному блоці, можна використовувати інтерпольовану огинальну для даного конкретного блока (або огинальну, отриману на її основі). Слід зазначити, що цей процес вирівнювання відрізняється від операції відбілювання, застосовуваної до даного конкретного блока коефіцієнтів перетворення. Тобто вирівняні коефіцієнти перетворення не можна інтерпретувати як коефіцієнти перетворення вибіленого сигналу в часовій області, звичайно отримувані за допомогою аналізу LPC (кодування з лінійним передбаченням) класичного мовного кодера. Загальним є тільки аспект створення сигналу з відносно рівномірним спектром потужності. Проте процес одержання такого рівномірного спектра потужності відрізняється. Як буде описано в цьому документі, використання оцінної огинальної спектра для вирівнювання блока коефіцієнтів перетворення є переважним, оскільки цю оцінну огинальну спектра можна використовувати з метою розподілу бітів. Мовний кодер на основі перетворення також може містити модуль визначення коефіцієнтів підсилення огинальної, сконфігурований для визначення ряду коефіцієнтів підсилення огинальної, відповідно, для ряду блоків коефіцієнтів перетворення. Крім того, мовний кодер на основі перетворення може містити модуль уточнення огинальної, сконфігурований для визначення ряду скоректованих огинальних шляхом зміщення ряду інтерпольованих огинальних відносно ряду коефіцієнтів підсилення огинальної, відповідно. Модуль визначення коефіцієнтів підсилення огинальної може бути сконфігурований для визначення першого коефіцієнта підсилення огинальної для першого блока коефіцієнтів перетворення (з ряду послідовних блоків) так, щоб дисперсія вирівняних коефіцієнтів перетворення з відповідного першого блока вирівняних коефіцієнтів перетворення, отриманих з використанням першої скоректованої огинальної, зменшувалася в порівнянні з дисперсією вирівняних коефіцієнтів перетворення з відповідного першого блока вирівняних коефіцієнтів перетворення, отриманого з використанням першої інтерпольованої огинальної. Цю першу скоректовану огинальну можна визначити шляхом зміщення першої інтерпольованої огинальної з використанням першого коефіцієнта підсилення огинальної. Ця перша інтерпольована огинальна може являти собою інтерпольовану огинальну з ряду інтерпольованих коефіцієнтів огинальних для першого блока перетворення з ряду блоків коефіцієнтів перетворення. Зокрема, модуль визначення коефіцієнтів підсилення огинальної може бути сконфігурований для визначення першого коефіцієнта підсилення огинальної для першого блока коефіцієнтів перетворення так, щоб дисперсія вирівняних коефіцієнтів перетворення з відповідного блока вирівняних коефіцієнтів перетворення, отриманого з використанням першої скоректованої огинальної, дорівнювала одиниці. Модуль вирівнювання може бути сконфігурований для визначення ряду блоків вирівняних коефіцієнтів перетворення шляхом вирівнювання відповідного ряду блоків коефіцієнтів перетворення з використанням відповідного ряду скоректованих огинальних, відповідно. Як результат, кожний блок вирівняних коефіцієнтів перетворення може мати дисперсію, що дорівнює одиниці. Модуль визначення коефіцієнтів підсилення огинальної може бути сконфігурований для вставлення даних коефіцієнтів підсилення, що служать ознакою ряду коефіцієнтів підсилення 3 UA 114967 C2 5 10 15 20 25 30 35 40 45 50 55 60 огинальної, у бітовий потік. Як результат, відповідний декодер має можливість визначати ряд скоректованих огинальних у такий же спосіб, як і кодер. Мовний кодер може бути сконфігурований для визначення бітового потоку на основі ряду блоків вирівняних коефіцієнтів перетворення. Зокрема, мовний кодер може бути сконфігурований для визначення даних коефіцієнтів на основі ряду блоків вирівняних коефіцієнтів перетворення, причому ці дані коефіцієнтів уводять у бітовий потік. Нижче описуються приклади засобів для визначення даних коефіцієнтів на основі ряду блоків вирівняних коефіцієнтів перетворення. Мовний кодер на основі перетворення може містити модуль квантування огинальної, сконфігурований для визначення квантованої поточної огинальної шляхом квантування поточної огинальної. Крім того, цей модуль квантування огинальної може бути сконфігурований для вставлення даних огинальної в бітовий потік, при цьому дані огинальної служать ознакою цієї квантованої поточної огинальної. Як результат, відповідний декодер може бути сповіщений про квантовану поточну огинальну шляхом декодування даних огинальної. Модуль інтерполяції огинальних може бути сконфігурований для визначення ряду інтерпольованих огинальних на основі квантованої поточної огинальної. Діючи таким чином, можна забезпечити те, що кодер і декодер будуть сконфігуровані для визначення того ж ряду інтерпольованих огинальних. Мовний кодер на основі перетворення може бути сконфігурований для дії в ряді різних режимів. Ці різні режими можуть включати режим короткого кроку й режим довгого кроку. Коли мовний кодер на основі перетворення діє в режимі короткого кроку, модуль кадрування, модуль оцінювання огинальної і модуль інтерполяції огинальних можуть бути сконфігуровані для обробки набору блоків, що містить ряд послідовних блоків коефіцієнтів перетворення. Таким чином, у режимі короткого кроку кодер може бути сконфігурований для розподілу сегмента/кадра звукового сигналу на ряд послідовних блоків, які послідовно обробляються кодером. З іншого боку, коли мовний кодер на основі перетворення діє в режимі довгого кроку, модуль кадрування, модуль оцінювання огинальної і модуль інтерполяції огинальних можуть бути сконфігуровані для обробки набору блоків, що містить лише єдиний блок коефіцієнтів перетворення. Таким чином, у режимі довгого кроку кодер може бути сконфігурований для обробки повного сегмента/кадра звукового сигналу без розподілу на блоки. Це може бути переважним для коротких сегментів/кадрів звукового сигналу й/або для музичних сигналів. У режимі довгого кроку модуль оцінювання огинальної може бути сконфігурований для визначення поточної огинальної цього єдиного блока коефіцієнтів перетворення, що міститься в наборі блоків. Модуль інтерполяції огинальних може бути сконфігурований для визначення інтерпольованої огинальної для цього єдиного блока коефіцієнтів перетворення як поточної огинальної цього єдиного блока коефіцієнтів перетворення. Іншими словами, описувану в цьому документі інтерполяцію огинальних у режимі довгого кроку можна обійти, а поточна огинальна зазначеного єдиного блока може бути прирівняна до інтерпольованої огинальної (для подальшої обробки). Згідно з іншим аспектом, описується мовний декодер на основі перетворення, сконфігурований для декодування бітового потоку з метою створення відновленого мовного сигналу. Як уже вказувалося вище, цей декодер може містити компоненти, аналогічні компонентам відповідного кодера. Декодер може містити модуль декодування огинальної, сконфігурований для визначення квантованої поточної огинальної, на основі даних огинальної, що містяться у бітовому потоці. Як вказувалося вище, ця квантована поточна огинальна, як правило, служить ознакою ряду значень спектральної енергії для відповідного ряду елементів розділення за частотою смуг частот. Крім того, бітовий потік може містити дані (наприклад, дані коефіцієнтів), що служать ознакою ряду послідовних блоків відновлених вирівняних коефіцієнтів перетворення. Цей ряд послідовних блоків відновлених вирівняних коефіцієнтів перетворення, як правило, пов'язаний з відповідним рядом послідовних блоків вирівняних коефіцієнтів перетворення в кодері. Цей ряд послідовних блоків може відповідати ряду послідовних блоків з набору блоків, наприклад з описуваного нижче зміщеного набору блоків. Блок відновлених вирівняних коефіцієнтів перетворення може містити ряд відновлених вирівняних коефіцієнтів перетворення для відповідного ряду елементів розділення за частотою. Декодер також може містити модуль інтерполяції огинальних, сконфігурований для визначення ряду інтерпольованих огинальних, відповідно, для ряду блоків відновлених вирівняних коефіцієнтів перетворення на основі квантованої поточної огинальної. Модуль інтерполяції огинальних декодера, як правило, діє в такий же спосіб, як і модуль інтерполяції огинальних кодера. Модуль інтерполяції огинальних може бути сконфігурований для визначення ряду інтерпольованих огинальних також на основі квантованої попередньої 4 UA 114967 C2 5 10 15 20 25 30 35 40 45 50 55 60 огинальної. Ця квантована попередня огинальна може бути пов'язана з рядом попередніх блоків відновлених коефіцієнтів перетворення, що безпосередньо передують цьому ряду блоків відновлених коефіцієнтів перетворення. Як така, квантована попередня огинальна могла бути отримана декодером як дані огинальної для попереднього набору блоків коефіцієнтів перетворення (наприклад, у випадку так званого Р-кадру). У якості альтернативи або на додаток, дані огинальної для цього набору блоків можуть служити ознакою квантованої попередньої огинальної на додаток до того, що вони служать ознакою квантованої поточної огинальної (наприклад, у випадку так званого I-кадру). Це уможливлює декодування I-кадру в разі відсутності знання про попередні дані. Модуль інтерполяції огинальних може бути сконфігурований для визначення значення спектральної енергії для конкретного елемента розділення за частотою, згідно з першою інтерпольованою огинальною, шляхом інтерполяції значень спектральної енергії для даного конкретного елемента розділення за частотою квантованої поточної огинальної і квантованої попередньої огинальної в перший проміжний момент часу. Перша інтерпольована огинальна пов'язана з першим блоком ряду послідовних блоків відновлених вирівняних коефіцієнтів перетворення або відповідає цьому першому блоку. Як описувалося вище, квантована попередня й квантована поточна огинальні, як правило, являють собою смугові огинальні. Значення спектральної енергії для конкретної смуги частот, як правило, є постійними для всіх елементів розділення за частотою, що містяться у цій смузі частот. Модуль інтерполяції огинальних може бути сконфігурований для визначення значення спектральної енергії для конкретного елемента розділення за частотою першої інтерпольованої огинальної шляхом квантування інтерполяції між значеннями спектральної енергії для даного конкретного елемента розділення за частотою квантованої поточної огинальної і квантованої попередньої огинальної. Як такий, ряд інтерпольованих огинальних може являти собою ряд квантованих інтерпольованих огинальних. Модуль інтерполяції огинальних може бути сконфігурований для визначення значення спектральної енергії для конкретного елемента розділення за частотою другої інтерпольованої огинальної шляхом інтерполяції значень спектральної енергії для даного конкретного елемента розділення за частотою квантованої поточної огинальної і квантованої попередньої огинальної в другий проміжний момент часу. Друга інтерпольована огинальна може бути зв'язана з другим блоком з ряду блоків відновлених вирівняних коефіцієнтів перетворення або може відповідати цьому другому блоку. Другий блок відновлених вирівняних коефіцієнтів перетворення може йти за першим блоком відновлених вирівняних коефіцієнтів перетворення, а зазначений другий проміжний момент часу може йти за зазначеним першим проміжним моментом часу. Зокрема, різниця між другим проміжним моментом часу й першим проміжним моментом часу може відповідати проміжку часу між другим блоком відновлених вирівняних коефіцієнтів перетворення й першим блоком відновлених вирівняних коефіцієнтів перетворення. Модуль інтерполяції огинальних може бути сконфігурований для однієї або декількох наступних інтерполяцій: лінійної інтерполяції, геометричної інтерполяції та гармонійної інтерполяції. Крім того, модуль інтерполяції огинальних може бути сконфігурований для виконання інтерполяції в логарифмічній області. Крім того, декодер може містити модуль зворотного вирівнювання, сконфігурований для визначення ряду блоків відновлених коефіцієнтів перетворення шляхом надання форми спектра відповідному ряду блоків відновлених вирівняних коефіцієнтів перетворення, відповідно, з використанням відповідного ряду інтерпольованих огинальних. Як вказувалося вище, бітовий потік може служити ознакою ряду коефіцієнтів підсилення огинальної (у даних коефіцієнтів підсилення), відповідно, для ряду блоків відновлених вирівняних коефіцієнтів перетворення. Мовний декодер на основі перетворення також може містити модуль уточнення огинальної, сконфігурований для визначення ряду скоректованих огинальних шляхом застосування ряду коефіцієнтів підсилення огинальних відповідно до ряду інтерпольованих огинальних. Модуль зворотного вирівнювання може бути сконфігурований для визначення ряду блоків відновлених коефіцієнтів перетворення шляхом надання форми спектра відповідному ряду блоків відновлених вирівняних коефіцієнтів перетворення з використанням відповідного ряду скоректованих огинальних, відповідно. Декодер може бути сконфігурований для визначення відновленого мовного сигналу на основі ряду блоків відновлених коефіцієнтів перетворення. Згідно з ще одним аспектом, описується мовний кодер на основі перетворення, сконфігурований для кодування мовного сигналу в бітовий потік. Цей кодер може містити кожну з описуваних у цьому документі характерних ознак і/або компонентів, що відносяться до кодера. Зокрема, цей кодер може містити модуль кадрування, сконфігурований для приймання ряду 5 UA 114967 C2 5 10 15 20 25 30 35 40 45 50 55 60 послідовних блоків коефіцієнтів перетворення. Цей ряд послідовних блоків містить поточний блок і один або декілька попередніх блоків. Як вказувалося вище, цей ряд послідовних блоків служить ознакою дискретних значень мовного сигналу. Крім того, зазначений кодер може містити модуль вирівнювання, сконфігурований для визначення поточного блока й одного або декількох попередніх блоків вирівняних коефіцієнтів перетворення шляхом вирівнювання відповідного поточного блока й одного або декількох попередніх блоків коефіцієнтів перетворення з використанням відповідної поточної огинальної блока й відповідних однієї або декількох попередніх огинальних блоків, відповідно. Ці огинальні блоків можуть відповідати вищезгаданим скоректованим огинальним. На додаток, кодер містить прогнозуючий модуль, сконфігурований для визначення поточного блока оцінних вирівняних коефіцієнтів прогнозуючого модуля на основі одного або декількох попередніх блоків відновлених коефіцієнтів перетворення й на основі одного або декількох параметрів прогнозуючого модуля. Зазначені один або декілька блоків відновлених коефіцієнтів перетворення могли бути отримані, відповідно, на основі одного або декількох попередніх блоків вирівняних коефіцієнтів перетворення (наприклад, з використанням прогнозуючого модуля). Зазначений прогнозуючий модуль може містити екстрактор, сконфігурований для визначення поточного блока оцінних коефіцієнтів перетворення на основі одного або декількох попередніх блоків відновлених коефіцієнтів перетворення й на основі одного або декількох параметрів прогнозуючого модуля. Як такий, екстрактор може діяти в невирівняній області (тобто екстрактор може діяти на блоках коефіцієнтів перетворення, що мають форму спектра). Це може бути переважним щодо моделі сигналу, використовуваної екстрактором для визначення поточного блока оцінних коефіцієнтів перетворення. Крім того, прогнозуючий модуль може містити формувач спектра, сконфігурований для визначення поточного блока оцінних вирівняних коефіцієнтів перетворення на основі поточного блока оцінних коефіцієнтів перетворення, на основі щонайменше одного з однієї або декількох попередніх огинальних блоків, і на основі щонайменше одного або декількох параметрів прогнозуючого модуля. Як такий, формувач спектра може бути сконфігурований для перетворення поточного блока оцінних коефіцієнтів перетворення у вирівняну область із метою створення поточного блока оцінних вирівняних коефіцієнтів перетворення. Як описується в контексті відповідного декодера, з цією метою формувач спектра може використовувати ряд скоректованих огинальних (або ряд огинальних блоків). Як вказувалося вище, прогнозуючий модуль (зокрема, екстрактор) може містити прогнозуючий модуль на основі моделі, що використовує модель сигналу. Ця модель сигналу може містити один або декілька параметрів моделі, а один або декілька параметрів прогнозуючого модуля можуть служити ознакою одного або декількох параметрів моделі. Використання прогнозуючого модуля на основі моделі може бути переважним для забезпечення засобів, ефективних з погляду бітової швидкості передачі даних, для опису коефіцієнтів передбачення, використовуваних прогнозуючим модулем піддіапазонів (або прогнозуючим модулем елементів розділення за частотою). Зокрема, можна визначити повний набір коефіцієнтів передбачення, використовуючи лише невелику кількість параметрів моделі, які можна передавати в якості даних прогнозуючого модуля у відповідний декодер ефективним з погляду бітової швидкості передачі даних шляхом. Як такий, прогнозуючий модуль на основі моделі може бути сконфігурований для визначення одного або декількох параметрів моделі для моделі сигналу (наприклад, з використанням алгоритму Дарбіна-Левінсона). Крім того, прогнозуючий модуль на основі моделі може бути сконфігурований для визначення коефіцієнта передбачення, що підлягає застосуванню до першого відновленого коефіцієнта перетворення в першому елементі розділення за частотою попереднього блока відновлених коефіцієнтів перетворення на основі моделі сигналу й на основі одного або декількох параметрів моделі. Зокрема, можна визначити ряд коефіцієнтів передбачення для ряду відновлених коефіцієнтів перетворення. Діючи в такий спосіб і застосовуючи коефіцієнт передбачення до першого відновленого коефіцієнта перетворення, можна визначити оцінку першого оцінного коефіцієнта перетворення в першому елементі розділення за частотою поточного блока оцінних коефіцієнтів перетворення. Зокрема, діючи таким чином, можна визначити оцінні коефіцієнти перетворення з поточного блока оцінних коефіцієнтів перетворення. Наприклад, модель сигналу може містити одну або декілька синусоїдальних складових моделі, а один або декілька параметрів моделі можуть служити ознакою частоти цієї однієї або кількох синусоїдальних складових моделі. Зокрема, ці один або декілька параметрів моделі можуть служити ознакою основної частоти мультисинусоїдальної моделі сигналу. Така основна частота може відповідати затримці в часовій області. 6 UA 114967 C2 5 10 15 20 25 30 35 40 45 50 55 60 Прогнозуючий модуль може бути сконфігурований для визначення одного або кількох параметрів прогнозуючого модуля так, щоб зменшувати (наприклад, мінімізувати) середньоквадратичне значення коефіцієнтів помилок передбачення з поточного блока коефіцієнтів помилок передбачення. Це можна виконати, використовуючи, наприклад, алгоритм Дарбіна-Левінсона. Прогнозуючий модуль може бути сконфігурований для вставлення даних прогнозуючого модуля, що служать ознакою одного або декількох параметрів прогнозуючого модуля, у бітовий потік. Як результат, відповідний декодер має можливість визначати поточний блок оцінних вирівняних коефіцієнтів перетворення в такий же спосіб, як і кодер. Крім того, кодер може містити різницевий модуль, сконфігурований для визначення поточного блока коефіцієнтів помилок передбачення на основі поточного блока вирівняних коефіцієнтів перетворення й на основі поточного блока оцінних вирівняних коефіцієнтів перетворення. Бітовий потік можна визначити на основі поточного блока коефіцієнтів помилок передбачення. Зокрема, ознакою поточного блока коефіцієнтів помилок передбачення можуть служити дані коефіцієнтів з бітового потоку. Відповідно до одного з подальших аспектів, описується мовний декодер на основі перетворення, сконфігурований для декодування бітового потоку з метою створення відновленого мовного сигналу. Цей декодер може містити кожну з описуваних у цьому документі характерних ознак і/або компонентів. Зокрема, зазначений декодер може містити прогнозуючий модуль, сконфігурований для визначення поточного блока оцінних вирівняних коефіцієнтів перетворення на основі одного або декількох попередніх блоків відновлених коефіцієнтів перетворення й на основі одного або декількох параметрів прогнозуючого модуля, отриманих з (даних прогнозуючого модуля) бітового потоку. Як описується в контексті відповідного кодера, прогнозуючий модуль може містити екстрактор, сконфігурований для визначення поточного блока оцінних коефіцієнтів перетворення на основі щонайменше одного з одного або кількох попередніх блоків відновлених коефіцієнтів перетворення й на основі щонайменше одного з одного або декількох параметрів прогнозуючого модуля. Крім того, прогнозуючий модуль може містити формувач спектра, сконфігурований для визначення поточного блока оцінних вирівняних коефіцієнтів перетворення на основі поточного блока оцінних коефіцієнтів перетворення, на основі однієї або декількох попередніх огинальних блоків (наприклад, попередніх скоректованих огинальних) і на основі одного або декількох параметрів прогнозуючого модуля. Ці один або декілька параметрів прогнозуючого модуля можуть містити параметр Т запізнювання блока. Цей параметр запізнювання блока може служити ознакою кількості блоків, що передують поточному блоку оцінних вирівняних коефіцієнтів перетворення. Зокрема, параметр Т запізнювання блока може служити ознакою періодичності мовного сигналу. Як такий, параметр Т запізнювання блока може вказувати, який з одного або декількох попередніх блоків відновлених коефіцієнтів перетворення є (найбільш) схожим на поточний блок коефіцієнтів перетворення, і тому його можна використовувати для передбачення поточного блока коефіцієнтів перетворення, тобто його можна використовувати для визначення поточного блока оцінних коефіцієнтів перетворення. Формувач спектра може бути сконфігурований для вирівнювання поточного блока оцінних коефіцієнтів перетворення з використанням поточної оцінної огинальної. Крім того, формувач спектра може бути сконфігурований для визначення поточної оцінної огинальної на основі щонайменше однієї з однієї або декількох попередніх огинальних блоків і на основі параметра запізнювання блока. Зокрема, формувач спектра може бути сконфігурований для визначення цілочислового значення T0 запізнювання на основі параметра Т запізнювання блока. Це цілочислове значення T0 запізнювання можна визначити шляхом округлення параметра Т запізнювання блока до найближчого цілого числа. Крім того, формувач спектра може бути сконфігурований для визначення поточної оцінної огинальної як попередньої огинальної блока (наприклад, попередньої скоректованої огинальної) для попереднього блока відновлених коефіцієнтів перетворення, що передує поточному блоку оцінних вирівняних коефіцієнтів перетворення, на кількість блоків, що відповідає зазначеному цілочисловому значенню запізнювання. Слід зазначити, що характерні ознаки, описувані для формувача спектра декодера, також застосовні й до формувача спектра кодера. Екстрактор може бути сконфігурований для визначення поточного блока оцінних коефіцієнтів перетворення на основі щонайменше одного з одного або декількох попередніх блоків відновлених коефіцієнтів перетворення й на основі параметра Т запізнювання блока. Для цього екстрактор може використовувати прогнозуючий модуль на основі моделі, описуваний у контексті відповідного кодера. У цьому контексті параметр Т запізнювання блока може служити ознакою основної частоти мультисинусоїдальної моделі. 7 UA 114967 C2 5 10 15 20 25 30 35 40 45 50 55 60 Крім того, мовний декодер може містити декодер спектра, сконфігурований для визначення поточного блока квантованих коефіцієнтів помилок передбачення на основі даних коефіцієнтів, що містяться у бітовому потоці. Для цього декодер спектра може використовувати зворотні квантувачі, описувані в цьому документі. На додаток, мовний декодер може містити модуль додавання, сконфігурований для визначення поточного блока відновлених вирівняних коефіцієнтів перетворення на основі поточного блока оцінних вирівняних коефіцієнтів перетворення й на основі поточного блока квантованих коефіцієнтів помилок передбачення. На додаток, мовний декодер може містити модуль зворотного вирівнювання, сконфігурований для визначення поточного блока відновлених коефіцієнтів перетворення шляхом надання поточному блоку відновлених вирівняних коефіцієнтів перетворення форми спектра з використанням поточної огинальної блока. Крім того, модуль вирівнювання може бути сконфігурований для визначення одного або декількох попередніх блоків відновлених коефіцієнтів перетворення шляхом надання одному або декільком попереднім блокам відновлених вирівняних коефіцієнтів перетворення форми спектра з використанням, відповідно, однієї або декількох попередніх огинальних блоків (наприклад, попередніх скоректованих огинальних). Мовний декодер може бути сконфігурований для визначення відновленого мовного сигналу на основі поточного й одного або декількох попередніх блоків відновлених коефіцієнтів перетворення. Цей мовний декодер на основі перетворення може містити буфер огинальних, сконфігурований для зберігання однієї або декількох попередніх блоків огинальних. Формувач спектра може бути сконфігурований для визначення цілочислового значення T 0 запізнювання шляхом обмеження цілочислового значення запізнювання кількістю попередніх огинальних блоків, що зберігаються в буфері огинальних. Кількість попередніх огинальних блоків, що зберігаються в буфері огинальних, може змінюватися (наприклад, на початку I-кадру). Формувач спектра може бути сконфігурований для визначення кількості попередніх огинальних, що зберігаються в буфері огинальних, і відповідного обмеження цілочислового значення Т0 запізнювання. Діючи таким чином, можна уникнути помилкових попередніх переглядів огинальних. Формувач спектра може бути сконфігурований для вирівнювання поточного блока оцінних коефіцієнтів перетворення так, щоб перед застосуванням одного або декількох параметрів прогнозуючого модуля (особливо перед застосуванням коефіцієнта підсилення прогнозуючого модуля) поточний блок вирівняних оцінних коефіцієнтів перетворення проявляв одиничну дисперсію (наприклад, у деяких або всіх смугах частот). Для цього бітовий потік може містити параметр коефіцієнта підсилення дисперсії, а формувач спектра може бути сконфігурований для застосування цього параметра коефіцієнта підсилення дисперсії до поточного блока оцінних коефіцієнтів перетворення. Це може бути переважним відносно якості передбачення. Відповідно до одного з подальших аспектів, описується мовний кодер на основі перетворення, сконфігурований для кодування мовного сигналу в бітовий потік. Як уже описувалося вище, цей кодер може містити кожну з ознак і/або компонентів, що відносяться до кодера, описуваних у цьому документі. Зокрема, цей кодер може містити модуль кадрування, сконфігурований для приймання ряду послідовних блоків коефіцієнтів перетворення. Цей ряд послідовних блоків містить поточний блок і один або декілька попередніх блоків. Крім того, цей ряд послідовних блоків служить ознакою дискретних значень мовного сигналу. На додаток, зазначений мовний кодер може містити модуль вирівнювання, сконфігурований для визначення поточного блока вирівняних коефіцієнтів перетворення шляхом вирівнювання відповідного поточного блока коефіцієнтів перетворення з використанням відповідної поточної огинальної блока (наприклад, такої, що відповідає скоректованій огинальній). Крім того, мовний кодер може містити прогнозуючий модуль, сконфігурований для визначення поточного блока оцінних вирівняних коефіцієнтів перетворення на основі одного або декількох попередніх блоків відновлених коефіцієнтів перетворення й на основі одного або декількох параметрів прогнозуючого модуля (що включають, наприклад, коефіцієнт підсилення прогнозуючого модуля). Як описувалося вище, зазначені один або декілька блоків відновлених коефіцієнтів перетворення могли бути отримані на основі одного або декількох попередніх блоків коефіцієнтів перетворення. На додаток, мовний кодер може містити різницевий модуль, сконфігурований для визначення поточного блока коефіцієнтів помилок передбачення на основі поточного блока вирівняних коефіцієнтів перетворення й на основі поточного блока оцінних вирівняних коефіцієнтів перетворення. Прогнозуючий модуль може бути сконфігурований для визначення поточного блока оцінних вирівняних коефіцієнтів перетворення з використанням критерію середньозваженої 8 UA 114967 C2 5 10 15 20 25 30 35 40 45 50 55 60 квадратичної помилки (наприклад, шляхом мінімізації критерію середньозваженої квадратичної помилки). Цей критерій середньозваженої квадратичної помилки може враховувати в якості вагових коефіцієнтів поточну огинальну блоку або будь-яку попередньо визначену функцію цієї поточної огинальної блока. У цьому документі описуються й інші різні способи визначення коефіцієнта підсилення прогнозуючого модуля з використанням критерію середньозваженої квадратичної помилки. Крім того, мовний кодер може містити модуль квантування коефіцієнтів, сконфігурований для квантування коефіцієнтів, одержуваних з поточного блока коефіцієнтів помилок передбачення з використанням набору попередньо визначених квантувачів. Цей модуль квантування коефіцієнтів може бути сконфігурований для визначення набору попередньо визначених квантувачів залежно щонайменше від одного з одного або декількох параметрів прогнозуючого модуля. Це означає, що продуктивність прогнозуючого модуля може впливати на квантувачі, використовувані модулем квантування коефіцієнтів. Модуль квантування коефіцієнтів може бути сконфігурований для визначення на основі квантованих коефіцієнтів даних коефіцієнтів для бітового потоку. Як такі, дані коефіцієнтів можуть служити ознакою квантованої версії поточного блока коефіцієнтів помилок передбачення. Мовний кодер на основі перетворення також може містити модуль масштабування, сконфігурований для визначення поточного блока коефіцієнтів помилок зі зміненим масштабом на основі поточного блока коефіцієнтів помилок передбачення з використанням одного або декількох правил масштабування. Цей поточний блок коефіцієнтів помилок зі зміненим масштабом може бути визначений у такий спосіб, або зазначені одне або кілька правил масштабування можуть бути такі, що в середньому дисперсія коефіцієнтів помилок зі зміненим масштабом з поточного блока коефіцієнтів помилок зі зміненим масштабом є більш високою, ніж дисперсія коефіцієнтів помилок передбачення з поточного блока коефіцієнтів помилок передбачення. Зокрема, зазначені одне або кілька правил масштабування можуть бути такі, що дисперсія коефіцієнтів помилок передбачення перебуває ближче до одиниці для всіх елементів розділення за частотою або смуг частот. Для створення даних коефіцієнтів, модуль квантування коефіцієнтів може бути сконфігурований для квантування коефіцієнтів помилок зі зміненим масштабом з поточного блока коефіцієнтів помилок зі зміненим масштабом. Поточний блок коефіцієнтів помилок передбачення, як правило, містить ряд коефіцієнтів помилок передбачення для відповідного ряду елементів розділення за частотою. Коефіцієнти підсилення масштабування, застосовувані модулем масштабування до коефіцієнтів помилок передбачення відповідно до правила масштабування, можуть залежати від елементів розділення за частотою відповідних коефіцієнтів помилок передбачення. Крім того, правило масштабування може залежати від одного або декількох параметрів прогнозуючого модуля, наприклад від коефіцієнта підсилення прогнозуючого модуля. У якості альтернативи або на додаток, правило масштабування може залежати від поточної огинальної блока. У цьому документі описуються й інші різні способи визначення правила масштабування залежно від елемента розділення за частотою. Мовний кодер на основі перетворення також може містити модуль розподілу бітів, сконфігурований для визначення вектора розподілу на основі поточної огинальної блока. Вектор розподілу може служити ознакою першого квантувача з набору попередньо визначених квантувачів, що підлягають використанню для квантування першого коефіцієнта, отриманого з поточного блока коефіцієнтів помилок передбачення. Зокрема, вектор розподілу швидкості передачі даних може служити ознакою квантувачів, що підлягають використанню для квантування, відповідно, усіх коефіцієнтів, отриманих з поточного блока коефіцієнтів помилок передбачення. Наприклад, вектор розподілу може служити ознакою того, що для кожної смуги частот повинен бути використаний відмінний квантувач. Модуль розподілу бітів може бути сконфігурований для визначення вектора розподілу так, щоб дані коефіцієнтів для поточного блока коефіцієнтів помилок передбачення не перевищували попередньо визначену кількість бітів. Крім того, модуль розподілу бітів може бути сконфігурований для визначення значення зміщення, що служить ознакою зміщення, що підлягає застосуванню до огинальної розподілу, отриманої на основі поточної огинальної блока (наприклад, отриманої на основі поточної скоректованої огинальної). Значення зміщення може бути включене в бітовий потік, даючи відповідному декодеру можливість ідентифікувати квантувачі, які були застосовані для визначення даних коефіцієнтів. Згідно з іншим аспектом, описується мовний декодер на основі перетворення, сконфігурований для декодування бітового потоку з метою створення відновленого мовного сигналу. Цей мовний декодер може містити кожну з характерних ознак і/або компонентів, описуваних у цьому документі. Зокрема, цей декодер може містити прогнозуючий модуль, сконфігурований для визначення поточного блока 9 UA 114967 C2 5 10 15 20 25 30 35 40 45 50 55 60 оцінних вирівняних коефіцієнтів перетворення на основі одного або декількох попередніх блоків відновлених коефіцієнтів перетворення й на основі одного або декількох параметрів прогнозуючого модуля, отриманих з бітового потоку. Крім того, мовний декодер можемістити декодер спектра, сконфігурований для визначення поточного блока квантованих коефіцієнтів помилок передбачення (або їхніх версій зі зміненим масштабом) на основі даних коефіцієнтів, що містяться у бітовому потоці, з використанням набору попередньо визначених квантувачів. Зокрема, цей декодер спектра може використовувати набір попередньо визначених зворотних квантувачів, що відповідають набору попередньо визначених квантувачів, використаних відповідним кодером. Декодер спектра може бути сконфігурований для визначення набору попередньо визначених квантувачів (і/або відповідного набору попередньо визначених зворотних квантувачів) залежно від одного або декількох параметрів прогнозуючого модуля. Зокрема, декодер спектра може виконувати такий же процес вибору для набору попередньо визначених квантувачів, що й модуль квантування коефіцієнтів відповідного мовного кодера. Роблячи набір попередньо визначених квантувачів залежним від одного або декількох параметрів прогнозуючого модуля, можна поліпшити сприйману якість відновленого мовного сигналу. Зазначений набір попередньо визначених квантувачів може містити різні квантувачі з різними відношеннями сигнал-шум (і різними пов'язаними з ними бітовими швидкостями передачі даних). Крім того, набір попередньо визначених квантувачів може містити щонайменше один квантувач із додаванням псевдовипадкового шуму. Зазначені один або декілька параметрів прогнозуючого модуля можуть включати коефіцієнт g підсилення прогнозуючого модуля. Цей коефіцієнт g підсилення прогнозуючого модуля може служити ознакою ступеня значущості одного або декількох попередніх блоків відновлених коефіцієнтів перетворення для поточного блока відновлених коефіцієнтів перетворення. Як такий, коефіцієнт g підсилення прогнозуючого модуля може містити покажчик кількості інформації, що втримується в поточному блоці коефіцієнтів помилок передбачення. Відносно високий коефіцієнт g підсилення прогнозуючого модуля може служити ознакою великої кількості інформації, і навпаки. Кількість квантувачів із додаванням псевдовипадкового шуму, що містяться в наборі попередньо визначених квантувачів, може залежати від коефіцієнта підсилення прогнозуючого модуля. Зокрема, кількість квантувачів із додаванням псевдовипадкового шуму, що містяться в наборі попередньо визначених квантувачів, може зменшуватися при збільшенні коефіцієнта підсилення прогнозуючого модуля. Декодер спектра може мати доступ до першого набору й до другого набору попередньо визначених квантувачів. Цей другий набір може містити меншу кількість квантувачів із додаванням псевдовипадкового шуму, ніж перший набір квантувачів. Декодер спектра може бути сконфігурований для визначення на основі коефіцієнта g підсилення прогнозуючого модуля критерію rfu набору. Декодер спектра може бути сконфігурований для використання першого набору попередньо визначених квантувачів, якщо критерій rfu набору менше попередньо визначеного граничного значення. Крім того, декодер спектра може бути сконфігурований для використання другого набору попередньо визначених квантувачів, якщо критерій rfu набору більше або дорівнює зазначеному попередньо визначеному граничному значенню. Критерієм набору може бути rfu=min(l, max(g, 0)), де g - коефіцієнт підсилення прогнозуючого модуля. Цей критерій rfu набору приймає значення, які більші або дорівнюють нулю й менші або дорівнюють одиниці. Попередньо визначене граничне значення може становити 0,75. Як вказувалося вище, критерій набору може залежати від попередньо визначеного параметра керування, rfu. В одному з альтернативних прикладів, параметр rfu керування можна визначити, використовуючи наступні умови: rfu=1,0 для g

Дивитися

Додаткова інформація

Назва патенту англійською

Audio encoder and decoder

Автори англійською

Villemoes, Lars, Klejsa, Janusz, Hedelin, Per

Автори російською

Виллемоес Ларс, Клэйса Януш, Хэдэлин Пэр

МПК / Мітки

МПК: G10L 19/032, G10L 19/02, G10L 19/06

Мітки: кодувальний, декодувальний, пристрій, звукові

Код посилання

<a href="https://ua.patents.su/44-114967-zvukovi-koduvalnijj-pristrijj-i-dekoduvalnijj-pristrijj.html" target="_blank" rel="follow" title="База патентів України">Звукові кодувальний пристрій і декодувальний пристрій</a>

Подібні патенти