Прогнозування на основі моделі в наборі фільтрів із критичною дискретизацією
Формула / Реферат
1. Спосіб оцінки першого дискретного значення (615) сигналу першої підсмуги в першій підсмузі звукового сигналу, при цьому сигнал першої підсмуги звукового сигналу визначають із застосуванням набору (612) аналізуючих фільтрів, що містить ряд аналізуючих фільтрів, які створюють зі звукового сигналу ряд сигналів підсмуг, відповідно, у ряді підсмуг; при цьому спосіб включає:
- визначення параметра (613) моделі для моделі сигналу;
- визначення коефіцієнта прогнозування, що підлягає застосуванню до попереднього дискретного значення (614) першого декодованого сигналу підсмуги, отриманого із сигналу першої підсмуги, на основі моделі сигналу, на основі параметра (613) моделі та на основі набору (612) аналізуючих фільтрів; при цьому часовий інтервал попереднього дискретного значення (614) передує часовому інтервалу першого дискретного значення (615); і
- визначення оцінки першого дискретного значення (615) шляхом застосування коефіцієнта прогнозування до попереднього дискретного значення (614);
при цьому:
- визначення коефіцієнта прогнозування включає визначення коефіцієнта прогнозування з застосуванням довідкової таблиці або аналітичної функції;
- довідкова таблиця або аналітична функція передбачає коефіцієнт прогнозування залежно від параметра, отриманого виходячи з параметра моделі; і
- довідкова таблиця або аналітична функція є попередньо визначеною на основі моделі сигналу й на основі набору аналізуючих фільтрів.
2. Спосіб за п. 1, який відрізняється тим, що:
- модель сигналу містить одну або декілька синусоїдальних складових моделі; і
- параметр (613) моделі служить ознакою частоти однієї або декількох синусоїдальних складових моделі.
3. Спосіб за п. 2, який відрізняється тим, що параметр (613) моделі служить ознакою основної частоти W моделі мультисинусоїдального сигналу.
4. Спосіб за п. 3, який відрізняється тим, що:
- модель мультисинусоїдального сигналу містить періодичну складову сигналу;
- періодична складова сигналу містить ряд синусоїдальних складових; і
- ряд синусоїдальних складових має частоту, що є кратною частотою основної частоти W.
5. Спосіб за будь-яким попереднім пунктом, який відрізняється тим, що спосіб включає визначення ряду параметрів (613) моделі для моделі сигналу.
6. Спосіб за п. 5, який відрізняється тим, що:
- модель сигналу містить ряд періодичних складових сигналу; і
- ряд параметрів моделі служить ознакою ряду основних частот W0, W1, K, WM-1 з ряду періодичних складових сигналу.
7. Спосіб за будь-яким із пп. 5-6, який відрізняється тим, що один або декілька параметрів з ряду параметрів (513) моделі служать ознаками зсуву та/або відхилення моделі сигналу від періодичної моделі сигналу.
8. Спосіб за будь-яким попереднім пунктом, який відрізняється тим, що визначення параметра (613) моделі включає добування параметра (613) моделі з прийнятого бітового потоку, що служить ознакою параметра (613) моделі й сигналу помилки прогнозування.
9. Спосіб за будь-яким із пп. 1-7, який відрізняється тим, що:
- визначення параметра (613) моделі включає визначення параметра (613) моделі таким чином, що середнє значення сигналу квадратичної помилки прогнозування зменшується; і
- сигнал помилки прогнозування визначають на основі різниці між першим дискретним значенням (615) і оцінкою першого дискретного значення (615).
10. Спосіб за п. 9, який відрізняється тим, що середнє значення сигналу квадратичної помилки прогнозування визначають на основі ряду послідовних перших дискретних значень із сигналу першої підсмуги.
11. Спосіб за будь-яким попереднім пунктом, який відрізняється тим, що:
- набір аналізуючих фільтрів містить модульовану структуру; і
- абсолютне значення коефіцієнта прогнозування не залежить від порядкового номера першої підсмуги.
12. Спосіб за будь-яким попереднім пунктом, який відрізняється тим, що:
- параметр моделі служить ознакою основної частоти W моделі мультисинусоїдального сигналу; і
- визначення коефіцієнта прогнозування включає визначення кратної частоти основній частоті W, що лежить у межах першої підсмуги.
13. Спосіб за п. 12, який відрізняється тим, що визначення коефіцієнта прогнозування включає:
- визначення відносного зміщення кратної частоти основної частоти W від центральної частоти першої підсмуги при знаходженні кратної частоти основної частоти W у межах першої підсмуги; і/або
- прирівнювання коефіцієнта прогнозування до нуля при відсутності в межах першої підсмуги кратної частоти основної частоти W.
14. Спосіб за п. 13, який відрізняється тим, що:
- довідкова таблиця або аналітична функція передбачає коефіцієнт прогнозування залежно від можливих відносних зміщень від центральної частоти підсмуги; і
- визначення коефіцієнта прогнозування включає визначення коефіцієнта прогнозування на основі довідкової таблиці або аналітичної функції, що використовує визначене відносне зміщення.
15. Спосіб за п. 14, який відрізняється тим, що:
- довідкова таблиця містить обмежену кількість елементів для обмеженої кількості можливих відносних зміщень; і
- визначення коефіцієнта прогнозування включає округлення визначеного відносного зміщення до найближчого можливого відносного зміщення з обмеженої кількості можливих відносних зміщень.
16. Спосіб за будь-яким із пп. 12-15, який відрізняється тим, що визначення коефіцієнта прогнозування включає:
- вибір однієї таблиці з ряду довідкових таблиць на основі параметра моделі; і
- визначення коефіцієнта прогнозування на основі вибраної однієї таблиці з ряду довідкових таблиць.
17. Спосіб за п. 16, який відрізняється тим, що:
- параметр моделі служить ознакою періодичності T;
- ряд довідкових таблиць містить довідкові таблиці для різних значень періодичності Т; і
- спосіб включає визначення вибраної довідкової таблиці як довідкової таблиці для періодичності T, зазначеної параметром моделі.
18. Спосіб за п. 17, який відрізняється тим, що:
- ряд довідкових таблиць містить довідкові таблиці для різних значень періодичності Т у межах інтервалу [Тmin., Тmах.] з попередньо визначеним розміром кроку DT;
- Tmin. така, що для T<Tmin. звуковий сигнал можна моделювати, використовуючи модель сигналу, що містить єдину синусоїдальну складову моделі; і/або
- Tmах. така, що для Т>Тmах. довідкові таблиці для періодичностей від Tmах. до Tmах.+1 відповідають довідковим таблицям для періодичностей від Tmах.-1 до Tmах..
19. Спосіб за п. 18, який відрізняється тим, що для параметра моделі, що служить ознакою періодичності Т>Тmах., спосіб додатково включає:
- визначення залишкової періодичності Тr шляхом віднімання цілочислового значення з T так, що залишкова періодичність Tr лежить в інтервалі [Тmах.-1, Тmах.]; і
- вибір довідкової таблиці для визначення коефіцієнта прогнозування як довідкової таблиці для залишкової періодичності Тr.
20. Спосіб за будь-яким із пп. 18-19, який відрізняється тим, що для параметра моделі, що служить ознакою періодичності T<Tmin., спосіб додатково включає:
- вибір довідкової таблиці для визначення коефіцієнта прогнозування як довідкової таблиці для періодичності Tmin.;
- масштабування параметра пошуку для ідентифікації елемента вибраної довідкової таблиці, що передбачає коефіцієнт прогнозування, з застосуванням відношення Тmin./Т; і
- визначення коефіцієнта прогнозування з застосуванням вибраної довідкової таблиці й масштабованого параметра пошуку.
21. Спосіб за будь-яким попереднім пунктом, який відрізняється тим, що додатково включає:
- визначення маски (203, 205) прогнозування, що служить ознакою ряду попередніх дискретних значень у ряді підсмуг несучої множини маски прогнозування; при цьому ряд підсмуг несучої множини маски прогнозування містить щонайменше одну підсмугу з ряду підсмуг, що відрізняється від першої підсмуги;
- визначення ряду коефіцієнтів прогнозування, що підлягають застосуванню до ряду попередніх дискретних значень, на основі моделі сигналу, на основі параметра моделі та на основі набору аналізуючих фільтрів; і
- визначення оцінки першого дискретного значення шляхом застосування ряду коефіцієнтів прогнозування, відповідно, до ряду попередніх дискретних значень.
22. Спосіб за п. 21, який відрізняється тим, що визначення оцінки першого дискретного значення включає визначення суми ряду попередніх дискретних значень, зваженої за рядом відповідних коефіцієнтів прогнозування.
23. Спосіб за будь-яким попереднім пунктом, який відрізняється тим, що:
- ряд підсмуг має рівний інтервал між підсмугами; і
- перша підсмуга являє собою одну підсмугу з ряду підсмуг.
24. Спосіб за будь-яким попереднім пунктом, який відрізняється тим, що:
- аналізуючі фільтри з набору аналізуючих фільтрів є інваріантними відносно зсуву один щодо одного; і/або
- аналізуючі фільтри з набору аналізуючих фільтрів містять загальну віконну функцію; і/або
- аналізуючі фільтри з набору аналізуючих фільтрів містять по-різному модульовані версії загальної віконної функції; і/або
- загальна віконна функція є модульованою з застосуванням косинусної функції; і/або
- загальна віконна функція має кінцеву тривалість K; і/або
- аналізуючі фільтри з набору аналізуючих фільтрів утворюють ортогональний базис; і/або
- аналізуючі фільтри з набору аналізуючих фільтрів утворюють ортонормований базис; і/або
- набір аналізуючих фільтрів містить набір косинусно-модульованих фільтрів; і/або
- набір аналізуючих фільтрів являє собою набір фільтрів із критичною дискретизацією; і/або
- набір аналізуючих фільтрів містить перетворення з перекриттям; і/або
- набір аналізуючих фільтрів містить одне або декілька з наступних перетворень: MDCT, QMF, ELT; і/або
- набір аналізуючих фільтрів містить модульовану структуру.
25. Спосіб оцінки першого дискретного значення із сигналу першої підсмуги в першій підсмузі звукового сигналу, при цьому сигнал першої підсмуги звукового сигналу визначають із застосуванням набору аналізуючих фільтрів, що містить ряд аналізуючих фільтрів, які створюють зі звукового сигналу ряд сигналів підсмуг, відповідно, у ряді підсмуг; при цьому набір аналізуючих фільтрів є набором фільтрів із критичною дискретизацією; при цьому спосіб включає:
- визначення маски (203, 205) прогнозування, що служить ознакою ряду попередніх дискретних значень у ряді підсмуг несучої множини маски прогнозування; при цьому ряд підсмуг несучої множини маски прогнозування містить щонайменше одну підсмугу з ряду підсмуг, що відрізняється від першої підсмуги;
- визначення ряду коефіцієнтів прогнозування, що підлягають застосуванню до ряду попередніх дискретних значень; і
- визначення оцінки першого дискретного значення шляхом застосування ряду коефіцієнтів прогнозування, відповідно, до ряду попередніх дискретних значень.
26. Спосіб за п. 25, який відрізняється тим, що ряд підсмуг несучої множини маски прогнозування:
- містить першу підсмугу; і/або
- містить одну або декілька підсмуг із ряду підсмуг, що безпосередньо примикають до першої підсмуги.
27. Спосіб за будь-яким із пп. 25-26, який відрізняється тим, що:
- спосіб додатково включає визначення параметра моделі для моделі сигналу; і
- визначення ряду коефіцієнтів прогнозування включає визначення ряду коефіцієнтів прогнозування на основі моделі сигналу, на основі параметра моделі та на основі набору аналізуючих фільтрів.
28. Спосіб за п. 27, який відрізняється тим, що:
- визначення ряду коефіцієнтів прогнозування включає визначення ряду коефіцієнтів прогнозування з застосуванням довідкової таблиці або аналітичної функції;
- довідкова таблиця або аналітична функція передбачає ряд коефіцієнтів прогнозування залежно від параметра, отриманого виходячи з параметра моделі; і
- довідкова таблиця або аналітична функція є попередньо визначеною на основі моделі сигналу та на основі набору аналізуючих фільтрів.
29. Спосіб кодування звукового сигналу, при цьому спосіб включає:
- визначення ряду сигналів підсмуг зі звукового сигналу з застосуванням набору аналізуючих фільтрів, що містить ряд аналізуючих фільтрів;
- оцінку дискретних значень із ряду сигналів підсмуг із застосуванням способу за будь-яким попереднім пунктом, за допомогою чого одержують ряд оцінних сигналів підсмуг;
- визначення дискретних значень із ряду сигналів підсмуг помилок прогнозування на основі відповідних дискретних значень із ряду сигналів підсмуг і дискретних значень із ряду оцінних сигналів підсмуг;
- квантування ряду сигналів підсмуг помилок прогнозування; і
- генерування кодованого звукового сигналу, що служить ознакою ряду квантованих сигналів підсмуг помилок прогнозування й одного або декількох параметрів, використаних для оцінки дискретних значень із ряду оцінних сигналів підсмуг.
30. Спосіб декодування кодованого звукового сигналу, при цьому кодований звуковий сигнал служить ознакою ряду квантованих сигналів підсмуг помилок прогнозування й одного або декількох параметрів, що підлягають використанню для оцінки дискретних значень із ряду оцінних сигналів підсмуг; при цьому спосіб включає:
- деквантування ряду квантованих сигналів підсмуг помилок прогнозування, за допомогою чого одержують ряд деквантованих сигналів підсмуг помилок прогнозування;
- оцінку дискретних значень ряду оцінних сигналів підсмуг із застосуванням способу за будь-яким із пп. 1-28;
- визначення дискретних значень із ряду декодованих сигналів підсмуг на основі відповідних дискретних значень із ряду оцінних сигналів підсмуг і дискретних значень із ряду деквантованих сигналів підсмуг помилок прогнозування; і
- визначення декодованого звукового сигналу з ряду декодованих сигналів підсмуг із застосуванням набору синтезуючих фільтрів, що містить ряд синтезуючих фільтрів.
31. Система (103, 105), виконана з можливістю оцінки одного або декількох перших дискретних значень сигналу першої підсмуги звукового сигналу, при цьому сигнал першої підсмуги звукового сигналу визначений із застосуванням набору аналізуючих фільтрів, що містить ряд аналізуючих фільтрів, які створюють ряд сигналів підсмуг зі звукового сигналу, відповідно; при цьому система (103, 105) містить:
- обчислювач (105) предиктора, виконаний з можливістю визначення параметра моделі для моделі сигналу й виконаний з можливістю визначення одного або декількох коефіцієнтів прогнозування, що підлягають застосуванню до одного або декількох попередніх дискретних значень декодованого сигналу першої підсмуги, отриманого із сигналу першої підсмуги; при цьому один або декілька коефіцієнтів прогнозування визначені на основі моделі сигналу, на основі параметра моделі та на основі набору аналізуючих фільтрів; при цьому часові інтервали одного або декількох попередніх дискретних значень передують часовим інтервалам одного або декількох перших дискретних значень; і
- предиктор (103) підсмуг, виконаний з можливістю визначення оцінки одного або декількох перших дискретних значень шляхом застосування одного або декількох коефіцієнтів прогнозування до одного або декількох попередніх дискретних значень;
при цьому:
- визначення коефіцієнта прогнозування включає визначення коефіцієнта прогнозування з застосуванням довідкової таблиці або аналітичної функції;
- довідкова таблиця або аналітична функція передбачає коефіцієнт прогнозування залежно від параметра, отриманого виходячи з параметра моделі; і
- довідкова таблиця або аналітична функція є попередньо визначеною на основі моделі сигналу та на основі набору аналізуючих фільтрів.
32. Система (103, 105), виконана з можливістю оцінки одного або декількох перших дискретних значень сигналу першої підсмуги звукового сигналу, при цьому сигнал першої підсмуги відповідає першій підсмузі; при цьому сигнал першої підсмуги визначений із застосуванням набору аналізуючих фільтрів, що містить ряд аналізуючих фільтрів, які створюють ряд сигналів підсмуг, відповідно, у ряді підсмуг; при цьому набір аналізуючих фільтрів є набором фільтрів із критичною дискретизацією; при цьому система (103, 105) містить:
- обчислювач (105) предиктора, виконаний з можливістю визначення маски (203, 205) прогнозування, що служить ознакою ряду попередніх дискретних значень у ряді підсмуг несучої множини маски прогнозування; при цьому ряд підсмуг несучої множини маски прогнозування містить щонайменше одну підсмугу з ряду підсмуг, що відрізняється від першої підсмуги; при цьому обчислювач (105) предиктора додатково виконаний з можливістю визначення ряду коефіцієнтів прогнозування, що підлягають застосуванню до ряду попередніх дискретних значень; і
- предиктор (103) підсмуг, виконаний з можливістю визначення оцінки одного або декількох перших дискретних значень шляхом застосування ряду коефіцієнтів прогнозування, відповідно, до ряду попередніх дискретних значень.
33. Аудіокодер, виконаний з можливістю кодування звукового сигналу, при цьому аудіокодер містить:
- набір аналізуючих фільтрів, виконаний з можливістю визначення ряду сигналів підсмуг зі звукового сигналу з застосуванням ряду аналізуючих фільтрів;
- систему (103, 105) за будь-яким із пп. 31-32, виконану з можливістю оцінки дискретних значень ряду сигналів підсмуг з одержанням у результаті ряду оцінних сигналів (112) підсмуг;
- різницевий модуль, виконаний з можливістю визначення дискретних значень ряду сигналів підсмуг помилок прогнозування на основі відповідних дискретних значень із ряду сигналів підсмуг і з ряду оцінних сигналів (112) підсмуг;
- модуль квантування, виконаний з можливістю квантування ряду сигналів підсмуг помилок прогнозування; і
- модуль генерування бітового потоку, виконаний з можливістю генерування кодованого звукового сигналу, що служить ознакою ряду квантованих сигналів підсмуг помилок прогнозування та одного або декількох параметрів, використаних для оцінки дискретних значень із ряду оцінних сигналів підсмуг.
34. Аудіодекодер (100), виконаний з можливістю декодування кодованого звукового сигналу, при цьому кодований звуковий сигнал служить ознакою ряду квантованих сигналів підсмуг помилок прогнозування та одного або декількох параметрів, використаних для оцінки дискретних значень із ряду оцінних сигналів підсмуг; при цьому аудіодекодер (100) містить:
- зворотний квантувач (101), виконаний з можливістю деквантування ряду квантованих сигналів підсмуг помилок прогнозування з одержанням у результаті ряду деквантованих сигналів (111) підсмуг помилок прогнозування;
- систему (105, 103) за будь-яким із пп. 31-32, виконану з можливістю оцінки дискретних значень ряду оцінних сигналів (112) підсмуг;
- підсумовувальний модуль, виконаний з можливістю визначення дискретних значень із ряду декодованих сигналів (113) підсмуг на основі відповідних дискретних значень із ряду оцінних сигналів (112) підсмуг і на основі дискретних значень із ряду деквантованих сигналів (111) підсмуг помилок прогнозування; і
- набір (102) синтезуючих фільтрів, виконаний з можливістю визначення декодованого звукового сигналу (114) виходячи з ряду декодованих сигналів (113) підсмуг із застосуванням ряду синтезуючих фільтрів.
Текст
Реферат: Винахід належить до систем кодування джерела звуку. Зокрема, цей документ належить до систем кодування джерела звуку, що використовують лінійне прогнозування в комбінації з набором фільтрів. Описано спосіб оцінки першого дискретного значення (615) сигналу першої підсмуги в першій підсмузі звукового сигналу. Сигнал першої підсмуги звукового сигналу визначають із застосуванням набору (612) аналізуючих фільтрів, що містить ряд аналізуючих фільтрів, які створюють зі звукового сигналу ряд сигналів підсмуг, відповідно, у ряді підсмуг. Спосіб включає визначення параметра (613) моделі для моделі сигналу; визначення коефіцієнта прогнозування, що підлягає застосуванню до попереднього дискретного значення (614) декодованих сигналів першої підсмуги, отриманих із сигналу першої підсмуги, на основі моделі сигналу, на основі параметра (613) моделі та на основі набору (612) аналізуючих фільтрів; при цьому часовий інтервал попереднього дискретного значення (614) передує часовому інтервалу першого дискретного значення (615); і визначення оцінки першого дискретного значення (615) шляхом застосування коефіцієнта прогнозування до попереднього дискретного значення (614). UA 111310 C2 (12) UA 111310 C2 UA 111310 C2 5 10 15 20 25 30 35 40 45 50 55 60 Цей документ відноситься до систем кодування джерела звуку. Зокрема, цей документ відноситься до систем кодування джерела звуку, що використовують лінійне прогнозування в комбінації з набором фільтрів. ПЕРЕДУМОВИ Існує два важливі інструментальні засоби обробки сигналів, застосовуваних у системах кодування джерела звукових сигналів, а саме: набори фільтрів із критичною дискретизацією та лінійне прогнозування. Набори фільтрів із критичною дискретизацією (наприклад, набори фільтрів на основі модифікованого дискретного косинусного перетворення, MDCT) уможливлюють прямий доступ до частотно-часових представлень, де можна використовувати перцепційну невідповідність і надмірність сигналу. Лінійне прогнозування уможливлює ефективне моделювання джерела звукових сигналів, зокрема у мовних сигналах. Комбінація цих двох інструментальних засобів, тобто використання прогнозування в підсмугах набору фільтрів, головним чином, була використана для кодування звуку з високою бітовою швидкістю передачі даних. Для кодування з низькою бітовою швидкістю передачі даних проблемою, пов'язаною з прогнозуванням у підсмугах, є підтримка низьких витрат (тобто бітової швидкості передачі даних) для опису предикторів. Іншою проблемою є керування обмеженням результуючого шуму сигналу помилки прогнозування, одержуваного предиктором підсмуг. В документі US2006/0015329A1 описаний спосіб кодування звуку, який уможливлює використання синтезатору форми сигналу для створення набору спрогнозованих дискретних значень звукового сигналу. Можливим шляхом рішення проблеми ефективного з погляду кількості бітів кодування опису предиктора підсмуг є оцінка предиктора виходячи з раніше декодованих частин звукового сигналу та повне усунення, таким чином, витрат опису предиктора. Якщо предиктор можна визначити виходячи з раніше декодованих частин звукового сигналу, то предиктор можна визначити в кодері й у декодері без необхідності в передачі опису предиктора з кодера в декодер. Ця схема називається адаптивною схемою прогнозування у зворотному порядку. Проте адаптивна схема прогнозування у зворотному порядку, як правило, значно погіршується при зменшенні бітової швидкості передачі даних кодованого звукового сигналу. Одним з альтернативних або додаткових шляхів до ефективного кодування предиктора підсмуг є виявлення більш природнього опису предиктора, наприклад опису, що використовує структуру, внутрішньо властиву звуковому сигналу, який підлягає кодуванню. Наприклад, кодування мови з низькою бітовою швидкістю передачі даних, як правило, застосовує адаптивну схему в прямому порядку, засновану на компактному представленні короткострокового предиктора (що використовує короткострокові кореляції) і довгочасного предиктора (що використовує довгострокові кореляції, обумовлені основним тоном, що лежить в основі мовного сигналу). Для рішення проблеми керування обмеженням шуму сигналу помилки прогнозування було зроблене спостереження того, що незважаючи на те, що обмеженням шуму предиктора можна добре керувати всередині підсмуги, остаточний вихідний звуковий сигнал кодера, як правило, проявляє артефакти паразитних частот (за винятком звукових сигналів, що проявляють по суті плоску форму спектрального шуму). Важливим випадком предиктора підсмуг є реалізація довгострокового прогнозування в наборі фільтрів з вікнами, що перекриваються. Довгостроковий предиктор, як правило, використовує надмірності в періодичних або близьких до періодичних звукових сигналах (таких як мовні сигнали, що проявляють внутрішньо властивий їм основний тон), і його можна описати єдиним параметром прогнозування або невеликою кількістю таких параметрів. Довгостроковий предиктор можна визначити в безперервному часі за допомогою затримки, що відбиває періодичність звукового сигналу. Коли ця затримка велика в порівнянні з довжиною вікна набору фільтрів, довгостроковий предиктор можна реалізувати в області дискретного часу за допомогою зсуву, або дробової затримки, і можна перетворити назад у причинний предиктор в області підсмуг. Такий довгостроковий предиктор, як правило, не проявляє артефакти паразитних частот, але тут існує значний штраф в обчислювальній складності, викликаній необхідністю в додаткових операціях набору фільтрів для перетворення з часової області в область підсмуг. Крім того, підхід, що полягає у визначенні затримки в часовій області й перетворенні затримки в предиктор підсмуг, не застосовний у випадку, коли період звукового сигналу, що підлягає кодуванню, можна порівняти з розміром вікна набору фільтрів або коли він його не перевищує. Цей документ спрямований на подолання вищезгаданих недоліків прогнозування підсмуг. Зокрема, цей документ описує способи й системи, що роблять можливим ефективний з погляду бітової швидкості передачі даних опис предикторів підсмуг і/або роблять можливим зменшення артефактів паразитних частот, що викликані предикторами підсмуг. Зокрема, спосіб і системи, 1 UA 111310 C2 5 10 15 20 25 30 35 40 45 50 55 60 що описуються у цьому документі, дозволяють реалізувати аудіокодери з низькою бітовою швидкістю передачі даних, що використовують прогнозування підсмуг, що викликає знижений рівень артефактів паразитних частот. КОРОТКИЙ ОПИС ВИНАХОДУ Цей документ описує способи й системи, що поліпшують якість кодування джерела звуку із застосуванням прогнозування в області підсмуг набору фільтрів із критичною дискретизацією. Ці способи й системи можуть використовувати компактний опис предикторів підсмуг, причому опис засновано на моделях сигналу. В якості альтернативи або на додаток, способи й системи можуть використовувати ефективну реалізацію предикторів безпосередньо в області підсмуг. В якості альтернативи або на додаток, способи й системи можуть використовувати члени міжсмужного предиктора підсмуг, що описуються в цьому документі, для того щоб уможливити зменшення артефактів паразитних частот. Як описується в цьому документі, компактний опис предикторів підсмуг може містити частоту синусоїди, період періодичного сигналу, трохи негармонійний спектр, що зустрічається при коливанні твердої струни, і/або множину тонів для поліфонічного сигналу. Показано, що у випадку довгострокового предиктора періодична модель сигналу забезпечує високоякісні причинні предиктори для інтервалу параметрів запізнювання (або затримок), що включає значення, які є більш короткими та/або більш довгими, ніж розмір вікна набору фільтрів. Це означає, що періодичну модель сигналу можна ефективно використовувати для реалізації довгострокового предиктора підсмуг. Передбачено плавний перехід від прогнозування на основі синусоїдальної моделі до наближення довільної затримки. Безпосередня реалізація предикторів в області підсмуг уможливлює доступ у явному виді до сприйманих характеристик вироблюваних спотворень квантування. Крім того, реалізація предикторів в області підсмуг уможливлює доступ до таких чисельних властивостей, як коефіцієнт передачі прогнозування й залежність предикторів від параметрів. Наприклад, аналіз на основі моделі сигналу може виявити, що коефіцієнт передачі прогнозування є значимим лише для підмножини розглянутих підсмуг, а зміна коефіцієнтів предиктора залежно від параметра, обраного для передачі, може бути корисною при проектуванні форматів параметрів, а також ефективних алгоритмів кодування. Більше того, обчислювальну складність можна значно знизити в порівнянні з реалізаціями предикторів, що покладаються на використання алгоритмів, що діють як у часовій області, так і в області підсмуг. Зокрема, способи й системи, що описуються в цьому документі, можна використовувати для реалізації прогнозування підсмуг безпосередньо в області підсмуг без необхідності у визначенні й застосуванні предиктора (наприклад, довгострокової затримки) у часовій області. Використання в предикторах підсмуг міжсмужних членів дозволяє значно поліпшити властивості обмеження шуму в частотній області в порівнянні з внутрішньосмужними предикторами (які покладаються винятково на внутрішньосмужне прогнозування). Діючи таким чином, можна зменшити артефакти паразитних частот, за допомогою цього уможливлюючи використання прогнозування підсмуг для систем кодування звуку з відносно низькими бітовими швидкостями передачі даних. Відповідно до однієї з особливостей, описується спосіб оцінки першого дискретного значення першої підсмуги звукового сигналу. Ця перша підсмуга звукового сигналу могла бути визначена із застосуванням набору аналізуючих фільтрів, що містить ряд аналізуючих фільтрів, які створюють зі звукового сигналу ряд сигналів підсмуг, відповідно, у ряді підсмуг. Звуковий сигнал у часовій області може бути переданий у набір аналізуючих фільтрів, приводячи до ряду сигналів підсмуг у ряді підсмуг. Кожна підсмуга з ряду підсмуг, як правило, охоплює відмінний діапазон частот звукового сигналу, за допомогою цього забезпечуючи доступ до різних частотних складових звукового сигналу. Ряд підсмуг може мати рівний або рівномірний інтервал між підсмугами. Перша підсмуга відповідає одній підсмузі з ряду підсмуг, створених набором аналізуючих фільтрів. Набір аналізуючих фільтрів може мати різноманітні властивості. Набір синтезуючих фільтрів, що містить ряд синтезуючих фільтрів, може мати схожі або такі ж властивості. Властивості, що описуються для набору аналізуючих фільтрів і для аналізуючих фільтрів, також застосовні до властивостей набору синтезуючих фільтрів і до синтезуючих фільтрів. Як правило, комбінація набору аналізуючих фільтрів і набору синтезуючих фільтрів уможливлює зроблену реконструкцію звукового сигналу. Аналізуючі фільтри з набору аналізуючих фільтрів можуть бути інваріантні відносно зсуву один щодо одного. В якості альтернативи або на додаток, аналізуючі фільтри з набору аналізуючих фільтрів можуть містити загальну віконну функцію. Зокрема, аналізуючі фільтри з набору аналізуючих фільтрів можуть містити по-різному модульовані версії загальної віконної функції. В одному з варіантів здійснення загальна віконна 2 UA 111310 C2 5 10 15 20 25 30 35 40 45 50 55 60 функція є модульованою з застосуванням косинусной функції, за допомогою цього приводячи до набору косинусно-модульованих аналізуючих фільтрів. Зокрема, набір аналізуючих фільтрів може містити одне або декілька (або може відповідати одному або декільком) з наступних перетворень: MDCT, QMF і/або ELT. Загальна віконна функція може мати кінцеву тривалість К. Тривалість загальної віконної функції може бути такою, щоб послідовні дискретні значення сигналу підсмуги визначалися з застосуванням сегментів, що перекриваються, звукового сигналу в часовій області. Як такий, набір аналізуючих фільтрів може містити перетворення з перекриттям. Аналізуючі фільтри з набору аналізуючих фільтрів можуть утворювати ортогональний і/або ортонормований базис. В якості однієї з додаткових властивостей набір аналізуючих фільтрів може відповідати набору фільтрів із критичною дискретизацією. Зокрема, кількість дискретних значень із ряду сигналів підсмуг може відповідати кількості дискретних значень звукового сигналу в часовій області. Спосіб може включати визначення параметра моделі для моделі сигналу. Слід зазначити, що модель сигналу може бути описана з застосуванням ряду параметрів моделі. Як такий, зазначений спосіб може включати визначення цього ряду параметрів моделі для моделі сигналу. Параметр (параметри) моделі можна витягати з прийнятого бітового потоку, що містить або служить ознакою параметра моделі та сигналу помилки прогнозування. В якості альтернативи, параметр (параметри) моделі можна визначати, підбираючи модель сигналу для звукового сигналу (наприклад, на покадровій основі), наприклад, з застосуванням підходу середньоквадратичної помилки. Модель сигналу може містити одну або декілька синусоїдальних складових моделі. У цьому випадку, параметр моделі може служити ознакою однієї або декількох частот однієї або декількох синусоїдальних складових моделі. Наприклад, параметр моделі може служити ознакою основної частоти Ω моделі мультисинусоїдального сигналу, при цьому мультисинусоїдальний сигнал містить синусоїдальні складові моделі на частотах, відповідних до кратних частот qΩ основної частоти Ω. Як така, модель мультисинусоїдального сигналу може містити періодичну складову сигналу, при цьому періодична складова сигналу містить ряд синусоїдальних складових і при цьому ряд синусоїдальних складових має частоту, що є кратною основній частоті Ω. Як буде показано в цьому документі, таку періодичну складову сигналу можна використовувати для моделювання затримки в часовій області (наприклад, використовуваній в довгострокових предикторах). Модель сигналу може містити один або декілька параметрів моделі, що служать ознаками зсуву та/або відхилення моделі сигналу від періодичної моделі сигналу. Зсув та/або відхилення можуть служити ознакою відхилення частот ряду синусоїдальних складових періодичної моделі сигналу від відповідних кратних частот qΩ основної частоти Ω. Модель сигналу може містити ряд періодичних складових сигналу. Кожна з періодичних складових сигналу може бути описаною з застосуванням одного або декількох параметрів моделі. Параметри моделі можуть служити ознаками ряду основних частот 0 , 1 , , M 1 з ряду періодичних складових сигналу. В якості альтернативи або на додаток, модель сигналу можна описати попередньо обумовленим і/або коректовуваним параметром ослаблення (який може являти собою один з параметрів моделі). Параметр ослаблення може бути розрахованим на вирівнювання або згладжування лінійчатого спектра періодичної складової сигналу. Конкретні приклади моделей сигналу й пов'язаних з ними параметрів описуються в розділі варіантів здійснення цього документа. Параметр (параметри) моделі можна визначити так, щоб зменшувати (наприклад, мінімізувати) середнє значення сигналу квадратичної помилки прогнозування. Сигнал помилки прогнозування можна визначити на основі різниці між першим дискретним значенням і оцінкою першого дискретного значення. Зокрема, середнє значення сигналу квадратичної помилки прогнозування можна визначити на основі ряду послідовних перших дискретних значень сигналу першої підсмуги та на основі відповідного ряду оцінних перших дискретних значень. Зокрема, у цьому документі пропонується моделювати звуковий сигнал або щонайменше сигнал першої підсмуги звукового сигналу з застосуванням моделі сигналу, що описується одним або декількома параметрами моделі. Параметри моделі використовують для визначення одного або декількох коефіцієнтів прогнозування лінійного предиктора, що визначає перший оцінний сигнал підсмуги. Різниця між сигналом першої підсмуги й оцінним сигналом першої підсмуги приводить до сигналу підсмуги помилки прогнозування. Один або декілька параметрів моделі можна визначити так, щоб зменшувати (наприклад, мінімізувати) середнє значення сигналу підсмуг квадратичної помилки прогнозування. Спосіб може також включати визначення коефіцієнта прогнозування, що підлягає застосуванню до попереднього дискретного значення декодованого сигналу першої підсмуги, 3 UA 111310 C2 5 10 15 20 25 30 35 40 45 отриманого із сигналу першої підсмуги. Зокрема, попереднє дискретне значення можна визначити шляхом додавання (квантованої версії) сигналу помилки прогнозування з відповідним дискретним значенням сигналу першої підсмуги. Декодований сигнал першої підсмуги може бути ідентичним сигналу першої підсмуги (наприклад, у випадку кодера без втрат). Часовий інтервал попереднього дискретного значення, як правило, передує часовому інтервалу першого дискретного значення. Зокрема, цей спосіб може включати визначення одного або декількох коефіцієнтів прогнозування рекурсивного фільтра з прогнозуванням (зі скінченною імпульсною характеристикою), виконаного з можливістю визначення першого дискретного значення сигналу першої підсмуги виходячи з одного або декількох попередніх дискретних значень. Один або декілька коефіцієнтів прогнозування можна визначити на основі моделі сигналу, на основі параметра моделі і на основі набору аналізуючих фільтрів. Зокрема, коефіцієнт прогнозування можна визначити на основі аналітичної оцінки моделі сигналу та набору аналізуючих фільтрів. Аналітична оцінка моделі сигналу та набору аналізуючих фільтрів може приводити до визначення довідкової таблиці та/або аналітичної функції. Як такий, коефіцієнт прогнозування можна визначити, використовуючи довідкову таблицю та/або аналітичну функцію, при цьому довідкову таблицю та/або аналітичну функцію можна попередньо визначити на основі моделі сигналу й на основі набору аналізуючих фільтрів. Довідкова таблиця та/або аналітична функція може передбачати коефіцієнт (коефіцієнти) прогнозування залежно від параметра, отриманого виходячи з параметра (параметрів) моделі. Параметр, отриманий виходячи з параметра моделі, може, наприклад, являти собою параметр моделі, або його можна одержати виходячи з параметра моделі з застосуванням попередньо визначеної функції. Як такий, один або декілька коефіцієнтів прогнозування можна визначити ефективно шляхом обчислень, використовуючи попередньо визначену довідкову таблицю та/або аналітичну функцію, що передбачає один або декілька коефіцієнтів прогнозування в залежності (тільки) від одного або декількох параметрів, отриманих (тільки) виходячи з одного або декількох параметрів моделі. Таким чином, визначення коефіцієнта прогнозування можна звести до простого пошуку елемента в довідковій таблиці. Як було зазначено вище, набір аналізуючих фільтрів може містити або може проявляти модульовану структуру. Як результат такої модульованої структури спостерігається, що абсолютне значення одного або декількох коефіцієнтів прогнозування не залежить від порядкового номера першої підсмуги. Це означає, що довідкова таблиця та/або аналітична функція може бути інваріантною відносно зсуву (без врахування знака) відносно порядкового номера ряду підсмуг. У таких випадках параметр, отриманий виходячи з параметра моделі, тобто параметра, уведеного в довідкову таблицю та/або аналітичну функцію з метою визначення коефіцієнта прогнозування, можна одержати, виражаючи параметр моделі відносним чином – по відношенню до підсмуги з ряду підсмуг. Як було описано вище, параметр моделі може служити ознакою основної частоти моделі мультисинусоїдального сигналу (наприклад, періодичної моделі сигналу). У таких випадках визначення коефіцієнта прогнозування може включати визначення кратної частоти основної частоти Ω, що лежить у межах першої підсмуги. Якщо кратна частота основної частоти Ω лежить у межах першої підсмуги, то можна визначити відносне зміщення кратної частоти основної частоти Ω від центральної частоти першої підсмуги. Зокрема, можна визначити відносне зміщення цієї кратної частоти основної частоти Ω, найближчої до центральної частоти першої підсмуги. Довідкову таблицю та/або аналітичну функцію можна визначити так, щоб довідкова таблиця та/або аналітична функція передбачала коефіцієнт прогнозування залежно від можливих відносних зміщень від центральної частоти підсмуги (наприклад, залежно від f 50 55 60 нормованої частоти та/або залежно від параметра Θ зсуву, що описується в цьому документі). Як такий, коефіцієнт прогнозування можна визначити на основі довідкової таблиці та/або на основі аналітичної функції, використовуючи визначене відносне зміщення. Попередньо визначена довідкова таблиця може включати обмежену кількість елементів для обмеженої кількості можливих відносних зміщень. У цьому випадку перед пошуком коефіцієнта прогнозування по довідковій таблиці відносне зміщення, що визначається, можна округлити до найближчого можливого відносного зміщення з обмеженого числа можливих відносних зміщень. З іншого боку, якщо в межах першої підсмуги, точніше, у межах розширеного діапазону частот, що оточує першу підсмугу, не лежить кратна частота основної частоти Ω, коефіцієнт прогнозування може бути прирівняним до нуля. У цих випадках оцінка першого дискретного значення також буде нульовою. Визначення коефіцієнта прогнозування може включати вибір однієї з декількох довідкових таблиць на основі параметра моделі. Наприклад, параметр моделі може служити ознакою основної частоти Ω періодичної моделі сигналу. Основна частота Ω періодичної моделі сигналу 4 UA 111310 C2 5 10 15 20 25 30 35 40 45 50 55 60 відповідає періодичності T періодичної моделі сигналу. У цьому документі показано, що у випадку відносно невеликих періодичностей T періодична модель сигналу наближається до односинусоїдальної моделі. Крім того, у цьому документі показано, що у випадку відносно великих періодичностей Т довідкові таблиці повільно змінюються з абсолютним значенням Т і головним чином залежать від відносного зміщення (тобто від параметра Θ зсуву). Як такий, ряд довідкових таблиць можна попередньо визначити для ряду різних значень періодичності Т. Параметр моделі (тобто періодичність Т) можна використовувати для вибору підходящої довідкової таблиці з ряду довідкових таблиць, а коефіцієнт прогнозування можна визначити на основі обраної довідкової таблиці з ряду довідкових таблиць (використовуючи відносне зміщення, наприклад використовуючи параметр Θ зсуву). Як такий, параметр моделі (що представляє, наприклад, періодичність Т), який може мати відносно високу точність, можна зі зниженою точністю декодувати в пару параметрів (наприклад, у періодичність Т і відносне зміщення). Перший параметр (наприклад, періодичність Т) з цієї пари параметрів можна використовувати для вибору конкретної довідкової таблиці, а другий параметр (наприклад, відносне зміщення) можна використовувати для ідентифікації елемента в обраній довідковій таблиці. Спосіб може також включати визначення оцінки першого дискретного значення шляхом застосування коефіцієнта прогнозування до попереднього дискретного значення. Застосування коефіцієнта прогнозування до попереднього дискретного значення може включати множення коефіцієнта прогнозування на значення попереднього дискретного значення, за допомогою чого виходить оцінка першого дискретного значення. Як правило, застосовуючи коефіцієнт прогнозування до послідовності попередніх дискретних значень, визначають ряд перших дискретних значень із сигналу першої підсмуги. Визначення оцінки першого дискретного значення також може включати застосування масштабного коефіцієнта передачі до коефіцієнта прогнозування та/або до першого дискретного значення. Масштабний коефіцієнт передачі (або його покажчик) можна використовувати, наприклад, для довгострокового прогнозування (LTP). Іншими словами, масштабний коефіцієнт передачі може випливати з іншого предиктора (наприклад, з довгострокового предиктора). Масштабний коефіцієнт передачі може відрізнятися для різних підсмуг. Крім того, масштабний коефіцієнт передачі може передаватися як частина кодованого звукового сигналу. Як такий, ефективний опис предиктора підсмуг (що містить один або декілька коефіцієнтів прогнозування) створюють, використовуючи модель сигналу, описувану параметром моделі. Параметр моделі використовують для визначення одного або декількох коефіцієнтів прогнозування для предиктора підсмуг. Це означає, що аудіокодер не має потреби в передачі покажчика одного або декількох коефіцієнтів прогнозування, але лише покажчика параметра моделі. Як правило, параметр моделі можна кодувати більш ефективно (тобто меншою кількістю бітів), ніж один або декілька коефіцієнтів прогнозування. Тому використання прогнозування на основі моделі уможливлює кодування підсмуг із низькою бітовою швидкістю передачі даних. Спосіб може також включати визначення маски прогнозування, що служить ознакою ряду попередніх дискретних значень у ряді підсмуг несучої множини маски прогнозування. Ряд підсмуг несучої множини маски прогнозування може містити щонайменше одну підсмугу з ряду підсмуг, що відрізняється від першої підсмуги. Як такий, предиктор підсмуг може бути виконаним з можливістю оцінки дискретного значення із сигналу першої підсмуги виходячи з дискретних значень одного або декількох інших сигналів підсмуг із ряду сигналів підсмуг, що відрізняються від сигналу першої підсмуги. Це називається в цьому документі міжсмужним прогнозуванням підсмуг. Маска прогнозування може визначати впорядкування ряду попередніх дискретних значень (наприклад, часове запізнювання відносно часового інтервалу першої підсмуги та/або запізнювання індексу підсмуги відносно порядкового номера першої підсмуги), використовуваних для оцінки першого дискретного значення із сигналу першої підсмуги. Спосіб може продовжуватися визначенням ряду коефіцієнтів прогнозування, що підлягають застосуванню до ряду попередніх дискретних значень. Ряд коефіцієнтів прогнозування можна визначити на основі моделі сигналу, на основі параметра моделі та на основі набору аналізуючих фільтрів (наприклад, із застосуванням схем прогнозування на основі моделі, описаних вище в цьому документі). Як такий, ряд коефіцієнтів прогнозування можна визначити, використовуючи один або декілька параметрів моделі. Іншими словами, для визначення ряду коефіцієнтів прогнозування може бути досить обмеженої кількості параметрів моделі. Це означає, що за допомогою використання прогнозування підсмуг на основі моделі можна ефективно з погляду бітової швидкості передачі даних реалізувати міжсмужне прогнозування підсмуг. 5 UA 111310 C2 5 10 15 20 25 30 Спосіб може включати визначення оцінки першого дискретного значення шляхом застосування ряду коефіцієнтів прогнозування, відповідно, до ряду попередніх дискретних значень. Визначення оцінки першого дискретного значення, як правило, включає визначення суми ряду попередніх дискретних значень, зваженої за рядом відповідних коефіцієнтів прогнозування. Як було описано вище, параметр моделі може служити ознакою періодичності Т. Ряд довідкових таблиць, використовуваних для визначення одного або декількох коефіцієнтів прогнозування, може містити довідкові таблиці для різних значень періодичності Т. Зокрема, ряд довідкових таблиць може містити довідкові таблиці для різних значень періодичності Т у межах інтервалу [Tmin, Tmax] з попередньо визначеним розміром кроку ∆T. Як буде описано в цьому документі, Tmin може перебувати в інтервалі 0,25, а Tmax може перебувати в інтервалі 2,5. Tmin можна вибрати так, щоб при TTmax довідкові таблиці для періодичностей від Tmax до Tmax+1 по суті відповідали довідковим таблицям для періодичностей від Tmax-1 до Tmax. Це ж у цілому застосовне для періодичностей Tmax+n до Tmax+n+1 при n≥0. Спосіб може включати визначення обраної довідкової таблиці як довідкової таблиці для періодичності Т, зазначеної параметром моделі. Після того як був зроблений вибір довідкової таблиці, що містить або вказує один або декілька коефіцієнтів прогнозування, для ідентифікації в обраній довідковій таблиці підходящого одного або декількох елементів, що вказують відповідно один або декілька коефіцієнтів прогнозування, можна використовувати параметр пошуку. Параметр пошуку може відповідати або може бути отриманим виходячи з параметра Θ зсуву. Спосіб може включати, для параметра моделі, що служить ознакою періодичності T>Tmax, визначення залишкової періодичності Tr шляхом вирахування цілочислового значення з Т так, щоб залишкова періодичність Tr лежала в інтервалі [Tmax-1, Tmax]. Тоді довідкову таблицю для визначення коефіцієнта прогнозування можна визначити як довідкову таблицю для залишкової періодичності Tr. Спосіб може включати, для параметра моделі, що служить ознакою періодичності T81/32, період Т можна розділити на цілочислову затримку Ti і на залишкову затримку Tr так, що T=Ti+Tr. Це розділення може бути таким, що залишкова затримка Tr буде лежати в межах інтервалу, для якого можна застосувати рівняння (36) і для якого доступні довідкові таблиці, наприклад, у межах інтервалу [1,5, 2,5] або [49/32, 81/32] для наведеного вище прикладу. Діючи таким чином, можна визначати коефіцієнти прогнозування з застосуванням довідкової таблиці для залишкової затримки Tr, і предиктор 103 підсмуг може діяти на буфері 104 підсмуг, який був затриманий на величину цілочислової затримки Ti. Наприклад, якщо період T=3,7, то цілочислова затримка може становити Ti=2, і за нею йде залишкова затримка Tr=1,7. Предиктор може застосовуватися на основі коефіцієнтів для Tr=1,7 на буфері сигналів, (додатково) затриманому на Ti=2. Цей підхід розділення заснований на розумному припущенні про те, що екстрактор апроксимує затримку за допомогою Т у інтервалі [1,5, 2,5] або [49/32, 81/32]. Перевага процедури розділення в порівнянні з застосуванням рівняння (36) полягає в тому, що коефіцієнти прогнозування можна визначати у обчислювально ефективних операціях на довідкових таблицях. Як було описано вище, для коротких періодів (T
ДивитисяДодаткова інформація
Назва патенту англійськоюModel based prediction in a critically sampled filterbank
Автори англійськоюVillemoes, Lars
Назва патенту російськоюПрогнозирование на основе модели в наборе фильтров с критической дискретизацией
Автори російськоюВиллемоес Ларс
МПК / Мітки
МПК: G10L 19/093
Мітки: прогнозування, основі, критичною, дискретизацією, моделі, фільтрів, набори
Код посилання
<a href="https://ua.patents.su/35-111310-prognozuvannya-na-osnovi-modeli-v-nabori-filtriv-iz-kritichnoyu-diskretizaciehyu.html" target="_blank" rel="follow" title="База патентів України">Прогнозування на основі моделі в наборі фільтрів із критичною дискретизацією</a>
Попередній патент: Кільцевий волоконний фемтосекундний лазер
Наступний патент: Спосіб визначення ступеня впливу повітряного потоку на слизову оболонку носової порожнини
Випадковий патент: Струминний відцентровий насос