Гармонійне перетворення, вдосконалене перехресним добутком
Формула / Реферат
1. Система для генерування високочастотної складової звукового сигналу з низькочастотної складової звукового сигналу, що містить:
- блок (301) аналізуючих фільтрів, що створює набір сигналів аналізованих піддіапазонів низькочастотного складового звукового сигналу;
- блок (302) нелінійної обробки, призначений для генерування сигналу синтезованого піддіапазону із синтезованою частотою шляхом множення фаз першого й другого сигналів аналізованих піддіапазонів з набору сигналів аналізованих піддіапазонів і комбінування сигналів аналізованих піддіапазонів з помноженими фазами; і
- блок (303) синтезуючих фільтрів, призначений для генерування високочастотної складової звукового сигналу із сигналу синтезованого піддіапазону,
де
- блок (302) нелінійної обробки містить блок (800-n) перетворення першого й другого порядку з багатьма входами й одним виходом, що генерує сигнал (803) синтезованого піддіапазону з першого (801) і другого (802) сигналів аналізованих піддіапазонів, відповідно, з першою аналізованою частотою й другою аналізованою частотою
;
- перший сигнал (801) аналізованого піддіапазону є сигналом з фазою, помноженою на перший порядок перетворення ;
- другий сигнал (803) аналізованого піддіапазону є сигналом з фазою, помноженою на другий порядок перетворення ;
- ;
; і
- синтезована частота дорівнює .
2. Система за п. 1, яка також містить:
- блок (902) посилення, призначений для множення сигналу (803) синтезованого піддіапазону на коефіцієнт посилення.
3. Система за будь-яким з попередніх пунктів, яка також містить:
- набір блоків (800-n) з багатьма входами й одним виходом і/або набір блоків нелінійної обробки, які генерують набір парціальних сигналів (803) синтезованих піддіапазонів із синтезованою частотою; і
- блок (702) підсумовування піддіапазонів, призначений для комбінування набору парціальних сигналів синтезованих піддіапазонів.
4. Система за будь-яким з пп. 1, 2, яка відрізняється тим, що блок (302) нелінійної обробки також містить:
- блок (401) прямої обробки, призначений для генерування додаткового сигналу синтезованого піддіапазону із третього сигналу аналізованого піддіапазону з набору сигналів аналізованих піддіапазонів; і
- блок підсумовування піддіапазонів, призначений для комбінування сигналів синтезованих піддіапазонів із синтезованою частотою.
5. Система за п. 4, яка відрізняється тим, що
- блок підсумовування піддіапазонів ігнорує сигнали синтезованих піддіапазонів, що генеруються у блоках (800-n) з багатьма входами й одним виходом, якщо мінімум абсолютного значення першого (801) і другого (802) сигналів аналізованих піддіапазонів менше заздалегідь заданої частки абсолютного значення сигналу.
6. Система за п. 4, яка відрізняється тим, що блок (401) прямої обробки містить:
- блок (401-n) третього порядку перетворення з одним входом і одним виходом, що генерує сигнал синтезованого піддіапазону із третього сигналу аналізованого піддіапазону, що проявляє третю аналізовану частоту, де
- третій сигнал аналізованого піддіапазону є сигналом з фазою, модифікованою за допомогою третього порядку перетворення ;
- Т' більше одиниці; і
- синтезована частота відповідає третій аналізованій частоті, помноженій на третій порядок перетворення.
7. Система за п. 6, яка відрізняється тим, що
- сигнал містить основну частоту; і
- блок (301) аналізуючих фільтрів проявляє рознос частот, що пов'язаний з основною частотою сигналу.
8. Система за п. 6, яка відрізняється тим, що
- блок (301) аналізуючих фільтрів містить аналізованих піддіапазонів із практично постійною відстанню
між піддіапазонами;
- аналізований піддіапазон пов'язаний з індексом n аналізованого піддіапазона, де ;
- блок (303) синтезуючих фільтрів містить синтезований піддіапазон;
- синтезований піддіапазон пов'язаний з індексом n синтезованого піддіапазону; і
- кожний синтезований піддіапазон і аналізований піддіапазон з індексом n містять діапазони частот, які співвідносяться один з одним за допомогою коефіцієнта .
9. Система за п. 8, яка відрізняється тим, що
- сигнал (803) синтезованого піддіапазону пов'язаний із синтезованим піддіапазоном за допомогою індексу ;
- перший сигнал (801) аналізованого піддіапазону пов'язаний з аналізованим піддіапазоном за допомогою індексу ,
- другий сигнал (802) аналізованого піддіапазону пов'язаний з аналізованим піддіапазоном за допомогою індексу , і
- система додатково містить блок вибору індексів, призначений для вибору індексів p1 і р2.
10. Система за п. 9, яка відрізняється тим, що
- блок вибору індексів придатний для вибору зміщень індексів р1 і р2 з обмеженого переліку пар (p1, р2), що зберігається в блоці зберігання індексів.
11. Система за п. 10, яка відрізняється тим, що
- блок вибору індексів придатний для вибору пари (р1, р2) так, щоб мінімальне значення набору, що включає абсолютне значення сигналу першого аналізованого піддіапазону й абсолютне значення сигналу другого аналізованого піддіапазону, було максимізоване.
12. Система за п. 9, яка відрізняється тим, що блок вибору індексів придатний для визначення обмеженого переліку пар (p1, р2) так, щоб
- зміщення індексу ;
- зміщення індексу ; і
- I - позитивне ціле число.
13. Система за п. 12, яка відрізняється тим, що
- блок вибору індексів придатний для вибору параметрів I і r так, щоб мінімальне значення набору, що включає абсолютне значення сигналу першого аналізованого піддіапазону й абсолютне значення сигналу другого аналізованого піддіапазону, було максимізоване.
14. Система за п. 9, яка відрізняється тим, що блок вибору індексів придатний для вибору зміщень індексів p1 і р2 на основі характеристик сигналу.
15. Система за п. 14, яка відрізняється тим, що
- сигнал містить основну частоту ;
- блок вибору індексів придатний для вибору зміщень індексів p1 і р2 так, щоб
- сума зміщень індексів приблизно дорівнювала частці
; і
- частка була кратною
.
16. Система за п. 14, яка відрізняється тим, що
- сигнал містить основну частоту ;
- блок вибору індексів придатний для вибору зміщень індексів р1 і р2 так, щоб
- сума зміщень індексів приблизно дорівнювала частці
; і
- частка була рівною
.
17. Система за п. 14, що також містить:
- вікно (2001) аналізу, що виділяє заздалегідь визначений тимчасовий інтервал низькочастотної складової у заздалегідь визначений момент часу ;
- вікно (2001) синтезу, що виділяє заздалегідь визначений тимчасовий інтервал високочастотної складової у заздалегідь визначений момент часу .
18. Система за п. 17, яка відрізняється тим, що
- вікно (2201) синтезу являє собою масштабовану за часом версію вікна (2001) аналізу.
19. Система декодування сигналу, що містить:
- блок (102) перетворення за п. 1, призначений для генерування високочастотної складової сигналу з низькочастотної складової сигналу.
20. Система за п. 19, яка відрізняється тим, що сигнал є мовним і/або звуковим сигналом.
21. Система за будь-яким з пп. 19-20, яка відрізняється тим, що також містить:
- базовий декодер (101), призначений для декодування низькочастотної складової сигналу.
22. Система за п. 21, яка відрізняється тим, що також містить:
- підвищувальний дискретизатор (104), призначений для виконання підвищувальної дискретизації низькочастотної складової, що дає на виході низькочастотну складову з підвищеною дискретизацією;
- регулятор (103) обвідної, призначений для надання форми високочастотної складової; і
- блок підсумовування складових, призначений для визначення декодованого сигналу як суми низькочастотної складової з підвищеною дискретизацією й скоректованою високочастотною складовою.
23. Система за п. 22, яка відрізняється тим, що також містить:
- блок прийому даних для вибору піддіапазонів, призначений для прийому інформації, що дозволяє зробити вибір першого (801) і другого (802) сигналів аналізованих піддіапазонів, з яких повинен генеруватися сигнал (803) синтезованого піддіапазону.
24. Система за п. 23, яка відрізняється тим, що
- інформація пов'язана з основною частотою сигналу.
25. Система за п. 23, яка відрізняється тим, що
- інформація включає перелік пар перших (801) і других (802) сигналів аналізованих піддіапазонів.
26. Система за п. 22, яка відрізняється тим, що також містить:
- блок прийому даних про обвідну, призначений для прийому інформації, що стосується до обвідної високочастотної складової сигналу.
27. Система за п. 21, яка відрізняється тим, що також містить:
- блок введення, призначений для прийому сигналу, що включає низькочастотну складову; і
- блок виводу, призначений для надання декодованого сигналу, що включає низькочастотну та генеровану високочастотну складові.
28. Спосіб виконання високочастотної реконструкції високочастотної складової з низькочастотної складової звукового сигналу, що включає:
- створення (301) першого сигналу піддіапазону низькочастотної складової з першою частотою й другого сигналу піддіапазону низькочастотної складової із другою частотою
;
- множення фази першого сигналу піддіапазону на перший коефіцієнт перетворення для одержання першого перетвореного сигналу піддіапазону;
- множення фази другого сигналу піддіапазону на другий коефіцієнт перетворення для одержання другого перетвореного сигналу піддіапазону; де
;
; і
- комбінування (303) першого і другого перетворених сигналів піддіапазонів для одержання високочастотної складової з високою частотою .
29. Спосіб за п. 28, який відрізняється тим, що етап створення включає:
- фільтрацію низькочастотної складової за допомогою блока (301) аналізуючих фільтрів для генерування першого й другого сигналів піддіапазонів.
30. Спосіб за будь-яким з пп. 28, 29, який відрізняється тим, що етап комбінування включає:
- множення першого і другого перетворених сигналів піддіапазонів для одержання сигналу високого піддіапазону; і
- уведення сигналу високого піддіапазону в блок синтезуючих фільтрів для генерування високочастотної складової.
31. Спосіб за п. 30, який відрізняється тим, що також включає:
- декодування кодованого звукового сигналу для одержання низькочастотної складової звукового сигналу, де кодований сигнал виходить із оригінального звукового сигналу й представляє тільки частину частотних піддіапазонів оригінального сигналу нижче частоти (1005) переходу.
32. Додатковий зовнішній пристрій для декодування прийнятого мультимедійного сигналу, що включає звуковий сигнал, причому додатковий зовнішній пристрій містить:
- блок (102) перетворення за будь-яким з пп. 1-27, призначений для генерування високочастотної складової сигналу з низькочастотної складової звукового сигналу.
Текст
Реферат: Цей винахід належить до систем звукового кодування, у яких використовують спосіб гармонійного перетворення для високочастотної реконструкції (HFR). Описана система і спосіб генерування високочастотної складової сигналу з низькочастотної складової сигналу. Система включає блок аналізуючих фільтрів, утворюючий набір сигналів аналізованих піддіапазонів низькочастотної складової сигналу. Вона також включає блок нелінійної обробки, призначений для генерування сигналу піддіапазону, що синтезується, з частотою, що синтезується, шляхом модифікації фази першого і другого сигналів аналізованих піддіапазонів з набору сигналів аналізованих піддіапазонів і комбінування сигналів аналізованих піддіапазонів з модифікованою фазою. Нарешті, вона включає блок синтезуючих фільтрів, призначений для генерування високочастотної складової сигналу з сигналу піддіапазону, що синтезується. UA 99878 C2 (12) UA 99878 C2 UA 99878 C2 5 10 15 20 25 30 35 40 45 50 55 Сфера технічного застосування Цей винахід відноситься до систем звукового кодування, що використовують спосіб гармонійного перетворення для високочастотної реконструкції (HFR). Передумови винаходу Технології високочастотної реконструкції, такі як технологія реплікації спектральних смуг (SBR), дозволяють значно поліпшити ефективність кодування традиційних кодеків сприйманих цифрових аудіосигналів. У поєднанні з перспективним звуковим кодуванням MPEG - 4 (ААС) вона утворює надзвичайно ефективний аудіокодек, який вже використовується в системах XM Satellite Radio і Digital Radio Mondiale. Комбінація ААС і SBR називається aacPlus. Вона є частиною стандарту MPEG - 4, де іменується High Efficiency AAC Profile. Загалом, технологія HFR може поєднуватися з будь-яким кодеком сприйманих цифрових звукових сигналів в порядку сумісності зверху вниз і від низу до верху, що, таким чином, надає можливість здійснення модернізації вже встановлених систем мовлення, таких як система MPEG Layer - 2, використовувана в системі Eureka DAB. Способи HFR-перетворення також можуть об'єднуватися з вокодерами, допускаючи широкосмугові мовні сигнали при наднизьких швидкостях цифрового потоку. Засадничою ідеєю, що лежить в основі HRF, є спостереження, що між характеристиками високочастотного діапазону сигналу і характеристиками низькочастотного діапазону того ж сигналу, як правило, існує сильна кореляція. Таким чином, хороше наближення до представлення високочастотного діапазону оригінального вхідного сигналу може досягатися шляхом перетворення сигналу з низькочастотного діапазону у високочастотний діапазон. Концепція перетворення була встановлена в документі WO 98/57436 як спосіб відтворення високочастотного діапазону звукового сигналу з діапазону з меншою частотою. З використанням цієї концепції можна отримати значну економію швидкості бітового потоку при кодуванні звукових і/або мовних сигналів. У нижченаведеному описі відсилання робитиметься до кодування звукових сигналів, проте слід враховувати, що описані способи і системи рівнозначно застосовні для кодування мовних сигналів і уніфікованого кодування звукових і мовних сигналів (USAC). У системі кодування звукових сигналів на основі HFR сигнал низькочастотного діапазону передається у базовий кодувальник форми сигналу, і більш високі частоти регенеруються на стороні декодера з використанням перетворення сигналу низькочастотного діапазону і додаткової інформації, яка, як правило, кодується з надзвичайно низькими швидкостями бітового потоку і описує форму цільового спектра. Для низьких швидкостей бітового потоку, де смуга пропускання базового кодованого сигналу є вузькою, зростаючу важливість придбаває відтворення високого діапазону, тобто високочастотного діапазону звукового сигналу, з приємними для сприйняття характеристиками. Нижче згадується два варіанти способів реконструкції гармонійних частот, де перший іменується гармонійним перетворенням, а другою ― модуляцією сигналу з однією бічною смугою. Принцип гармонійного перетворення, визначений в документі WO 98/57436, полягає в тому, що синусоїда з частотою перетворюється в синусоїду з частотою Т, де T > 1 ― ціле число, що визначає порядок перетворення. Привабливою особливістю гармонійного перетворення є те, що воно розтягує початковий частотний діапазон в цільовий частотний діапазон з кратністю, рівною порядку перетворення, тобто з кратністю, рівною Т. Гармонійне перетворення добре виконується для складного музичного матеріалу. Крім того, гармонійне перетворення проявляє низькі частоти переходу, тобто великий високочастотний діапазон вище за частоту переходу може генеруватися з відносно невеликого низькочастотного діапазону нижче частоти переходу. На відміну від гармонійного перетворення, HFR на основі модуляції сигналу з однією бічною смугою (SSB) перетворює синусоїду з частотою в синусоїду з частотою +, де ― фіксоване зміщення частоти. Спостерігалося, що для заданого базового сигналу з низьким діапазоном частот в результаті SSB-перетворення може виникати дисонуючий затухаючий артефакт. Також слід враховувати, що для низької частоти переходу, тобто для малого початкового діапазону частот, гармонійне перетворення для заповнення необхідного цільового діапазону частот вимагає меншої кількості фрагментів, ніж перетворення на основі SSB. Наприклад, якщо вимагається заповнити високочастотний діапазон (, 4], то використовуване гармонійне перетворення з T = 4 може заповнити цей частотний діапазон з діапазону частот 1 , 4 . З іншого боку, перетворення на основі SSB з використанням того ж низькочастотного 1 UA 99878 C2 3 4 , 5 10 15 20 25 30 35 40 45 50 55 діапазону повинне використати зміщення частоти і для заповнення високочастотного діапазону (, 4] потрібне чотирикратне повторення процесу. З іншого боку, як нещодавно вказано в документі WO 02/052545 A1, гармонійне перетворення має недоліки для сигналів з вираженою періодичною структурою. Такі сигнали є суперпозиціями гармонійно пов'язаних синусоїд з частотами , 2, 3,.., де ― основна частота. При гармонійному перетворенні порядку Т вихідні синусоїди мають частоти Т, 2Т, 3Т,.., що у разі T > 1 є лише строгими підмножинами необхідного повного гармонійного ряду. У вираженні результуючої якості звуку, як правило, сприйматиметься «фантомний» основний тон, що відповідає перетвореній основній частоті Т. Часто гармонійне перетворення приводить в «металевому» характеру звучання кодованого і декодованого звукових сигналів. Цю ситуацію можна в деякій мірі пом'якшити шляхом додавання до HFR декількох порядків перетворення T=2,3,…,Tmax, але цей спосіб є складним в обчислювальному відношенні, якщо необхідно уникнути більшості провалів в спектрі. Альтернативне рішення, що дозволяє уникнути появи «фантомних» основних тонів при використанні гармонійного перетворення представлено в документі WO 02/052545 A1. Рішення полягає у використанні двох типів перетворення, тобто традиційного гармонійного перетворення і спеціального «імпульсного перетворення». Описаний спосіб пропонує перемикання на спеціальне «імпульсне перетворення» для тих частин звукового сигналу, які, як виявляється, є періодичними і мають характер послідовності імпульсів. Трудність, пов'язана з цим підходом, полягає в тому, що застосування «імпульсного перетворення» до складного музичного матеріалу часто знижує його якість порівняно з гармонійним перетворенням на основі блоку фільтрів високого розділення. Тому механізми виявлення повинні регулюватися досить консервативно так, щоб імпульсне перетворення не використовувалося для складного матеріалу. Мова і музичні інструменти з одним основним тоном неминуче в деяких випадках класифікуватимуться як комплексні сигнали, запускаючи цим гармонійне перетворення і, таким чином, призводячи до втрати гармонік. Крім того, якщо перемикання відбувається в середині сигналу з одним основним тоном, або сигналу з основним тоном, домінуючим на слабкішому складному фоні, саме перемикання між двома способами транспонування, що мають властивості заповнення спектра, що відрізняються, генеруватиме чутні артефакти. Короткий опис винаходу Цей винахід передбачає спосіб і систему для заповнення гармонійного ряду, що виникає в результаті гармонійного перетворення періодичного сигналу. Перетворення в частотній області включає етап відображення нелінійно модифікованих сигналів піддіапазонів з блоку аналізуючих фільтрів у вибрані піддіапазони блоку синтезуючих фільтрів. Нелінійна модифікація включає модифікацію фаз, або обертання фаз, яка в області блоку комплексних фільтрів може бути отримана за степеневим законом з подальшою корекцією амплітуди. Тоді як на поточному рівні техніки перетворення окремо модифікує один аналізований піддіапазон за раз, цей винахід пропонує додавати нелінійну комбінацію, щонайменше, двох різних аналізованих піддіапазонів до кожного піддіапазону, що синтезується. Відстань між аналізованими піддіапазонуми, які піддаються комбінуванню, може бути віднесена до основної частоти домінуючої складової сигналу, який піддається перетворенню. У найбільш загальній формі математичний опис винаходу полягає в тому, що набір частотних складових 1,2,…,k використовується для створення нової частотної складової : =T1 1+ T22+…+ TKK, де коефіцієнти T1,T2…,TK— це цілочислові порядки перетворення, сума яких є загальним порядком перетворення T= T1+T2+…+TK. Цей ефект виходить шляхом модифікації фаз K відповідним чином вибраних сигналів піддіапазонів за допомогою множників T 1,T2…,TK і рекомбінації результату множення в сигнал з фазою, рівній сумі модифікованих фаз. Важливо відмітити, що усі вказані операції з фазами цілком визначені і точно виражені, оскільки індивідуальні порядки перетворення є цілими числами, і деякі з цих цілих чисел навіть можуть бути від’ємними до тих пір, поки загальний порядок перетворення задовольняє нерівності 1. Способи згідно з поточним рівнем техніки відповідають випадку K=1, а цей винахід пропонує використання K 1. У тексті опису в основному розглядається випадок K=2, 2, оскільки цього вистачає для вирішення більшості наявних конкретних проблем. Проте слід зазначити, що випадки K > 2 розглядаються як ті, що так само розкриваються і охоплюються цим документом. Винахід використовує інформацію від більшої кількості аналітичних каналів низькочастотного діапазону, тобто від більшої кількості сигналів аналізованих піддіапазонів, для відображення нелінійно модифікованих сигналів піддіапазонів з блоку аналізуючих фільтрів у 2 UA 99878 C2 5 10 15 20 25 30 35 40 45 50 55 60 вибрані піддіапазони блоку синтезуючих фільтрів. Перетворення не лише окремо модифікує один піддіапазон за раз, але і додає до кожного піддіапазону, що синтезується, нелінійну комбінацію, щонайменше, двох різних аналізованих піддіапазонів. Як уже згадувалося, гармонійне перетворення порядку Т конструюється для того, щоб відображати синусоїду з частотою в синусоїду з частотою Т, де Т > 1. Згідно з винаходом, т.з. удосконалення перехресного добутку з параметром основного тону і індексом 0 < r 1 і 1 r < Т. В цих випадках блок з множиною входів і одним виходом може давати на виході сигнали піддіапазону, що синтезується, з частотою (T-r) + r(+), що синтезується. Згідно ще однієї особливості винаходу, система включає набір блоків з множиною входів і одним виходом і/або набір блоків нелінійної обробки, які генерують набір парціальних сигналів піддіапазонів, що синтезуються, які мають частоту, що синтезується. Іншими словами, може генеруватися набір парціальних сигналів піддіапазонів, що синтезуються, які охоплюють той же самий діапазон частоти, що синтезується. У цих випадках передбачається блок підсумовування піддіапазонів, призначений для комбінування набору парціальних сигналів піддіапазонів, що синтезуються. Тоді об'єднані парціальні сигнали піддіапазонів, що синтезуються, представляють сигнал піддіапазону, що синтезується. Операція комбінування може включати підсумовування набору парціальних сигналів піддіапазонів, що синтезуються. Також вона може включати визначення середнього сигналу піддіапазону, що синтезується, з набору парціальних сигналів піддіапазонів, що синтезуються, де парціальні сигнали піддіапазонів, що синтезуються, можуть зважуватися відповідно до їх значущості для сигналу піддіапазону, що синтезується. Операція комбінування також може включати вибір з набору одного або деяких сигналів піддіапазонів, що мають, наприклад, амплітуду, яка перевищує заздалегідь задане порогове значення. Слід зазначити, що може виявитися корисним, щоб сигнал піддіапазону, що синтезується, множився на коефіцієнт посилення. Коефіцієнти посилення, особливо в тих випадках, коли є присутнім набір парціальних сигналів піддіапазонів, що синтезуються, можуть вносити вклад в нормування сигналів піддіапазонів, що синтезуються. Згідно ще однієї особливості винаходу, блок нелінійної обробки також включає блок прямої обробки, призначений для генерування додаткового сигналу піддіапазону, що синтезується, з 4 UA 99878 C2 5 10 15 20 25 30 35 40 45 50 55 60 третього сигналу з набору сигналів аналізованих піддіапазонів. Вказаний блок прямої обробки сигналів може реалізовувати способи прямого перетворення, описані, наприклад, в документі WO 98/57436. Якщо система включає додатковий блок прямої обробки, тоді може з'явитися необхідність у блоці підсумовування піддіапазонів, призначеному для комбінування відповідних сигналів піддіапазонів, що синтезуються. Відповідні сигнали піддіапазонів, що синтезуються, як правило, є сигналами піддіапазонів, що охоплюють один і той же частотний діапазон і/або проявляють одну і ту ж частоту, що синтезується. Блок підсумовування піддіапазонів може виконувати комбінування відповідно до описаних вище особливостей. Також він може ігнорувати певні сигнали піддіапазонів, що синтезуються, особливо сигнали, генеровані блоками з множиною входів і одним виходом в тих випадках, коли мінімальне значення амплітуди одного або декількох сигналів аналізованих піддіапазонів, наприклад, від перехресних членів вносять вклад в сигнал піддіапазону, що синтезується, менше наперед заданої долі амплітуди сигналу. Сигнал може бути низькочастотною складовою сигналу або окремим сигналом аналізованого піддіапазону. Цей сигнал також може бути окремим сигналом піддіапазону, що синтезується. Іншими словами, якщо енергія або амплітуда сигналів аналізованих піддіапазонів, використовуваних для генерування сигналу піддіапазону, що синтезується, занадто мала, тоді цей сигнал діапазону, що синтезується, може не використовуватися для генерування високочастотної складової сигналу. Енергія, або амплітуда, може визначатися для кожної дискретної складової або для набору дискретних складових сигналів аналізованих піддіапазонів, наприклад, шляхом визначення середнього за часом або середнього ковзного вікна по ряду суміжних дискретних значень. Блок прямої обробки може включати блок третього порядку перетворення T' з одним входом і одним виходом, генеруючий сигнал піддіапазону, що синтезується, з третього сигналу аналізованого піддіапазону, що проявляє третю аналізовану частоту, де третій сигнал аналізованого піддіапазону має модифіковану фазу, або його фаза помножена на третій порядок перетворення T', і де T' більше одиниці. Тоді частота, що синтезується, відповідає третій аналізованій частоті, помноженій на третій порядок перетворення. Слід зазначити, що цей третій порядок перетворення T', переважно, дорівнює системному порядку перетворення, представленому нижче. Згідно ще однієї особливості винаходу, блок аналізуючих фільтрів містить N піддіапазонів з, значною мірою, постійною відстанню між піддіапазонуми . Як вказувалося вище, відстань між піддіапазонуми може бути пов'язана з основною частотою сигналу. Аналізований піддіапазон пов'язаний з індексом аналізованого піддіапазону n, де n(1,…,N). Іншими словами, аналізовані піддіапазони блоку аналізуючих фільтрів можуть бути ідентифіковані по індексу піддіапазону n. Схожим чином, сигнали аналізованих піддіапазонів, включаючи частоти з частотного діапазону відповідного аналізованого піддіапазону, можуть бути ідентифіковані по індексу піддіапазону n. Блок синтезуючих фільтрів на стороні синтезу містить піддіапазон, що синтезується, який також пов'язаний з індексом піддіапазону n, що синтезується. Індекс піддіапазону, що синтезується, також ідентифікує сигнал піддіапазону, що синтезується, який включає частоти з діапазону частот, що синтезується, піддіапазону, що синтезується, з індексом піддіапазону n. Якщо система має системний порядок перетворення, що також називається загальним порядком перетворення Т, то піддіапазони, що синтезуються, як правило, мають, значною мірою, постійну відстань між піддіапазонуми T, тобто відстань між піддіапазонуми для піддіапазонів, що синтезуються, в Т разів більше відстані між піддіапазонуми для аналізованих піддіапазонів. У цих випадках піддіапазон, що синтезується, і аналізований піддіапазон з індексом n містять частотні інтервали, які співвідносяться один з одним за допомогою множника або системного порядку перетворення Т. Наприклад, якщо частотний діапазон для аналізованого піддіапазону з індексом n дорівнює [(n-1), n], то частотний діапазон для піддіапазону, що синтезується, з індексом n дорівнює [T(n-1),Tn]. Якщо сигнал піддіапазону, що синтезується, пов'язаний з піддіапазоном, що синтезується, з індексом n, то ще одна особливість винаходу полягає в тому, що цей сигнал піддіапазону, що синтезується, з індексом n генерується у блоці з множиною входів і одним виходом з першого і другого сигналів аналізованих піддіапазонів. Перший сигнал аналізованого піддіапазону пов'язаний з аналізованим піддіапазоном з індексом n-p1, другий сигнал аналізованого піддіапазону пов'язаний з аналізованим піддіапазоном з індексом n+p 2. Нижче описані декілька способів вибору пари зміщень індексів (р 1, р2). Вибір може виконуватися т.з. блоком вибору індексів. Як правило, оптимальна пара індексів вибирається з метою генерування сигналу піддіапазону, що синтезується, із заздалегідь визначеною частотою, що синтезується. У першому способі зміщення індексів р1 і р2 вибираються з обмеженого 5 UA 99878 C2 5 10 15 20 25 30 35 40 45 50 55 60 переліку пар (р1, р2), що зберігається у блоці зберігання індексів. Пара (р1, р2) може бути вибрана з цього обмеженого переліку пар зміщень індексів так, щоб максимізувати мінімальне значення з набору, що включає амплітуду першого аналізованого піддіапазону і амплітуду другого аналізованого піддіапазону. Іншими словами, для кожної можливої пари зміщень індексів р1 і р2 може бути визначена амплітуда відповідних сигналів аналізованих піддіапазонів. У разі комплексних сигналів аналізованих піддіапазонів амплітуда відповідає абсолютному значенню. Амплітуда може бути визначена для кожного дискретного значення або для набору дискретних значень сигналу аналізованого піддіапазону, наприклад, шляхом визначення середнього за часом або середнього ковзного вікна по ряду суміжних дискретних значень. На виході виходить перша і друга амплітуди, відповідно, для першого і другого сигналів аналізованих піддіапазонів. Розглядаються мінімальні значення першою і другою амплітуд, і пара зміщень індексів (р1, р2) вибирається для того значення, де мінімальне значення амплітуди є найбільшим. У другому способі зміщення індексів р1 і р2 вибираються з обмеженого переліку пар (р 1, р2), де обмежений перелік визначається за формулами p1=rI і p2=(T-r)I. У цих формулах I ― додатне ціле число, що набуває значень від 1 до 10. Цей спосіб особливо корисний в тих ситуаціях, коли перший порядок перетворення, використовуваний для перетворення першого аналізованого піддіапазону (n-p1), дорівнює (T-r), а другий порядок перетворення, використовуваний для перетворення другого аналізованого піддіапазону (n+p 2), дорівнює r. Припускаючи, що системний порядок перетворення є фіксованим, параметри I і r можуть вибиратися так, щоб максимізувати мінімальне значення набору, що включає амплітуду сигналу першого аналізованого піддіапазону і амплітуду сигналу другого аналізованого піддіапазону. Іншими словами, параметри I і r можуть вибиратися за допомогою вищеописаного підходу (max - min)-оптимізації. У наступному способі вибір першого і другого сигналів аналізованих піддіапазонів може ґрунтуватися на характеристиках основного сигналу. Особливо у тому випадку, якщо сигнал включає основну частоту , тобто якщо сигнал є періодичним і має характер послідовності імпульсів, може виявитися корисним вибирати зміщення індексів р 1 і р2, зважаючи на характеристики вказаного сигналу. Основна частота може визначатися з низькочастотної складової сигналу або з оригінального сигналу, що включає обидві, низькочастотну і високочастотну, складові. У першому випадку основна частота може визначатися в декодері сигналу з використанням високочастотної реконструкції, тоді як в другому випадку основна частота , як правило, може визначатися в кодувальнику сигналу і потім передаватися в декодер сигналу. Якщо використовується блок аналізуючих фільтрів з відстанню між піддіапазонуми , і якщо першим порядком перетворення, що використовується для перетворення першого аналізованого піддіапазону (n-p1), є (T-r), а другим порядком перетворення, що використовується для перетворення другого аналізованого піддіапазону (n+p2), є r, то р1 і р2 можуть бути вибрані так, щоб їх сума p1 + p2 приблизно дорівнювала частці /, а їх частка p1/p2 приблизно дорівнювала r/(T-r). У окремому випадку p1 і p2 вибираються, так щоб частка p1/p2 була рівна r/(T-r). Згідно ще однієї особливості винаходу, система для генерування високочастотної складової сигналу також включає вікно аналізу, яке виділяє заздалегідь визначений часовий інтервал низькочастотної складової біля заздалегідь визначеного моменту часу k. Система також може включати вікно синтезу, яке виділяє заздалегідь визначений інтервал часу високочастотної складової біля заздалегідь визначеного моменту часу k. Ці вікна особливо корисні для сигналів з частотними компонентами, які змінюються в часі. Вони дозволяють аналізувати миттєвий частотний склад сигналу. У поєднанні з блоками фільтрів, типовий приклад такого частотного аналізу з часовою залежністю представляє короткочасне перетворення Фур'є (STFT). Слід зазначити, що часто вікно аналізу є версією вікна синтезу з розкидом за часом. Для системи з системним порядком перетворення Т вікно аналізу в часовій області може бути версією вікна синтезу в часовій області з розкидом за часом з коефіцієнтом розширення Т. Згідно з ще одним варіантом здійснення винаходу описується система для декодування сигналу. Система приймає кодовану версію низькочастотної складової сигналу і включає блок перетворення, що відповідає системі, яка описана вище, і призначений для генерування високочастотної складової сигналу з низькочастотної складової сигналу. Як правило, подібні системи декодування також включають базовий декодер, призначений для декодування низькочастотної складової сигналу. Система декодування також може включати підвищувальний дискретизатор, призначений для виконання підвищувальної дискретизації низькочастотної складової, щоб отримати на виході низькочастотну складову з підвищеною дискретизацією. Це може знадобитися у разі, коли низькочастотна складова сигналу була 6 UA 99878 C2 5 10 15 20 25 30 35 40 45 50 55 60 піддана знижувальній дискретизації в кодувальнику, і використовує той факт, що низькочастотна складова, порівняно з оригінальним сигналом, охоплює тільки діапазон знижених частот. Крім того, система декодування може включати блок введення, який призначений для прийому кодованого сигналу, що включає низькочастотну складову, і блок виводу, призначений для створення декодованого сигналу, що включає низькочастотну і генеровану високочастотну складові. Система декодування також може включати регулятор обвідної, призначений для надання форми високочастотній складовій. Оскільки високі частоти сигналу можуть бути регенеровані з низькочастотного діапазону сигналу з використанням систем і способів високочастотної реконструкції, описаних в цьому документі, може виявитися корисним отримання з оригінального сигналу інформації, що відноситься до обвідної спектра його високочастотної складової. Інформація про обвідну може потім передаватися в декодер з метою генерування високочастотної складової, що є хорошим наближенням обвідної спектра високочастотної складової оригінального сигналу. Ця операція, як правило, виконується в регуляторі обвідної системи декодування. Для прийому інформації, що відноситься до обвідної високочастотної складової сигналу, система декодування може включати блок прийому даних про обвідну. Регенерована високочастотна складова і декодована і, можливо, піддана підвищувальній дискретизації низькочастотна складова можуть потім підсумовуватися у блоці підсумовування складових, що визначає декодований сигнал. Як описано вище, система для генерування високочастотної складової може використати інформацію, що відноситься до сигналів аналізованих піддіапазонів, які піддаються перетворенню і комбінуванню з метою генерування індивідуального сигналу піддіапазону, що синтезується. Для цього система декодування може додатково включати блок прийому даних про вибір піддіапазону, призначений для прийому інформації, яка дозволяє здійснювати вибір першого і другого сигналів аналізованих піддіапазонів, з яких генеруватиметься сигнал піддіапазону, що синтезується. Ця інформація може відноситися до певних характеристик кодованого сигналу, наприклад, інформація може бути пов'язана з основною частотою сигналу. Інформація також може бути безпосередньо пов'язаною з аналізованими піддіапазонуми, які треба вибрати. Наприклад, інформація може включати перелік можливих пар перших і других сигналів аналізованих піддіапазонів або перелік пар (p1, p2) можливих зміщень індексів. Згідно ще однієї особливості винаходу описується кодований сигнал. Кодований сигнал включає інформацію, що відноситься до низькочастотної складової кодованого сигналу, де низькочастотна складова включає набір сигналів аналізованих піддіапазонів. Крім того, кодований сигнал включає інформацію, що відноситься до тих двох сигналів аналізованих піддіапазонів, які мають бути вибрані для генерування високочастотної складової декодованого сигналу шляхом перетворення двох вибраних сигналів аналізованих піддіапазонів. Іншими словами, кодований сигнал включає, можливо, кодовану версію низькочастотної складової сигналу. Крім того, він надає інформацію, таку як основна частота сигналу або перелік можливих пар зміщень індексів (p1, p2), яка дозволяє декодеру генерувати високочастотну складову сигналу на основі способу гармонійного перетворення, вдосконаленого перехресним добутком, який описаний в цьому документі. Згідно ще однієї особливості винаходу описана система для кодування сигналу. Ця система кодування включає блок розділення, призначений для розділення сигналу на низькочастотну складову і високочастотну складову, і базовий кодувальник, призначений для кодування низькочастотної складової. Він також включає блок визначення частоти, призначений для визначення основної частоти сигналу, і кодувальник параметрів, призначений для кодування основної частоти , де основна частота використовується в декодері для регенерації високочастотної складової сигналу. Система також може включати блок визначення обвідної, призначений для визначення обвідної спектра високочастотної складової, і кодувальник обвідної, призначений для кодування обвідної спектра. Іншими словами, система кодування видаляє високочастотну складову оригінального сигналу і кодує низькочастотну складову за допомогою базового кодувальника, наприклад, кодувальника AAC або Dolby D. Крім того, система кодування аналізує високочастотну складову оригінального сигналу і визначає набір інформації, яка використовується в декодері для регенерації високочастотної складової декодованого сигналу. Набір інформації може включати основну частоту сигналу і/або обвідну спектра високочастотної складової. Система кодування також може включати блок аналізуючих фільтрів, який створює набір сигналів аналізованих піддіапазонів низькочастотної складової сигналу. Крім того, вона може включати блок визначення пари піддіапазонів, призначений для визначення першого і другого 7 UA 99878 C2 5 10 15 20 25 30 35 40 45 50 55 60 сигналів піддіапазонів для генерування високочастотної складової сигналу, і кодувальник індексів, призначений для кодування порядкових номерів, що представляють визначені перший і другий сигнали піддіапазонів. Іншими словами, система кодування може використати спосіб високочастотної реконструкції і систему, описані в цьому документі, для визначення аналізованих піддіапазонів, з яких можуть генеруватися високочастотні піддіапазони і, нарешті, високочастотна складова сигналу. Інформація про ці піддіапазони, наприклад обмежений перелік пар зміщень індексів, може потім кодуватися і передаватися в декодер. Як підкреслювалося вище, винахід також охоплює способи генерування високочастотної складової сигналу, а також способи декодування і кодування сигналів. Особливості, описані вище в контексті систем, так само застосовані до відповідних способів. Нижче описуються деякі особливості способів згідно з винаходом. Аналогічно ці особливості також застосовані до систем, описаних в цьому документі. Згідно ще однієї особливості даного винаходу описаний спосіб виконання високочастотної реконструкції високочастотної складової сигналу з низькочастотної складової сигналу. Цей спосіб включає етап створення першого сигналу піддіапазону низькочастотної складової з першого частотного діапазону і другого сигналу піддіапазону низькочастотної складової — з другого частотного діапазону. Іншими словами, два сигнали піддіапазонів виділяються з низькочастотної складової сигналу, перший сигнал піддіапазону охоплює перший частотний діапазон, а другий сигнал піддіапазону охоплює другий частотний діапазон. Переважно, частотні піддіапазони відрізняються. На наступному етапі сигнали першого і другого піддіапазонів перетворяться за допомогою, відповідно, першого і другого коефіцієнтів перетворення. Перетворення кожного з сигналів піддіапазонів може виконуватися відповідно до відомих способів перетворення сигналів. У разі комплексних сигналів піддіапазонів перетворення може виконуватися шляхом модифікації фази, або множення фази на відповідний коефіцієнт перетворення або порядок перетворення. На наступному етапі перетворені перший і другий сигнали піддіапазонів комбінуються, даючи на виході високочастотну складову, яка включає частоти з високочастотного діапазону. Перетворення може виконуватися так, щоб високочастотний діапазон відповідав сумі першого частотного діапазону, помноженого на перший коефіцієнт перетворення, і другого частотного діапазону, помноженого на другий коефіцієнт перетворення. Крім того, етап перетворення може включати етапи множення першого частотного діапазону першого сигналу піддіапазону на перший коефіцієнт перетворення і множення другого частотного діапазону другого сигналу піддіапазону на другий коефіцієнт перетворення. Для спрощення пояснення без обмеження об'єму винаходу винахід ілюструється перетворенням окремих частот. Проте, слід відмітити, що перетворення виконується не лише для окремих частот, але і для цілих частотних діапазонів, тобто для безлічі частот, що містяться в межах частотного діапазону. По суті, перетворення частот і перетворення діапазонів частот в цьому документі слід розуміти як рівнозначні. Проте, слід усвідомлювати те, що частотні дозволи для блоків аналізуючих і синтезуючих фільтрів є різними. У вищезгаданому способі етап створення може включати фільтрацію низькочастотної складової блоком аналізуючих фільтрів з метою генерування першого і другого сигналів піддіапазонів. З іншого боку, етап комбінування може включати перемножування першого і другого перетворених сигналів піддіапазонів з отриманням сигналу високого піддіапазону і введення сигналу високого піддіапазону у блок синтезуючих фільтрів з метою генерування високочастотної складової. Інші перетворення сигналу в частотне представлення і з частотного представлення також можливі і знаходяться в межах об'єму винаходу. Вказані перетворення сигналів включають перетворення Фур'є (FFT, DCT), вейвлетні перетворення, квадратурні дзеркальні фільтри (QMF) і так далі. Крім того, ці перетворення також включають віконні функції, призначені для виділення зменшеного часового інтервалу сигналу, призначеного для перетворення. Можливі віконні функції включають зважувальні функції Гауса, зважувальні косинусні функції, зважувальні функції Хеммінга, зважувальні функції Гана, прямокутні віконні функції, зважувальні функції Барлетта, зважувальні функції Блекмана та ін. В цьому документі термін «блок фільтрів» може включати будь-яке з вказаних перетворень, можливо, комбіноване з будь-якою з вказаних віконних функцій. Згідно іншої особливості винаходу описаний спосіб декодування кодованого сигналу. Кодований сигнал виходить з оригінального сигналу і представляє тільки частину частотних піддіапазонів оригінального сигналу, розташованих нижче частоти переходу. Спосіб описує етапи створення першого і другого піддіапазонів кодованого сигналу. Це може здійснюватися шляхом використання блоку аналізуючих фільтрів. Потім частотні піддіапазони перетворюються за допомогою, відповідно, першого коефіцієнта перетворення і другого коефіцієнта 8 UA 99878 C2 5 10 15 20 25 30 35 40 45 50 55 60 перетворення. Це може здійснюватися шляхом виконання модифікації фази, або множення фази сигналу в першому частотному піддіапазоні на перший коефіцієнт перетворення, і шляхом виконання модифікації фази, або множення фази, сигналу в другому частотному піддіапазоні на другий коефіцієнт перетворення. Зрештою, з першого і другого перетворених частотних піддіапазонів генерується високочастотний піддіапазон, який знаходиться вище за частоту переходу. Високочастотний піддіапазон може відповідати сумі першого частотного піддіапазону, помноженого на перший коефіцієнт перетворення, і другого частотного піддіапазону, помноженого на другий коефіцієнт перетворення. Згідно ще однієї особливості винаходу описаний спосіб кодування сигналу. Цей спосіб включає етапи фільтрації сигналу для виділення низької частоти сигналу і кодування низькочастотної складової сигналу. Крім того, створюється набір сигналів аналізованих піддіапазонів низькочастотної складової сигналу. Це може здійснюватися з використанням блоку аналізуючих фільтрів так, як описано в цьому документі. Потім визначаються перший і другий сигнали піддіапазонів, призначені для генерування високочастотної складової сигналу. Це може здійснюватися з використанням способів високочастотної реконструкції і систем, описаних в цьому документі. Зрештою, інформація, що представляє визначені перший і другий сигнали піддіапазонів, кодується. Вказаною інформацією можуть бути характеристики оригінального сигналу, наприклад основна частота сигналу, або інформація, що відноситься до вибраних аналізованих піддіапазонів, наприклад пари зміщень індексів (p 1, p2). Слід зазначити, що вищезгадані варіанти здійснення і особливості винаходу можуть довільно комбінуватися. Зокрема, слід зазначити, що особливості, описані для системи, так само застосовні і до відповідного способу, що охоплюється даним винаходом. Крім того, слід зазначити, що розкриття винаходу також охоплює і інші поєднання пунктів формули винаходу, а не тільки ті поєднання пунктів формули винаходи, які в прямій формі надані зворотними посиланнями в залежних пунктах формули винаходу, тобто пункти формули винаходу і їх технічні особливості можуть комбінуватися у будь-якому порядку і будь-якому поєднанні. Короткий опис графічного матеріалу Даний винахід далі буде описаний за допомогою ілюстративних прикладів, що не обмежують об'єм винаходу. Воно буде описано з відсиланням до супровідних ілюстрацій, на яких : Фіг. 1 ілюструє функціонування декодера звукових сигналів, вдосконаленого за допомогою HFR; Фіг. 2 ілюструє функціонування гармонійного перетворювача, що використовує декілька порядків; Фіг. 3 ілюструє функціонування гармонійного перетворювача в частотній області (FD); Фіг. 4 ілюструє функціонування використання обробки перехресних членів згідно з винаходом; Фіг. 5 ілюструє пряму обробку на поточному рівні техніки; Фіг. 6 ілюструє нелінійну обробку одиничного піддіапазону на поточному рівні техніки; Фіг. 7 ілюструє складові обробки перехресних членів згідно з винаходом; Фіг. 8 ілюструє функціонування блоку обробки перехресних членів; Фіг. 9 ілюструє нелінійну обробку згідно з винаходом, що міститься в кожній з систем MISO по Фіг. 8; Фіг. 10-18 ілюструють здійснення винаходу для гармонійного перетворення ілюстративних періодичних сигналів; Фіг. 19 ілюструє частотно-часове розділення короткочасного перетворення Фур'є (STFT); Фіг. 20 ілюструє ілюстративну часову прогресію віконної функції і її Фур'є-перетворення, використовувані на стороні синтезу; Фіг. 21 ілюструє STFT синусоїдального вхідного сигналу; Фіг. 22 ілюструє віконну функцію і її Фур'є-перетворення по Фіг. 20, використовувані на стороні аналізу; Фіг. 23 і 24 ілюструють визначення належних піддіапазонів блоку аналізуючих фільтрів, призначених для удосконалення піддіапазону діапазону синтезуючого фільтру за допомогою перехресних членів; Фіг. 25, 26 і 27 ілюструють експериментальні результати способу гармонійного перетворення прямих членів і перехресних членів; Фіг. 28 і 29 ілюструють варіанти здійснення, відповідно, кодувальника і декодера з використанням схем вдосконаленого гармонійного перетворення, описаних в цьому документі; Фіг. 30 ілюструє варіант здійснення блоку перетворення, показаного на Фіг. 28 і 29. Опис переважних варіантів здійснення винаходу 9 UA 99878 C2 5 10 15 20 25 30 35 40 45 50 55 60 Описувані нижче варіанти здійснення винаходу є лише ілюстраціями принципів даного винаходу відносно так званого гармонійного перетворення, вдосконаленого перехресним добутком. Слід розуміти, що модифікації і зміни описаних тут компонувань і деталей будуть зрозумілі фахівцям в цій області. Тому є намір обмежитися тільки об'ємом формули винаходу, що буде наведена далі, а не конкретними деталями, представленими тут з метою опису і роз'яснення варіантів здійснення винаходу. Фіг. 1 ілюструє функціонування декодера звукових сигналів, вдосконаленого HFR. Базовий декодер звукових сигналів 101 виводить звуковий сигнал з низькочастотною смугою пропускання, який подається в підвищувальний дискретизатор 104, який може бути потрібен для отримання вкладу в кінцевий вихідний звуковий сигнал з необхідною повною частотою дискретизації. Підвищувальна дискретизація потрібна для систем з двома частотами дискретизації, де базовий аудіокодек з обмеженим діапазоном функціонує на половині зовнішньої частоти дискретизації звукового сигналу, тоді як підсистема HFR обробляється на повній частоті дискретизації. Відповідно, в системі з однією частотою дискретизації підвищувальний дискретизатор 104 опускається. Вихідний сигнал з низькочастотною смугою пропускання з 101 також спрямовується до перетворювача, або блоку перетворення 102, який виводить перетворений сигнал, тобто сигнал, що включає необхідний високочастотний діапазон. Форма перетвореного сигналу може коригуватися за часом і частотою регулятором обвідної 103. Кінцевим вихідним звуковий сигналом є сума базового сигналу з низькочастотною смугою пропускання і перетвореного сигналу зі скоректованою обвідною. Фіг. 2 ілюструє функціонування гармонійного перетворювача 201, який відповідає перетворювачу 102 згідно з Фіг. 1, що включає декілька перетворювачів з різним порядком перетворення Т. Сигнал, який піддається перетворенню, проходить до блоку окремих перетворювачів 201-2, 201-3,.,201-Tmax, що мають порядки перетворення Т = 2, 3,…, T max відповідно. Як правило, порядок перетворення T max = 3 є достатнім для більшості додатків, пов'язаних з кодуванням звукових сигналів. Вклади від різних перетворювачів 201-2, 2013,...,201-Tmax підсумовуються в 202, даючи на виході комбінований вихідний сигнал перетворювача. У першому варіанті здійснення вказана операція підсумовування може включати складання окремих вкладів. У іншому варіанті здійснення вклади зважуються з різними вагами так, щоб зменшити вплив додавання декількох вкладів в певні частоти. Наприклад, вклади третього порядку можуть додаватися з меншим коефіцієнтом посилення, ніж вклади другого порядку. Нарешті, блок 202 підсумовування може додавати вклади селективно, залежно від вихідної частоти. Наприклад, перетворення першого порядку може використовуватися для першого, найнижчого цільового частотного діапазону, а перетворення третього порядку може використовуватися для другого, більш високого цільового частотного діапазону. Фіг. 3 ілюструє функціонування такого гармонійного перетворювача в частотній області (FD) як одного з індивідуальних блоків 201, тобто одного з перетворювачів 201-Т порядку перетворення Т. Блок 301 аналізуючих фільтрів виводить комплексні піддіапазони, які піддаються нелінійній обробці 302, яка модифікує фазу і/або амплітуду сигналу піддіапазону відповідно до вибраного порядку перетворення Т. Модифіковані піддіапазони подаються до блоку 303 синтезуючих фільтрів, який виводить перетворені сигнали в часовій області. У разі декількох паралельних перетворювачів з різними порядками перетворення, як показано на Фіг. 2, деякі операції блоку фільтрів можуть бути розділені між різними перетворювачами 201-2, 2013,...,201-Tmax. Розділення операцій блоку фільтрів може здійснюватися для аналізу або синтезу. У разі спільного синтезу 303, підсумовування 202 може виконуватися в області піддіапазону, тобто перед синтезом 303. Фіг. 4 ілюструє функціонування обробки перехресних членів 402 на додаток до прямої обробки 401. Обробка перехресних членів 402, і пряма обробка 401 виконуються паралельно у блоці нелінійної обробки 302 гармонійного перетворювача в частотній області згідно з Фіг. 3. Перетворені вихідні сигнали комбінуються, наприклад, складаються, забезпечуючи сукупний перетворений сигнал. Комбінування перетворених вихідних сигналів може полягати в суперпозиції перетворених вихідних сигналів. Факультативно селективне додавання перехресних членів може бути реалізоване при обчисленні коефіцієнта посилення. Фіг. 5 детальніше ілюструє функціонування блоку прямої обробки 401 згідно з Фіг. 4. у гармонійному перетворювачі в частотній області по Фіг. 3. Блоки (SISO) 401-1,..., 401-n,..., 401-N з одним входом і одним виходом відображають кожен аналізований піддіапазон з початкового діапазону в один піддіапазон, що синтезується, в цільовому діапазоні. Згідно Фіг. 5 аналізований піддіапазон з індексом n відображається блоком SISO 401 - n в піддіапазон, що синтезується, з тим же індексом n. Слід зазначити, що частотний діапазон піддіапазону з індексом n у блоці 10 UA 99878 C2 5 10 15 20 25 30 35 40 45 50 55 синтезуючих фільтрів може варіюватися залежно від точної версії, або типу, гармонійного перетворення. У версії або типі, зображених на Фіг. 5, рознесення частот аналізуючого блоку 301 в Т разів менше, ніж рознесення частот в синтезуючому блоці 303. Тому індекс n в синтезуючому блоці 303 відповідає частоті, яка в Т разів більше, ніж частота піддіапазону з тим же індексом n в аналізованому діапазоні 301. Наприклад, аналізований піддіапазон [(n-1),n] перетворюється в піддіапазон [(n-1)T,nT], що синтезується. Фіг. 6 ілюструє пряму нелінійну обробку одиничного піддіапазону, що міститься в кожному з блоків SISO 401-n. Нелінійна частина блоку 601 виконує множення фази комплексного сигналу піддіапазону на коефіцієнт, рівний порядку перетворення Т. Необов'язковий блок посилення 602 модифікує амплітуду сигналу піддіапазону з модифікованою фазою. У математичному вираженні вихідний сигнал блоку SISO 401-n може бути записаний як функція вхідного сигналу х системи SISO 401-n і коефіцієнта посилення g наступним чином: T 1-1/T y=gv , де v=x/x (1) Цей вираз також може бути записаний як . Іншими словами, фаза комплексного сигналу піддіапазону х множиться на порядок перетворення Т, а амплітуда комплексного сигналу піддіапазону х модифікується за допомогою коефіцієнта посилення g. Фіг. 7 ілюструє складові обробки перехресних членів 402, для гармонійного перетворення порядку Т. Присутні Т-1 паралельних блоків обробки перехресних членів 701-1,..., 701-r,... 701(T-1), вихідні сигнали яких підсумовуються у блоці підсумовування 702, даючи комбінований вихідний сигнал. Як вже вказувалося у ввідній частині, метою є відображення пари синусоїд з частотами (,+) в синусоїду з частотою (T-r)+r(+)=T+r, де змінна r змінюється в межах від 1 до T-1. Іншими словами, два піддіапазони з блоку аналізуючих фільтрів 301 повинні відображатися в один піддіапазон високочастотного діапазону. Для кожного окремого значення r і цього порядку перетворення Т етап відображення виконується у блоці перехресних членів 701r. Фіг. 8 ілюструє функціонування блоку обробки перехресних членів 701-r для фіксованого значення r = 1, 2,...,T-1. Кожен вихідний піддіапазон 803 утворюється в блоці з множиною входів і одним виходом (MISO) 800-n з двох вхідних піддіапазонів 801 і 802. Для вихідного піддіапазону 803 з індексом n два вхідні сигнали блоку MISO 800-n є піддіапазонуми n-p1 801 і n+p2 802, де р1 і р2 — цілі позитивні зміщення індексів, які залежать від порядку перетворення Т, змінної r і параметра основного тону для удосконалення за допомогою перехресного добутку . Правило нумерації аналізованих піддіапазонів, що синтезуються, підтримується відповідно до такого згідно з Фіг. 5, тобто відстань між частотами аналізуючого блоку 301 в Т разів менша, ніж відстань між частотами синтезуючого блоку 303, і, відповідно, приведені вище коментарі, що стосуються змін коефіцієнта Т, зберігають своє значення. У зв'язку із застосуванням обробки перехресних членів слід розглянути наступні зауваження. Параметр основного тону не може бути відомий з високою точністю і, звичайно, з кращим частотним розділенням, ніж частотне розділення, що отримується блоком аналізуючих фільтрів 301. Фактично, в деяких варіантах здійснення даного винаходу, параметр , що лежить в основі основного тону для удосконалення за допомогою перехресного добутку, взагалі не вводиться в декодер. Замість цього з переліку можливих кандидатів вибирається обрана пара цілочислових зміщень індексів (p1, p2) відповідно до такого критерію оптимізації, як максимізація вихідної амплітуди перехресного добутку, тобто максимізація енергії вихідного сигналу перехресного добутку. Наприклад, для заданих значень Т і r може використовуватися перелік кандидатів, що задається формулою (p1,p2)=(rl, (T-r)l), l L, де L — перелік додатних цілих чисел. Це детальніше показано нижче в контексті формули (11). Придатними в якості кандидатів, в принципі, являються усі додатні цілі числа. У деяких випадках інформація про основний тон може допомогти ідентифікувати, який з l слід вибрати в якості належних зміщень індексів. Крім того, попри те, що приклад обробки перехресного добутку, показаний на Фіг. 8, припускає, що використовувані зміщення індексів (p1, p2) однакові для певного діапазону вихідних піддіапазонів, наприклад, піддіапазони (n - 1), що синтезуються, n і (n + 1) складаються з аналізованих піддіапазонів, що знаходяться на фіксованій відстані p 1+ p2, ця вимога не є 11 UA 99878 C2 5 10 обов'язковою. По суті, зміщення індексів (p1, p2) можуть відрізнятися для усіх без виключення вихідних піддіапазонів. Це означає, що для кожного піддіапазону n може вибиратися параметр основного тону для удосконалення за допомогою перехресного добутку, що відрізняється від усіх інших. Фіг. 9 ілюструє нелінійну обробку, що міститься в кожному з блоків MISO 800-n. Операція перемножування 901 створює сигнал піддіапазону з фазою, що дорівнює зваженій сумі фаз двох комплексних вхідних сигналів піддіапазонів, і амплітудою, що дорівнює узагальненому середньому значенню амплітуд двох дискретних вхідних значень піддіапазонів. Необов'язковий блок посилення 902 модифікує амплітуду дискретних значень піддіапазонів з модифікованою фазою. У математичному описі вихідний сигнал y може бути записаний як функція вхідних сигналів блоку MISO 800 - n u1 801 і u1 802 і коефіцієнта посилення g таким чином: , де Це також можна записати як 15 20 25 30 35 40 45 , для m=1, 2(2) , де (u1,u2) — функція генерування амплітуди. Іншими словами, фаза комплексного сигналу піддіапазону u1 множиться на порядок перетворення T-r, а фаза комплексного сигналу піддіапазону u2 множиться на порядок перетворення r. Сума цих двох фаз використовується як фаза вихідного сигналу y, амплітуда якого виходить за допомогою функції генерування амплітуди. Порівняно з формулою (2), функція генерування амплітуди виражається як геометричне середнє амплітуд, модифіковане коефіцієнтом посилення g, тобто . Якщо допустити, що коефіцієнт посилення залежить від вхідних сигналів, вона, поза сумнівом, охоплює усі можливі варіанти. Слід зазначити, що формула (2) утворюється в результаті основоположної мети ― відображення пари синусоїд з частотами (,+) в синусоїду з частотою T+r, яка також може бути записана як (T-r)+r(+). У нижченаведеному тексті буде дано математичний опис даного винаходу. Для простоти розглядатимуться безперервні в часі сигнали. Передбачається, що блок синтезуючих фільтрів 303 досягає досконалої реконструкції з блоку 301 комплексних модульованих аналізуючих фільтрів з симетричною віконною функцією речових значень, або фільтром-прототипом w(t). Блок синтезуючих фільтрів в процесі синтезу часто, але не завжди, використовуватиме таке ж вікно. Передбачається, що модуляція відноситься до рівномірно пакетованого типу, при цьому крок по індексу нормується на одиницю, а рознесення кутових частот піддіапазонів, що синтезуються, нормується на n. Отже, цільовий сигнал s(t) досягатиметься на виході блоку синтезуючих фільтрів, якщо сигнали піддіапазонів на вході блоку синтезуючих фільтрів задаються сигналами піддіапазонів, що синтезуються yn(k): (3) Слід зазначити, що формула (3) є нормованою стаціонарною математичною моделлю традиційних операцій в звичайному блоці аналізуючих фільтрів для комплексних модульованих піддіапазонів, таку як оброблюване методом вікна дискретне перетворення Фур'є (DFT), також відоме як короткочасне перетворення Фур'є (STFT). При невеликій модифікації в аргументі комплексного показника експоненти у формулі (3) виходять стаціонарні моделі для блоку комплексних модульованих квадратурних дзеркальних фільтрів (QMF) і комплексифікованого модифікованого дискретного косинусного перетворення (Modified Discrete Cosine Transform, CMDCT), який також зветься оброблюваний методом вікна нерівномірний пакетований DFT. Для випадку безперервного часу індекс піддіапазону n пробігає по усіх від’ємних цілих числах. Для дискретних часових аналогів змінна часу t дискретизується на етапі 1/N, а індекс піддіапазону n обмежується N, де N — кількість піддіапазонів у блоці фільтрів, яке дорівнює кроку блоку 12 UA 99878 C2 5 10 15 20 25 30 35 40 45 50 фільтрів по індексу дискретного часу. У разі дискретного часу для операції перетворення також потрібен віднесений до N множник нормування, якщо він не вводиться в масштабування вікна. Для сигналу з речовим значенням існує стільки ж комплексних вихідних дискретних значень піддіапазонів, скільки існує речових вхідних дискретних значень для вибраної моделі блоку фільтрів. Тому існує загальна двократна передискретизація (чи надмірність). Також можуть використовуватися блоки фільтрів з більшим рівнем передискретизації, проте в даному описі для ясності пояснення підтримується невелика передискретизація. Основні етапи, що включаються в аналіз блоку модульованих фільтрів, що відповідає формулі (3), полягають в тому, що сигнал множиться на вікно, що центрується близько часу t = k, і результуючий оброблений методом вікна сигнал є корельованим з кожною з комплексних синусоїд exp[- inπ(t - k)]. У реалізаціях з дискретним часом ця кореляція ефективно реалізується за допомогою швидкого перетворення Фур'є. Відповідні алгоритмічні етапи блоку синтезуючих фільтрів добре відомі фахівцям в цій області, і складаються з модуляції синтезу, обробки синтезу методом вікна і операцій складання перекривань. Фіг. 19 ілюструє положення в часі і з частотою, що відповідає інформації, яку несе дискретне значення піддіапазону yn(k), для вибору значень індексу часу k і індексу піддіапазону n. Наприклад, дискретне значення піддіапазону y5(4) представлене темним прямокутником 1901. Для синусоїди s(t)=Acos(t+)=Re{Cexp(it)} сигнали піддіапазонів по формулі (3) для досить великих n з хорошим наближенням задаються формулою (4) де «капелюшок» означає Фур'є-перетворення, тобто ŵ — це Фур'є-перетворення віконної функції w. Строго кажучи, формула (4) є істинною, якщо додати член з - замість . Цим членом нехтують на основі припущення про те, що частотна характеристика вікна затухає досить швидко, і що сума і n не наближається до нуля. Фіг. 20 зображує типовий вид вікна w, 2001 і його Фур'є-перетворення ŵ 2002. Фіг. 21 ілюструє аналіз одиничної синусоїди, що відповідає формулі (4). Піддіапазонуми, які головним чином зачіпаються синусоїдою , є піддіапазони з індексом n, і, таким чином, nπ- є малим. Для прикладу згідно з Фіг. 21 частота складає =6,25π, що показано горизонтальною штриховою лінією 2101. В цьому випадку три піддіапазони з n = 5, 6, 7, представлені, відповідно, посилальними позиціями 2102, 2103, 2104, містять істотно ненульові сигнали піддіапазонів. Затінювання цих трьох піддіапазонів відбиває відносну амплітуду комплексних синусоїд усередині кожного з піддіапазонів, отриманих по формулі (4). Темніший фон означає більшу амплітуду. У конкретному прикладі це означає, що амплітуда піддіапазону 5, тобто 2102, менша порівняно з амплітудою піддіапазону 7, тобто 2104, яка, у свою чергу, менша за амплітуду піддіапазону 6, тобто 2103. Важливо відмітити, що наявність декількох ненульових піддіапазонів може взагалі бути необхідним для того, щоб мати можливість синтезувати високоякісну синусоїду на виході блоку синтезуючих фільтрів, особливо в тих випадках, коли вікно має вигляд, аналогічний виду вікна 2001 на Фіг. 20, з відносно короткою тривалістю і значними бічними пелюстками в частоті. Сигнали піддіапазонів yn(k), що синтезуються, також можуть бути визначені в результаті блоку аналізуючих фільтрів 301 і нелінійної обробки, тобто гармонійного перетворювача 302, показаного на Фіг. 3. На стороні блоку аналізуючих фільтрів сигнали аналізованих піддіапазонів можуть бути представлені як функція початкового сигналу z(t). Для перетворення порядку Т до початкового сигналу z(t) додається блок комплексних модульованих аналізуючих фільтрів з вікном wT(t)=w(t/T)/T, одиничним кроком по індексу і кроком частоти модуляції, який в Т разів менший, ніж крок частоти на синтезуючому блоці. Фіг. 22 ілюструє вид масштабованого вікна wT 2201 і його Фур'є-перетворення ŵT 2202. В порівнянні з Фіг. 20, часове вікно 2201 розтягнуто, а частотне вікно 2202 стиснуто. Аналіз за допомогою блоку модифікованих фільтрів в результаті дає сигнали аналізованих піддіапазонів xn(k): (5) Для синусоїди z(t)=Bcos(t+)=Re{Dexp(it)}, як можна переконатися, сигнали піддіапазонів 13 UA 99878 C2 по формулі (5) для досить великих n в хорошому наближенні задаються формулою: Xn(k)=Dexp(ik)ŵ(nπ-T) (6) Тоді подання цих сигналів піддіапазонів в гармонійний перетворювач 302 і застосування закону прямого перетворення по формулах (1) -(6) призводить до формули: 5 10 15 20 25 30 (7) Сигнали піддіапазонів, що синтезуються yn(k), що задаються формулою (4), і сигнали нелінійних піддіапазонів, що отримуються за допомогою гармонійного перетворення ỹn(k) і задаються формулою (7), в ідеалі повинні співпадати. Для непарних порядків перетворення Т коефіцієнт у формулі (7), що містить вплив вікна, дорівнює одиниці, оскільки передбачається, що значення Фур'є-перетворення вікна є речовим, а Т-1 — парне число. Тому формула (7) може бути точно поєднана з формулою (4) з =T для усіх піддіапазонів так, щоб вихідний сигнал блоку синтезуючих фільтрів з вхідними сигналами піддіапазонів, що відповідають формулі (7), був синусоїдою з частотою =T , амплітудою A=gB і фазою =T, де В і визначаються по формулі D=Bexp(i), яка при підстановці дає . Таким чином, виходить гармонійне перетворення порядку Т початкового синусоїдального сигналу z(t). Для парних Т збіг більш приблизний, але він, як і раніше, ґрунтується на частині частотної характеристики вікна ŵ з позитивним значенням, яке для симетричного вікна з речовими значеннями включає найбільш важливу головну пелюстку. Це означає, що гармонійне перетворення початкового синусоїдального сигналу z(t) отримане також і для парних значень Т. В окремому випадку віконної функції Гауса, ŵ завжди позитивно, і, отже, для парних і непарних порядків перетворення відмінностей в діях немає. Аналогічно формулі (6), аналіз синусоїди з частотою +, тобто початкового синусоїдального сигналу z(t)=B’cos((+)t+’)=Re{Eexp(i(+)t)} являє собою x’n(k)=Eexp(ik(+))ŵ(nπ-T(+)) (8) Тому подання двох сигналів піддіапазонів, u1=xn-p1(k), який відповідає сигналу 801 згідно з Фіг. 8, і u2=x’n+p2(k), який відповідає сигналу 802 згідно з Фіг. 8, в обробку перехресних членів 800-n, показану на Фіг. 8, і додаток формули членів (2), що схрещуються, дає вихідний сигнал піддіапазону : ỹn(k)=g exp[ik(T+r)]M(n,), (9) де (10 ). 35 40 45 Як видно з формули (9), еволюція фази вихідного сигналу піддіапазону 803 системи MISO 800-n йде за еволюцією фази при аналізі синусоїди з частотою T+r. Це відбувається незалежно від вибору зміщень індексів p1 і p2. Фактично, якщо сигнал піддіапазону по формулі (9) подається в канал піддіапазону n, що відповідає T+r, тобто nπ≈T+r, тоді вихідний сигнал буде вкладом в генерування синусоїди з частотою T+r. Проте, переважно, необхідно упевнитися, що кожен з вкладів є істотним, і що складання вкладів відбувається сприятливим чином. Ці особливості будуть обговорені нижче. При цьому параметрі основного тону для удосконалення за допомогою перехресного добутку вибір відповідних зміщень індексів p1 і p2 можна зробити так, щоб комплексна амплітуда M(n,) по формулі (10) приблизно дорівнювала ŵ(nπ-(T+r)) для деякого діапазону піддіапазонів n, і в цьому випадку кінцевий вихідний сигнал буде приблизно дорівнювати синусоїду на частоті T+r. Перший розгляд головних пелюсток одночасно задає усі три значення (n-p1)π-T, (n+p2)π-T(+) і nπ-(T+r) як малі, що призводить до наближеної рівності: 14 UA 99878 C2 та 5 10 15 20 25 30 35 40 45 50 55 (11) Це означає, що при відомому параметрі основного тону для удосконалення за допомогою перехресного добутку зміщення індексів можуть приблизно виражатися формулою (11), що, таким чином, дозволяє здійснювати простий вибір аналізованих піддіапазонів. Більш досконалий аналіз впливу вибору зміщень індексів p1 і p2 згідно з формулою (11) на амплітуду параметра M(n,) згідно з формулою (10) може виконуватися у важливих специфічних випадках віконних функцій, таких як віконна функція Гауса і синусоїдальна віконна функція. Неважко встановити, що необхідна апроксимація ŵ(nπ-(T+r)) надзвичайно хороша для декількох піддіапазонів з nπ≈T+r. Слід зазначити, що співвідношення (11) каліброване для ілюстративної ситуації, в якій Блок 301 аналізуючих фільтрів має рознесення кутових частот піддіапазонів π/T. У загальному випадку результуюча інтерпретація формули (11) полягає в тому, що початкова різниця між членами p1 + p2, що схрещуються, є цілим числом, яке приблизно рівно базовій основній частоті , виміряній в одиницях відстані між піддіапазонуми у блоці аналізуючих фільтрів, а пари (p1, p2) вибирається як кратна (r, T - r). Для визначення пари зміщень індексів (p1, p2) в декодері можуть використовуватися наступні режими: 1. Значення може бути отримане в процесі кодування і в прямій формі, з достатньою точністю передано в декодер для набуття цілочислових значень p1 і p2 за допомогою відповідної процедури округлення, яка може наслідувати наступні принципи: сума p1+p2 приблизно рівна /, де ― рознесення кутових частот блоку аналізуючих фільтрів; і частка p1/p2 вибирається так, щоб воно було приблизно рівне r/(T-r). 2. Для кожного цільового дискретного значення піддіапазону пари зміщень індексів (p 1, p2) може бути отримана в декодері із заздалегідь визначеного переліку значень-кандидатів так, щоб (p1, p2)=(rl,(T-r)l), lL, r{1,2,…,T-1}, де L ― перелік додатних цілих чисел. Вибір може ґрунтуватися на оптимізації вихідних амплітуд перехресних членів наприклад на максимізації енергії вихідних сигналів перехресних членів. 3. Для кожного цільового дискретного значення піддіапазону пари зміщень індексів (p 1, p2) має бути отримана із скороченого переліку значень-кандидатів шляхом оптимізації вихідної амплітуди перехресних членів, де скорочений перелік значень-кандидатів виходить в процесі кодування і передається в декодер. Слід зазначити, що модифікація фази сигналів піддіапазонів u 1 і u2 виконується із зважуванням, відповідно, (T - r) і r, але відстань між індексами p1 і p2 вибирається пропорційно, відповідно, r і (T-r). Тому піддіапазон, найближчий до піддіапазону n, що синтезується, піддається найбільш сильній модифікації фази. Переважний спосіб здійснення процедури оптимізації в описаних вище режимах 2 і 3 може полягати в розгляді (max - min)-оптимізації : (12) і у використанні пари, що перемогла, спільно з відповідним значенням r для побудови вкладу перехресного добутку в цей індекс цільового піддіапазону n. У орієнтованих на пошук режимах декодера 2 і, частково, 3 додавання перехресних членів для різних значень r, переважно, здійснюється незалежно, оскільки існує ризик додавання вмісту до кожного діапазону по декілька разів. Якщо ж, з іншого боку, для вибору піддіапазонів використовується основна частота , як в режимі 1, або в допустимих межах знаходиться лише вузький діапазон відстаней між індексами піддіапазонів, як може бути у разі режиму 2, окремого випадку багатократного додавання вмісту в один і той же діапазон можна уникнути. Крім того, також слід зазначити, що для описаних вище варіантів здійснення схем обробки перехресних членів може виявитися корисною додаткова модифікація декодером коефіцієнта посилення перехресного добутку g. Наприклад, вона відноситься до вхідних сигналів піддіапазонів u1 і u2 у блок творів MISO, що схрещуються, що задається формулою (2), і до вхідного сигналу піддіапазону х у блок перетворення SISO, що задається формулою (1). Якщо усі три сигнали повинні подаватися до одного і того ж вихідного піддіапазону, що синтезується, як показано на Фіг. 4, де пряма обробка 401 і обробка перехресного добутку 402 забезпечують складові одного і того ж вихідного піддіапазону, що синтезується, може виявитися бажаним прирівнювання коефіцієнта посилення перехресного добутку g нулю, тобто прирівнювання нулю 15 UA 99878 C2 5 10 15 20 25 30 35 40 45 50 55 блоку посилення 902 згідно з Фіг. 9, якщо min(u1,u2) 1. Іншими словами, додавання перехресного добутку виконується тільки у тому випадку, коли амплітуда прямого члена вхідного діапазону x мала в порівнянні з обома вхідними членами перехресного добутку. У цьому контексті x є дискретним значенням аналізованого піддіапазону для прямої обробки членів, яка призводить до вихідного сигналу того ж піддіапазону, що синтезується, що і даний перехресний добуток. Це може бути обережністю з метою не допустити додаткового посилення гармонійної складової, яка вже була доставлена шляхом прямого перетворення. Нижче спосіб гармонійного перетворення, описаний в цьому документі, буде описаний для ілюстративних спектральних конфігурацій з метою ілюстрації покращень відносно поточного рівня техніки. Фіг. 10 ілюструє здійснення прямого гармонійного перетворення порядку Т = 2. Верхня діаграма 1001 описує парціальні частотні складові оригінального сигналу вертикальними стрілками, розташованими на рівнях, кратних основній частоті . Вона ілюструє початковий сигнал, наприклад, на стороні кодувальника. Діаграма 1001 сегментована на лівобічний початковий частотний діапазон з парціальними частотами , 2, 3, 4, 5 і правосторонній цільовий частотний діапазон з парціальними частотами 6, 7, 8. Початковий частотний діапазон, як правило, кодується і передається в декодер. З іншого боку, правосторонній цільовий частотний діапазон,який включає парціальні частоти 6, 7, 8, що перевищують частоту переходу 1005 способу HFR, як правило, в декодер не передається. Метою способу гармонійного перетворення є реконструкція цільового частотного діапазону, що знаходиться вище за частоту переходу 1005 з початкового сигналу в початковому частотному діапазоні. Відповідно, цільовий частотний діапазон і, зокрема, парціальні частоти 6, 7, 8 на діаграмі 1001 недоступні в якості вхідного сигналу в перетворювач. Як описано вище, метою способу гармонійного перетворення є регенерація складових сигналу 6, 7, 8 початкового сигналу з частотних складових, доступних з початкового частотного діапазону. Нижня діаграма 1002 показує вихідний сигнал перетворювача в правосторонньому цільовому частотному діапазоні. Вказаний перетворювач може, наприклад, розташовуватися на стороні декодера. Парціальні частоти 6 і 8 регенеруються з парціальних частот 3 і 4 за допомогою гармонійного перетворення з використанням порядку перетворення T = 2. В результаті ефекту розтягання спектра при гармонійному перетворенні, показаного тут пунктирними стрілками 1003 і 1004, цільова парціальна частота 7 втрачається. Парціальна частота 7 не може бути регенерована з використанням способу гармонійного перетворення, на якому базується поточний рівень техніки. Фігура 11 ілюструє здійснення винаходу для гармонійного перетворення періодичного сигналу у разі, коли гармонійний перетворювач другого порядку удосконалиться одиничним членом, що схрещується, тобто коли Т = 2, r = 1. Як описано в контексті Фіг. 10, перетворювач використовується для генерування парціальних частот 6, 7, 8 в цільовому частотному діапазоні вище за частоту переходу 1105 на нижній діаграмі 1102 з парціальних частот , 2, 3, 4, 5 в початковому частотному діапазоні нижче частоти переходу 1105 по діаграмі 1101. На додаток до вихідного сигналу перетворювача на поточному рівні техніки згідно з Фіг. 10, при комбінуванні початкових парціальних частот 3 і 4 регенерується парціальна частотна складова 7. Здійснення додавання перехресного добутку відображене штриховими стрілками 1103 і 1104. У формульному вираженні є =3, тому (T-r)+r(+)=T+r=6+=7. Як можна бачити на цьому прикладі, з використанням описаного в цьому документі способу високочастотної реконструкції згідно з винаходом можуть бути регенеровані усі цільові парціальні частоти. Фіг. 12 ілюструє можливу реалізацію гармонійного перетворювача другого порядку у блоці модульованих фільтрів для конфігурації спектра згідно з Фіг. 10. Умовно зображені частотні характеристики піддіапазонів блоку аналізуючих фільтрів показані пунктирними лініями, як, наприклад, посилальна позиція 1206, на верхній діаграмі 1201. Піддіапазони нумеруються згідно з індексами піддіапазонів, деякі з яких, 5, 10 і 15, показані на Фіг. 12. Для цього прикладу основна частота дорівнює рознесенню частот аналізованих піддіапазонів, помноженому на 3,5. Це ілюструється тим фактом, що парціальна частота на діаграмі 1201 розташовується між двома піддіапазонуми з індексами 3 і 4. Парціальна частота 2 розташовується в центрі піддіапазону з індексом піддіапазону 7 і так далі. Нижня діаграма 1202 показує регенеровані парціальні частоти 6 і 8_з умовно зображеними частотними характеристиками, як, наприклад, посилальна позиція 1207, вибраних піддіапазонів блоку синтезуючих фільтрів. Як описувалося раніше, ці піддіапазони мають в Т = в 16 UA 99878 C2 5 10 15 20 25 30 35 40 45 50 55 2 рази грубіше рознесення частот. Відповідно, частотні характеристики також масштабуються на коефіцієнт Т = 2. Як буде описано нижче, спосіб прямої обробки членів на поточному рівні техніки модифікує фазу кожного аналізованого піддіапазону, тобто кожного піддіапазону нижче частоти переходу 1205 на діаграмі 1201, на коефіцієнт Т = 2 і відображає результат в піддіапазон, що синтезується, з тим же індексом, тобто в піддіапазон вище за частоту переходу 1205 на діаграмі 1202. Це символічно зображується на Фіг. 12 діагональними пунктирними стрілками, наприклад, стрілкою 1208 для аналізованого піддіапазону 1206 і піддіапазону, що синтезується, 1207. Результатом прямої обробки членів для піддіапазонів з індексами піддіапазонів 9―16 з аналізованого піддіапазону 1201 являється регенерація двох цільових парціальних частот 6 і 8 в піддіапазоні, що синтезується, 1202 з початкових парціальних частот 3 і 4. Як видно з Фіг. 12, основний вклад в цільову парціальну частоту 6 вноситься піддіапазонуми з індексами піддіапазонів 10 і 11, тобто посилальними позиціями 1209 і 1210, а основний вклад в цільову парціальну частоту 8 вноситься піддіапазоном з індексом піддіапазону 14, тобто посилальною позицією 1211. Фіг. 13 ілюструє можливу реалізацію додаткового етапу обробки перехресних членів у блоці модульованих фільтрів згідно з Фіг. 12. Етап обробки перехресних членів відповідає етапу, описаному у зв'язку з Фіг. 11 для періодичних сигналів з основною частотою . Верхня діаграма 1301 ілюструє аналізовані піддіапазони, початковий частотний діапазон яких треба перетворити в цільовий частотний діапазон піддіапазонів, що синтезуються, на нижній діаграмі 1302. У окремому випадку розглядається генерування піддіапазонів, що синтезуються, 1315 і 1316, які оточують парціальну частоту 7. Для порядку перетворення Т = 2 можна вибрати можливе значення r = 1. Вибір переліку значень-кандидатів (р1, р2) як кратних (r, T - r) = (1,1) так, щоб сума р1 + р2 приблизно дорівнювала 3,5, тобто основній частоті в одиницях рознесення частот аналізованих піддіапазонів, призводить до вибору p 1 = p2 = 2. Як було описано в контексті Фіг. 8, піддіапазон, що синтезується, з індексом піддіапазону n може генеруватися з твору перехресних членів аналізованих піддіапазонів з індексами піддіапазонів (n-p1) і (n+p2). Отже, для піддіапазону, що синтезується, з індексом піддіапазону 12, тобто для посилальної позиції 1315, перехресний добуток формується з аналізованих піддіапазонів з індексами піддіапазонів (n - p1) = 12 -2 = 10, тобто з посилальної позиції 1311, і (n + p2) = 12 + 2 = 14, тобто з посилальної позиції 1313. Для піддіапазону, що синтезується, з індексом піддіапазону 13 перехресний добуток формується з аналізованих піддіапазонів з індексами піддіапазонів (n - p1) = 13 -2 = 11, тобто з посилальної позиції 1312, і (n + p2) = 13 + 2 = 15, тобто з посилальної позиції 1314. Процес генерування перехресного добутку символічно зображається парами штрихових/пунктирних стрілок, тобто парами посилальних позицій, відповідно, 1308, 1309 і 1306, 1307. Як видно з Фіг. 13, парціальна частота 7 спочатку розміщується в піддіапазоні 1315 з індексом 12 і тільки в другу чергу ― в піддіапазоні 1316 з індексом 13. Отже, для отримання реалістичніших частотних характеристик, біля піддіапазону, що синтезується, 1315 з індексом 12 буде більше прямих і/або перехресних членів, додавання яких до високоякісної синусоїди з частотою (T-r)+r(+)=T+r=6+=7 вигідніше, ніж додавання членів біля піддіапазону, що синтезується, 1316 з індексом 13. Крім того, як підкреслювалося в контексті формули (13), додавання усіх перехресних членів з p 1 = p2 = 2 наосліп може призводити до небажаних складових сигналу для менш періодичних і теоретичних вхідних сигналів. Відповідно, явище несприятливих складових сигналу може зажадати застосування такого адаптивного правила компенсації перехресних творів, як, наприклад, правило, що дається формулою (13). Фіг. 14 ілюструє здійснення гармонійного перетворення порядку Т = 3 згідно з поточним рівнем техніки. Верхня діаграма 1401 зображує парціальні частотні складові оригінального сигналу вертикальними стрілками, розташованими на рівнях, кратних основній частоті . Парціальні частоти 6, 7, 8, 9 знаходяться в цільовому діапазоні вище за частоту переходу 1405 способу високочастотної реконструкції і тому недоступні в якості вхідних сигналів перетворювача. Метою гармонійного перетворення є регенерація цих складових з сигналу в початковому діапазоні. Нижня діаграма 1402 показує вихідний сигнал перетворювача в цільовому частотному діапазоні. Парціальні частоти 6, тобто посилальна позиція 1407, і 9, тобто посилальна позиція 1410, регенеруються з парціальних частот 2, тобто з посилальної позиції 1406, і 3, тобто з посилальної позиції 1409. В результаті ефекту розтягання спектра при гармонійному перетворенні, показаного тут пунктирними стрілками, відповідно, 1408 і 1411, цільові парціальні частоти 7 і 8 втрачаються. 17 UA 99878 C2 5 10 15 20 25 30 35 40 45 50 55 Фіг. 15 ілюструє здійснення винаходу для гармонійного перетворення періодичного сигналу у разі, коли гармонійний перетворювач третього порядку удосконалиться двома відрізняючимися членами, що схрещуються, тобто Т = 3, r = 1, 2. На додаток до перетворювача згідно з поточним рівнем техніки згідно з Фіг. 14 з комбінації початкових парціальних частот 1506 з частотою 2 і 1507 з частотою 3 за допомогою члена, що схрещується, для r = 1 регенерується парціальна частотна складова 1508 з частотою 7. Виконання додавання перехресного добутку зображене штриховими стрілками 1510 і 1511. У формульному вираженні є =2, (T-r)+r(+)=T+r=6+=7. Аналогічно парціальна частотна складова 1509 з частотою 8 регенерується за допомогою члена, що схрещується, для r = 2. Парціальна частотна складова 1509 в цільовому діапазоні нижньої діаграми 1502 генерується з парціальних частотних складових 1506 з частотою 2 і 1507 з частотою 3 в початковому частотному діапазоні верхньої діаграми 1501. Генерування добутку перехресних членів зображене стрілками 1512 і 1513. У формульному вираженні є (T-r)+r(+)=T+r=6+2=8. Як можна бачити, з використанням описаного в цьому документі способу високочастотної реконструкції можуть бути регенеровані усі цільові парціальні частоти. Фіг. 16 ілюструє можливу реалізацію гармонійного перетворювача третього порядку згідно з поточним рівнем техніки у блоці модульованих фільтрів для спектральної ситуації згідно з Фіг. 14. Умовно зображені частотні характеристики піддіапазонів блоку аналізуючих фільтрів показані пунктирними лініями на верхній діаграмі 1601. Піддіапазонів пронумеровані відповідно до індексів піддіапазонів 1―17, з яких з метою ілюстрації робиться відсилання до піддіапазонів 1606 з індексом 7, 1607 з індексом 10 і 1608 з індексом 11. Для цього прикладу основна частота дорівнює рознесенню частот аналізованих піддіапазонів , помноженому на 3,5. Нижня діаграма 1602 показує регенеровані парціальні частоти в суперпозиції з частотними характеристиками вибраних піддіапазонів блоку синтезуючих фільтрів, що умовно означають. Наприклад, робиться відсилання до піддіапазонів 1609 з індексом піддіапазону 7, 1610 з індексом піддіапазону 10 і 1611 з індексом піддіапазону 11. Як було описано вище, ці піддіапазони мають в Т = 3 рази грубіше рознесення частот . Відповідно, належним чином масштабовані частотні характеристики. Пряма обробка членів згідно з поточним рівнем техніки модифікує фазу сигналів піддіапазонів за допомогою коефіцієнта Т = 3 для кожного аналізованого піддіапазону і відображає результат в піддіапазон, що синтезується, з тим же індексом, що символічно зображається діагональними пунктирними стрілками. Результатом прямої обробки членів для піддіапазонів 6―11 являється регенерація двох цільових парціальних частот 6 і 9 з початкових парціальних частот 2 і 3. Як видно з Фіг. 16, основний вклад в цільову парціальну частоту 6 вноситься піддіапазоном з індексом 7, тобто посилальною позицією 1606, а основні вклади в цільову парціальну частоту 9 вносяться піддіапазонуми з індексами 10 і 11, тобто посилальними позиціями 1607 і 1608 відповідно. Фіг. 17 ілюструє можливу реалізацію додаткового етапу обробки перехресних членів для r = 1 у блоці модульованих фільтрів згідно з Фіг. 16, який призводить до регенерації парціальної частоти 7. Як було описано в контексті Фіг. 8, зміщення індексів (p 1, p2) можуть бути вибрані як кратні (r,T-r)=(1,2) так, щоб сума р1 + р2 приблизно дорівнювала 3,5, тобто основній частоті в одиницях рознесення частот аналізованих піддіапазонів . Іншими словами, відносна відстань, тобто відстань на осі частот, розділеній рознесенням частот аналізованих піддіапазонів , між двома аналізованими піддіапазонуми, що вносять вклад в синтетичний піддіапазон, який необхідно генерувати, повинна якнайкраще апроксимувати основну частоту, тобто основну частоту , що ділиться на рознесення частот аналізованих піддіапазонів . Це також описується формулами (11) і призводить до вибору p1 = 1, p2 = 2. Як показано на Фіг. 17, піддіапазон, що синтезується, з індексом 8, тобто посилальна позиція 1710, виходить з перехресного добутку, сформованого з аналітичних піддіапазонів з індексами (n - p1) = 8 - 1 = 7, тобто з посилальної позиції 1706, і (n + p2) = 8 + 2 = 10, тобто з посилальної позиції 1708. Для піддіапазону, що синтезується, з індексом 9 перехресний добуток формується з аналізованих піддіапазонів з індексами (n - p1) = 9 - 1 = 8, тобто з посилальної позиції 1707, і (n + p2) = 9 + 2 = 11, тобто з посилальної позиції 1709. Процес формування перехресних творів символічно зображений парами діагональних штрихових/пунктирних стрілок, тобто парами стрілок 1712, 1713 і 1714, 1715 відповідно. З Фіг. 17 можна бачити, що парціальна частота 7 більше виражено розташовується в піддіапазоні 1710, ніж в піддіапазоні 1711. Отже, можна чекати, що, при реалістичних характеристиках фільтрів, біля піддіапазону, що синтезується, з індексом 8, тобто піддіапазону 1710, буде більше перехресних членів додавання, яких до високоякісної синусоїди з частотою (T-r)+r(+)=T+r=6+=7 буде вигідніше. 18 UA 99878 C2 5 10 15 20 25 30 35 40 45 50 55 60 Фіг. 18 ілюструє можливу реалізацію додаткового етапу обробки перехресних членів для r = 2 у блоці модульованих фільтрів згідно з Фіг. 16, який призводить до регенерації парціальної частоти 8. Змішення індексів (p1, p2) можуть бути вибрані як кратні (r,T-r)=(2,1) так, щоб сума р1 + р2 приблизно дорівнювала 3,5, тобто основній частоті в одиницях рознесення частот аналізованих піддіапазонів . Це призводить до вибору p1 = 2, p2 = 1. Як показано на Фіг. 18, піддіапазон, що синтезується, з індексом 9, тобто посилальна позиція 1810, виходить з перехресного добутку, сформованого з аналітичних піддіапазонів з індексами (n - p1) = 9 - 2 = 7, тобто з посилальної позиції 1806, і (n + p2) = 9 + 1 = 10, тобто з посилальної позиції 1808. Для піддіапазону, що синтезується, з індексом 10 перехресний добуток формується з аналізованих піддіапазонів з індексами (n - p1) = 10 - 2 = 8, тобто з посилальної позиції 1807, і (n + p2) = 10 + 1 = 11, тобто з посилальної позиції 1809. Процес формування перехресних творів символічно зображений парами діагональних штрихових/пунктирних стрілок, тобто парами стрілок 1812, 1813 і 1814, 1815 відповідно. З Фіг. 18 можна бачити, що парціальна частота 8 дещо більше виражено розташовується в піддіапазоні 1810, чим в піддіапазоні 1811. Отже, можна чекати, що, при реалістичних характеристиках фільтрів, біля піддіапазону, що синтезується, з індексом 9, тобто піддіапазону 1810, буде більше прямих і/або перехресних членів, додавання яких до високоякісної синусоїди з частотою (T-r)+r(+)=T+r=6+2=8 буде вигідніше. Нижче робиться відсилання до Фігур 23 і 24, які ілюструють процедуру вибору на основі (max-min)-оптимізації по формулі (12) для пари зміщень індексів (p1, p2) і r згідно з цим правилом для Т = 3. Вибраний індекс цільового піддіапазону є n = 18, а верхня діаграма показує приклад амплітуди сигналу піддіапазону для заданого часового індексу. Перелік додатних цілих чисел задається тут сімома значеннями L={2,3,…,8}. Фіг. 23 ілюструє пошук кандидатів при r = 1. Цільовий піддіапазон, або піддіапазон, що синтезується, показаний з індексом n = 18. Пунктирна лінія 2301 виділяє піддіапазон з індексом n = 18 у високому діапазоні аналізованих піддіапазонів і нижньому діапазоні піддіапазонів, що синтезуються. Можливими парами зміщень індексів є пари (p1, p2) = {(2,4),(3,6),…,(8,16)} для l = 2, 3,..., 8, відповідно, і відповідними парами індексів дискретних значень амплітуди аналізованих піддіапазонів, тобто переліком пар індексів піддіапазонів, які розглядаються як визначаючі оптимальний член, що схрещується, є {(16,22),(15,24),…,(10,34)}. Ряд стрілок ілюструє дані пари. Наприклад, показана пара (15, 24), позначена посилальними позиціями 2302 і 2303. Знаходження мінімуму для цих пар амплітуд дає перелік (0, 4, 1, 0, 0, 0, 0) відповідних мінімальних пар амплітуд для переліку можливих перехресних членів. Оскільки другий елемент для l = 3 є максимальним, пара (15, 24) перемагає серед кандидатів з r = 1, і вибір зображений товстими стрілками. Фіг. 24 схожим чином ілюструє пошук кандидатів з r = 2. Цільовий піддіапазон, або піддіапазон, що синтезується, показаний з індексом n = 18. Пунктирна лінія 2401 виділяє піддіапазон з індексом n = 18 у високому діапазоні аналізованих піддіапазонів і в нижньому діапазоні піддіапазонів, що синтезуються. В цьому випадку, можливими парами зміщень індексів є пари пари (p1, p2) = {(4,2),(6,3),…,(16,8)}, і відповідними парами індексів дискретних амплітуд аналізованих піддіапазонів є пари {(14,20),(12,21),…,(2,26)}, серед яких пара (6, 24) представлена посилальними позиціями 2402 і 2403. Знаходження мінімуму для цих пар амплітуд дає перелік (0, 0, 0, 0, 3, 1, 0). Оскільки п'ятий елемент є максимальним, тобто l = 6, пара (6, 24) перемагає серед кандидатів з r = 2, як показано товстими стрілками. В цілому, оскільки мінімум відповідної пари амплітуд менше, ніж мінімум для вибраної пари піддіапазонів при r = 1, остаточний вибір для індексу цільового піддіапазону n = 18 падає на пару (15, 24) і r = 1. Крім того, слід зазначити, що, коли вхідний сигнал z(t) є гармонійним рядом з основною частотою , тобто з основною частотою, яка відповідає параметру основного тону для удосконалення за допомогою перехресного добутку, і досить велика в порівнянні з розділенням по частоті блоку аналізуючих фільтрів, сигнали аналізованих піддіапазонів x’n(k), що задаються формулою (8), є хорошими наближеннями аналізу вхідного сигналу z(t), де наближення є дійсним в різних діапазонах піддіапазонів. Із зіставлення формули (6) і формул (8―10) витікає, що еволюція фази гармоніки уздовж осі частот вхідного сигналу z(t) коректно екстраполюватиметься даним винаходом. З точки зору якості вихідного звукового сигналу це є привабливою особливістю для сигналів, що мають характер послідовності імпульсів, як, наприклад, сигнали, викликані людськими голосами і деякими музичними інструментами. Фіг. 25, 26 і 27 ілюструють функціонування ілюстративної реалізації перетворення згідно з винаходом для гармонійного сигналу у разі Т = 3. Сигнал має основну частоту 282,35 Гц, спектр його амплітуди в даному цільовому діапазоні 10―15 кГц зображений на Фіг. 25. Для реалізації перетворень використовується блок фільтрів з N = 512 піддіапазонів на частоті дискретизації 48 19 UA 99878 C2 5 10 15 20 25 30 35 40 45 50 55 60 КГц. Спектр амплітуди вихідного сигналу прямого перетворювача (Т = 3) зображений на Фіг. 26. Як можна бачити, кожна третя гармоніка відтворюється з високою точністю, як і передбачає описана вище теорія, і сприйманим основним тоном буде основний тон 847 Гц, в три рази більший оригінального тону. Фіг. 27 показує вихідний сигнал перетворювача, що застосовує твори перехресних членів. Усі гармоніки відтворюються аж до дефектів, пов'язаних з особливостями наближень теорії. В цьому випадку бічні пелюстки знаходяться приблизно на 40 Дб нижче рівня сигналу, і цього більш ніж достатньо для регенерації високочастотного вмісту, який сприймається нерозрізнено від оригінального гармонійного сигналу. Нижче робиться відсилання до Фіг. 28 і Фіг. 29, які ілюструють, відповідно, ілюстративний кодувальник 2800 і ілюстративний декодер 2900 для уніфікованого кодування мови і звуку (USAC). Загальна конструкція кодувальника USAC 2800 і декодера 2900 описується таким чином: в першу чергу ― традиційна перед / постобробка, що містить функціональний блок MPEG Surround (MPEGS), призначений для операцій по обробці стереофонічних і багатоканальних сигналів, і вдосконалені блоки SBR (eSBR) 2801 і 2901 відповідно, які оперують з параметричним представленням більш високих звукових частот вхідного сигналу і можуть застосовувати способи гармонійного перетворення, що описуються в цьому документі. Потім ― дві гілки, одна з яких складається з траєкторії інструменту модифікованого перспективного звукового кодування (Advanced Audio Coding, AAC), а друга складається з траєкторії на основі лінійного пророцтва (у області LP або LPC), яке, у свою чергу, характеризується представленням залишкового продукту кодування з лінійним пророцтвом (LPC) в частотній і часовій областях. Усі спектри, що передаються, як AAC, так і LPC, можуть бути представлені в області MDCT з подальшим квантуванням і арифметичним кодуванням. Представлення в часовій області використовує схему кодового збудження ACELP. Вдосконалений блок реплікації спектральних смуг (eSBR) 2801 кодувальника 2800 може включати системи високочастотної реконструкції, описані в цьому документі. Зокрема, блок eSBR 2801 може включати Блок 301 аналізуючих фільтрів, призначений для генерування ряду сигналів аналізованих піддіапазонів. Сигнали аналізованих піддіапазонів можуть потім перетворюватися у блоці нелінійної обробки 302, генеруючи ряд сигналів піддіапазонів, що синтезуються, які потім можуть вводитися у блок синтезуючих фільтрів 303 для генерування високочастотної складової. У блоці eSBR 2801 на стороні кодування може визначатися набір інформації про те, як генерувати високочастотну складову з низькочастотної складової так, щоб високочастотна складова якнайкраще співпадала з високочастотною складовою оригінального сигналу. Набір інформації може включати інформацію про характеристики сигналу, таких як переважаюча основна частота , обвідна спектра високочастотної складової, і інформацію про те, як найкраще комбінувати сигнали аналізованих піддіапазонів, тобто таку інформацію, як обмежений набір пар зміщень індексів (p1, p2). Кодовані дані, що відносяться до вказаного набору інформації, об'єднуються з іншою кодованою інформацією в мультиплексорі бітового потоку і спрямовуються у вигляді кодованого потоку аудіоданих у відповідний декодер 2900. Декодер 2900, показаний на Фіг. 29, також включає вдосконалений блок реплікації спектральних смуг (eSBR) 2901. Блок eSBR 2901 приймає кодований потік аудіоданих, або кодований сигнал, з кодувальника 2800 і використовує способи, описані в цьому документі, для генерування високочастотної складової сигналу, яка об'єднана з кодованою низькочастотною складовою, даючи на виході декодований сигнал. Блок eSBR 2901 може включати різні компоненти, описані в цьому документі. Зокрема, він може включати Блок 301 аналізуючих фільтрів, блок нелінійної обробки 302 і блок синтезуючих фільтрів 303. Блок eSBR 2901 може використовувати інформацію про високочастотну складову, що надається кодувальником 2800, для виконання високочастотної реконструкції. Ця інформація може бути основною частотою сигналу, обвідною спектра оригінальної високочастотної складової і/або інформацією про аналізовані піддіапазони, які використовуватимуться для генерування сигналів піддіапазонів, що синтезуються, і, особливо, високочастотної складової декодованого сигналу. Крім того, Фіг. 28 і 29 ілюструють можливі додаткові компоненти кодувальника/декодера USAC, такі як: інструмент демультиплексора корисного навантаження бітового потоку, який розділяє корисне навантаження бітового потоку на частини для кожного інструменту і забезпечує кожен з інструментів інформацією про корисне навантаження бітового потоку, пов'язане з цим інструментом; інструмент декодування масштабних коефіцієнтів зі зниженим рівнем шуму, який отримує інформацію з демультиплексора корисного навантаження бітового потоку, виконує граматичний розбір цієї інформації і декодує масштабні коефіцієнти, що кодуються методами Хаффмана і DPCM; 20 UA 99878 C2 5 10 15 20 25 30 35 40 45 50 55 60 інструмент декодування спектра зі зниженим рівнем шуму, який отримує інформацію з демультиплексора корисного навантаження бітового потоку, виконує граматичний розбір цієї інформації, декодує арифметично кодовані дані і реконструює квантовані спектри; інструмент зворотного квантувача, який набуває квантованих значень спектра і перетворює цілочислові значення в немасштабовані реконструйовані спектри; цей квантувач переважно є компандуючим квантувачем, коефіцієнт компандування якого залежить від вибраного режиму базового кодування; інструмент заповнення шуму, який використовується для заповнення спектральних розривів в декодованих спектрах, які виникають при квантуванні спектральних значень в нуль, наприклад, із-за сильного обмеження, що накладається в кодувальнику на бітові вимоги; інструмент зміни масштабу, який перетворює цілочислове представлення масштабних коефіцієнтів у фактичні значення і множить немасштабовані спектри, піддані зворотному квантуванню, на відповідні масштабні коефіцієнти; інструмент M/S, описаний в стандарті ISO/IEC 14496-3; інструмент часової фільтрації і перетворення шуму (TNS), описаний в стандарті ISO/IEC 14496-3; блок фільтрів / інструмент комутатора блокування, який застосовує інверсію відображення частот, яка була проведена в кодувальнику; для інструменту блоку фільтрів переважно використовується зворотне модифіковане дискретне косинусне перетворення (IMDCT); блок фільтрів з деформацією шкали часу / інструмент комутатора блокування, який заміщає нормальний інструмент перемикання блоку фільтрів при активації режиму деформації шкали часу; цей блок фільтрів, переважно, аналогічний (IMDCT) нормальному блоку фільтрів з додаванням відображення дискретних значень в часовій області, що обробляються методом вікна, з області деформованої шкали часу в лінійну часову область шляхом залежної від часу передискретизації; інструмент MPEG Surround (MPEGS), який створює набір сигналів з одного або декількох вхідних сигналів, застосовуючи до вхідного (вхідних) сигналу (сигналів) складну процедуру підвищувального мікшування, керовану відповідними просторовими параметрами; у контексті USAC, MPEGS переважно використовується для кодування багатоканального сигналу шляхом передачі супутньої параметричної інформації спільно з переданим зведеним сигналом; інструмент класифікатора сигналів, який аналізує оригінальний вхідний сигнал і генерує з нього інформацію, що управляє, яка запускає вибір різних режимів кодування; аналіз вхідного сигналу, як правило, залежить від реалізації і намагатиметься вибрати оптимальний режим базового кодування для цього циклу вхідного сигналу; вихідний сигнал класифікатора сигналів може, необов'язково, використовуватися також і для впливу на поведінку інших інструментів, наприклад, MPEG Surround, вдосконаленого SBR, блоку фільтрів з деформацією шкали часу та ін.; інструмент фільтру LPC, який створює сигнал в часовій області з сигналу в області збуджень шляхом фільтрації реконструйованого сигналу збудження через фільтр синтезу з лінійним пророцтвом; і інструмент ACELP, який забезпечує спосіб ефективного представлення сигналу збудження в часовій області шляхом комбінування довготривалого провісника (адаптивного кодового слова) з імпульсоподібною послідовністю (породжувального кодового слова). Фіг. 30 ілюструє варіант здійснення блоків eSBR, показаних на Фіг. 28 і 29. Блок eSBR 3000 нижче буде описаний в контексті декодера, де вхідний сигнал блоку eSBR 3000 є низькочастотною складовою, також відомою як нижній діапазон, сигналу і, можливо, додатковою інформацією, що відноситься до специфічних характеристик сигналу, таких як, наприклад, основна частота і/або можливі значення зміщень індексів (p1, p2). На стороні кодувальника вхідний сигнал блоку eSBR, як правило, буде повним сигналом, тоді як вихідним сигналом буде додаткова інформація, що відноситься до характеристик сигналу і/або значень зміщень індексів. На Фіг. 30 низькочастотна складова 3013 подається в блок фільтрів QMF з метою генерування частотних діапазонів QMF. Частотні діапазони QMF не слід помилково приймати за аналізовані піддіапазони, що описуються в цьому документі. Частотні діапазони QMF використовуються з метою маніпуляцій і об'єднання низько- і високочастотної складових сигналу в частотній області, а не в часовій. Низькочастотна складова 3014 подається у блок перетворення 3004, який відноситься до систем високочастотної реконструкції, описаних в цьому документі. Блок перетворення також може отримувати додаткову інформацію 3011, таку як основна частота кодованого сигналу і/або можливі значення пар зміщень індексів (p 1, p2) для вибору піддіапазонів. Блок перетворення 3004 генерує високочастотну складову 3012, також відому як високий діапазон, сигналу, яка перетворюється в частотну область блоком 21 UA 99878 C2 5 10 15 20 25 30 фільтрів QMF 3003. Обидві перетворені в область QMF складові, низькочастотна і високочастотна, подаються у блок маніпуляцій і об'єднання 3005. Блок 3005 може виконувати корекцію обвідної високочастотної складової і комбінує скоректовану високочастотну складову і низькочастотну складову. Комбінований вихідний сигнал перетворюється назад в часову область блоком зворотних фільтрів QMF 3001. Як правило, блоки фільтрів QMF включають 64 частотні діапазони QMF. Проте слід відмітити, що може виявитися корисною знижувальна дискретизація низькочастотної складової 3013 так, щоб блок фільтрів QMF 3002 вимагав лише 32 частотні діапазони QMF. В цьому випадку низькочастотна складова 3013 має ширину смуги пропускання fs/4, де fs ― частота дискретизації сигналу. З іншого боку, високочастотна складова 3012 має смугу пропускання fs/2. Спосіб і система, описані в цьому документі, можуть бути реалізовані як програмне забезпечення, вбудоване програмне забезпечення і/або апаратне забезпечення. Деякі компоненти можуть, наприклад, бути реалізовані як програмне забезпечення, яке запускається в процесорі або мікропроцесорі цифрової обробки сигналів. Інші компоненти можуть, наприклад, бути реалізовані як апаратні засоби і/або спеціалізовані інтегральні мікросхеми. Сигнали, що зустрічаються в описаних способах і системах, можуть зберігатися на носіях даних, таких як пам'ять з довільним доступом (оперативна пам'ять) або оптичні запам'ятовувачі. Вони можуть передаватися за допомогою мереж, таких як радіомережа, супутникові мережі зв'язку, безпровідні мережі або кабельні мережі, наприклад, через інтернет. Типові пристрої, що використовують спосіб і систему, описані в цьому документі, є додатковими зовнішніми пристроями і іншим устаткуванням на території користувача, яке декодує звукові сигнали. На стороні кодування спосіб і система можуть використовуватися як радіомовні станції, наприклад, в головних вузлах відеосистем. Цей документ описує спосіб і систему для виконання високочастотної реконструкції сигналу на основі низькочастотної складової сигналу. Використовуючи комбінації піддіапазонів з низькочастотної складової, спосіб і система дозволяють реконструювати частоти і діапазони частот, які не можуть генеруватися способами перетворення, відомими на поточному рівні техніки. Крім того, описаний спосіб і система HTR дозволяють використати низькі частоти переходу і/або генерування великих високочастотних діапазонів з вузьких низькочастотних діапазонів. ФОРМУЛА ВИНАХОДУ 35 40 45 1. Система для генерування високочастотної складової звукового сигналу з низькочастотної складової звукового сигналу, що містить: - блок (301) аналізуючих фільтрів, що створює набір сигналів аналізованих піддіапазонів низькочастотного складового звукового сигналу; - блок (302) нелінійної обробки, призначений для генерування сигналу синтезованого піддіапазону із синтезованою частотою шляхом множення фаз першого й другого сигналів аналізованих піддіапазонів з набору сигналів аналізованих піддіапазонів і комбінування сигналів аналізованих піддіапазонів з помноженими фазами; і - блок (303) синтезуючих фільтрів, призначений для генерування високочастотної складової звукового сигналу із сигналу синтезованого піддіапазону, де - блок (302) нелінійної обробки містить блок (800-n) перетворення першого й другого порядку з багатьма входами й одним виходом, що генерує сигнал (803) синтезованого піддіапазону з першого (801) і другого (802) сигналів аналізованих піддіапазонів, відповідно, з першою аналізованою частотою й другою аналізованою частотою ; - перший сигнал (801) аналізованого піддіапазону є сигналом з фазою, помноженою на перший порядок перетворення T r ; - другий сигнал (803) аналізованого піддіапазону є сигналом з фазою, помноженою на другий порядок перетворення r ; - T 1; 1 r T ; і - синтезована частота дорівнює T r r . 2. Система за п. 1, яка також містить: - блок (902) посилення, призначений для множення сигналу (803) синтезованого піддіапазону на коефіцієнт посилення. 3. Система за будь-яким з попередніх пунктів, яка також містить: 50 55 22 UA 99878 C2 5 10 15 20 25 30 35 40 45 50 55 - набір блоків (800-n) з багатьма входами й одним виходом і/або набір блоків нелінійної обробки, які генерують набір парціальних сигналів (803) синтезованих піддіапазонів із синтезованою частотою; і - блок (702) підсумовування піддіапазонів, призначений для комбінування набору парціальних сигналів синтезованих піддіапазонів. 4. Система за будь-яким з пп. 1, 2, яка відрізняється тим, що блок (302) нелінійної обробки також містить: - блок (401) прямої обробки, призначений для генерування додаткового сигналу синтезованого піддіапазону із третього сигналу аналізованого піддіапазону з набору сигналів аналізованих піддіапазонів; і - блок підсумовування піддіапазонів, призначений для комбінування сигналів синтезованих піддіапазонів із синтезованою частотою. 5. Система за п. 4, яка відрізняється тим, що - блок підсумовування піддіапазонів ігнорує сигнали синтезованих піддіапазонів, що генеруються у блоках (800-n) з багатьма входами й одним виходом, якщо мінімум абсолютного значення першого (801) і другого (802) сигналів аналізованих піддіапазонів менше заздалегідь заданої частки абсолютного значення сигналу. 6. Система за п. 4, яка відрізняється тим, що блок (401) прямої обробки містить: - блок (401-n) третього порядку перетворення Т’ з одним входом і одним виходом, що генерує сигнал синтезованого піддіапазону із третього сигналу аналізованого піддіапазону, що проявляє третю аналізовану частоту, де - третій сигнал аналізованого піддіапазону є сигналом з фазою, модифікованою за допомогою третього порядку перетворення T’; - Т' більше одиниці; і - синтезована частота відповідає третій аналізованій частоті, помноженій на третій порядок перетворення. 7. Система за п. 6, яка відрізняється тим, що - сигнал містить основну частоту; і - блок (301) аналізуючих фільтрів проявляє рознос частот, що пов'язаний з основною частотою сигналу. 8. Система за п. 6, яка відрізняється тим, що - блок (301) аналізуючих фільтрів містить N аналізованих піддіапазонів із практично постійною відстанню між піддіапазонуми; - аналізований піддіапазон пов'язаний з індексом n аналізованого піддіапазону, де n ,...,N; 1 - блок (303) синтезуючих фільтрів містить синтезований піддіапазон; - синтезований піддіапазон пов'язаний з індексом n синтезованого піддіапазону; і - кожний синтезований піддіапазон і аналізований піддіапазон з індексом n містять діапазони частот, які співвідносяться один з одним за допомогою коефіцієнта T . 9. Система за п. 8, яка відрізняється тим, що - сигнал (803) синтезованого піддіапазону пов'язаний із синтезованим піддіапазоном за допомогою індексу n ; - перший сигнал (801) аналізованого піддіапазону пов'язаний з аналізованим піддіапазоном за допомогою індексу n p1 , - другий сигнал (802) аналізованого піддіапазону пов'язаний з аналізованим піддіапазоном за допомогою індексу n p 2 , і - система додатково містить блок вибору індексів, призначений для вибору індексів p1 і р2. 10. Система за п. 9, яка відрізняється тим, що - блок вибору індексів придатний для вибору зміщень індексів р1 і р2 з обмеженого переліку пар (p1, р2), що зберігається в блоці зберігання індексів. 11. Система за п. 10, яка відрізняється тим, що - блок вибору індексів придатний для вибору пари (р1, р2) так, щоб мінімальне значення набору, що включає абсолютне значення сигналу першого аналізованого піддіапазону й абсолютне значення сигналу другого аналізованого піддіапазону, було максимізоване. 12. Система за п. 9, яка відрізняється тим, що блок вибору індексів придатний для визначення обмеженого переліку пар (p1, р2) так, щоб - зміщення індексу p1 r I ; - зміщення індексу p2 T r I ; і 23 UA 99878 C2 5 10 - I - позитивне ціле число. 13. Система за п. 12, яка відрізняється тим, що - блок вибору індексів придатний для вибору параметрів I і r так, щоб мінімальне значення набору, що включає абсолютне значення сигналу першого аналізованого піддіапазону й абсолютне значення сигналу другого аналізованого піддіапазону, було максимізоване. 14. Система за п. 9, яка відрізняється тим, що блок вибору індексів придатний для вибору зміщень індексів p1 і р2 на основі характеристик сигналу. 15. Система за п. 14, яка відрізняється тим, що - сигнал містить основну частоту ; - блок вибору індексів придатний для вибору зміщень індексів p1 і р2 так, щоб - сума зміщень індексів p1 p2 приблизно дорівнювала частці / ; і 15 20 25 30 35 40 45 50 55 - частка p1 / p 2 була кратною r / T r . 16. Система за п. 14, яка відрізняється тим, що - сигнал містить основну частоту ; - блок вибору індексів придатний для вибору зміщень індексів р1 і р2 так, щоб - сума зміщень індексів p1 p2 приблизно дорівнювала частці / ; і - частка p1 / p2 була рівною r / T r . 17. Система за п. 14, що також містить: - вікно (2001) аналізу, що виділяє заздалегідь визначений тимчасовий інтервал низькочастотної складової у заздалегідь визначений момент часу k ; - вікно (2001) синтезу, що виділяє заздалегідь визначений тимчасовий інтервал високочастотної складової у заздалегідь визначений момент часу k . 18. Система за п. 17, яка відрізняється тим, що - вікно (2201) синтезу являє собою масштабовану за часом версію вікна (2001) аналізу. 19. Система декодування сигналу, що містить: - блок (102) перетворення за п. 1, призначений для генерування високочастотної складової сигналу з низькочастотної складової сигналу. 20. Система за п. 19, яка відрізняється тим, що сигнал є мовним і/або звуковим сигналом. 21. Система за будь-яким з пп. 19-20, яка відрізняється тим, що також містить: - базовий декодер (101), призначений для декодування низькочастотної складової сигналу. 22. Система за п. 21, яка відрізняється тим, що також містить: - підвищувальний дискретизатор (104), призначений для виконання підвищувальної дискретизації низькочастотної складової, що дає на виході низькочастотну складову з підвищеною дискретизацією; - регулятор (103) обвідної, призначений для надання форми високочастотної складової; і - блок підсумовування складових, призначений для визначення декодованого сигналу як суми низькочастотної складової з підвищеною дискретизацією й скоректованою високочастотною складовою. 23. Система за п. 22, яка відрізняється тим, що також містить: - блок прийому даних для вибору піддіапазонів, призначений для прийому інформації, що дозволяє зробити вибір першого (801) і другого (802) сигналів аналізованих піддіапазонів, з яких повинен генеруватися сигнал (803), синтезованого піддіапазону. 24. Система за п. 23, яка відрізняється тим, що - інформація пов'язана з основною частотою сигналу. 25. Система за п. 23, яка відрізняється тим, що - інформація включає перелік пар перших (801) і других (802) сигналів аналізованих піддіапазонів. 26. Система за п. 22, яка відрізняється тим, що також містить: - блок прийому даних про обвідну, призначений для прийому інформації, що стосується до обвідної високочастотної складової сигналу. 27. Система за п. 21, яка відрізняється тим, що також містить: - блок введення, призначений для прийому сигналу, що включає низькочастотну складову; і - блок виводу, призначений для надання декодованого сигналу, що включає низькочастотну та генеровану високочастотну складові. 28. Спосіб виконання високочастотної реконструкції високочастотної складової з низькочастотної складової звукового сигналу, що включає: 24 UA 99878 C2 - створення (301) першого сигналу піддіапазону низькочастотної складової з першою частотою й другого сигналу піддіапазону низькочастотної складової із другою частотою ; 5 10 15 20 25 - множення фази першого сигналу піддіапазону на перший коефіцієнт перетворення T r для одержання першого перетвореного сигналу піддіапазону; - множення фази другого сигналу піддіапазону на другий коефіцієнт перетворення r для одержання другого перетвореного сигналу піддіапазону; де T 1; 1 r T ; і - комбінування (303) першого і другого перетворених сигналів піддіапазонів для одержання високочастотної складової з високою частотою T r r . 29. Спосіб за п. 28, який відрізняється тим, що етап створення включає: - фільтрацію низькочастотної складової за допомогою блока (301) аналізуючих фільтрів для генерування першого й другого сигналів піддіапазонів. 30. Спосіб за будь-яким з пп. 28, 29, який відрізняється тим, що етап комбінування включає: - множення першого і другого перетворених сигналів піддіапазонів для одержання сигналу високого піддіапазону; і - уведення сигналу високого піддіапазону в блок синтезуючих фільтрів для генерування високочастотної складової. 31. Спосіб за п. 30, який відрізняється тим, що також включає: - декодування кодованого звукового сигналу для одержання низькочастотної складової звукового сигналу, де кодований сигнал виходить із оригінального звукового сигналу й представляє тільки частину частотних піддіапазонів оригінального сигналу нижче частоти (1005) переходу. 32. Додатковий зовнішній пристрій для декодування прийнятого мультимедійного сигналу, що включає звуковий сигнал, причому додатковий зовнішній пристрій містить: - блок (102) перетворення за будь-яким з пп. 1-27, призначений для генерування високочастотної складової сигналу з низькочастотної складової звукового сигналу. 25 UA 99878 C2 26 UA 99878 C2 27 UA 99878 C2 28
ДивитисяДодаткова інформація
Назва патенту англійськоюCross product enhanced harmonic transposition
Автори англійськоюVillemoes, Lars, Hedelin, Per
Назва патенту російськоюГармоническое преобразование, усовершенствованное перекрестным произведением
Автори російськоюВиллемоэс Ларс, Хеделин Пер
МПК / Мітки
МПК: G10L 21/00
Мітки: гармонійне, вдосконалене, перетворення, перехресним, добутком
Код посилання
<a href="https://ua.patents.su/38-99878-garmonijjne-peretvorennya-vdoskonalene-perekhresnim-dobutkom.html" target="_blank" rel="follow" title="База патентів України">Гармонійне перетворення, вдосконалене перехресним добутком</a>
Попередній патент: Спосіб виготовлення штаб з металу і виробнича установка для здійснення цього способу
Наступний патент: Спосіб транспортування термонестійких продуктів і транспортний засіб для транспортування термонестійких продуктів
Випадковий патент: Спосіб боротьби з ерозією ґрунтів на улоговинних водозборах