Спосіб дельта-ущільнення мовних сигналів
Номер патенту: 38505
Опубліковано: 12.01.2009
Автори: Ткаченко Олександр Миколайович, Хрущак Сергій Вікторович, Феферман Олег Дмитрович
Формула / Реферат
Спосіб дельта-ущільнення мовних сигналів, що включає кодування вибірок мовного сигналу на основі моделі лінійного прогнозування, який відрізняється тим, що спочатку виконують попередню структуризацію векторів у кодовій книзі згідно з відношенням мажорування їх відстаней до заданих точок відліку, далі за допомогою аналого-цифрового перетворювача перетворюють мовний сигнал в набір оцифрованих вибірок та кодують фрейми отриманих вибірок у вектор коефіцієнтів лінійного прогнозування на основі моделі лінійного прогнозування, перетворюють коефіцієнти лінійного прогнозування в вектор лінійних спектральних пар, проводять буферизацію групи фреймів, за алгоритмом Вітербі виконують перерахунок оцінювальної функції для квантованих значень фреймів, в канал зв'язку для кожного фрейму передають різницю між індексами в кодовій книзі від поточного до попереднього квантованого значення.
Текст
Спосіб дельта-ущільнення мовних сигналів, що включає кодування вибірок мовного сигналу на основі моделі лінійного прогнозування, який відрізняється тим, що спочатку виконують попередню структуризацію векторів у кодовій книзі згідно з 3 38505 4 чому кожній швидкості відповідає відмінний від Надалі отримані LPC параметри перетворюінших формат кодування і різні формати кодуванються в лінійні спектральні пари (LSP), які, в свою ня відповідають різним наборам параметрів сигчергу, є коренями поліномів: налів, що визначають оцифровані вибірки мовного P(z)=Pp+ 1(z)=Ap(z)+z-(p+1) Ap(z-1); (2) сигналу відповідно до мовної моделі, та формуQ(z)=Qp+1(z)=Ap(z)-z-(p+1) Ap(z-1). (3) вання для даного кадру відповідного пакету даних Коренями даних поліномів P(z) та Q(z) будуть з указаними параметрами сигналів. За основу взязначення хj та уj , що лежать на одиничному колі: то вокодер, побудований на основі моделі лінійноxj=cosw2j-1 ±isinw2j-1; (4) го прогнозування. При кодуванні параметрів мовyj=cosq2j±isinwq2j; 1£j£p/2, (5) ного сигналу використовуються скалярні кодові де {w2j-1} та {q2j} є наборами LSP. Перехід до книги. лінійних спектральних пар дозволяє здійснити поНедоліком наведеного способу є значні сподальше кодування параметрів за допомогою вектворення декодованого сигналу, зумовлені кодуторних кодових книг. Векторна кодова книга місванням параметрів за допомогою скалярних кодотить набір векторів значень LSP, але, оскільки вих книг. За умов передавання однакових обсягів квантизація всього вектора LSP, довжина якого даних, використання скалярних кодових книг пристановить 10 елементів, потребує великого обсягу зводить до більш значних спотворень сигналу, пам'яті та значно ускладнює пошук, використовупорівняно з векторними кодовими книгами. Проте ється розбиття вектора LSP на компоненти і кванзначні обчислювальні витрати при використанні тизація кожного з компонентів окремо. Таким чивекторних кодових книг не дозволяють використоном, враховуючи розбиття вектору, фактично вувати їх у режимі реального часу. формуються окремі кодові книги для кожного підВ основу корисної моделі поставлено задачу вектора. створення способу ущільнення мовних сигналів, Для подальшого скорочення обчислювальних який враховує кореляцію між сусідніми фреймами витрат при пошуку в кодових книгах використовумовного сигналу. За ра хунок цього можливо змеється Їх структуризація - розбиття книги на класи ншити швидкість, необхідну для передавання мовзгідно із заданим критерієм. Для структуризації ного сигналу по каналам зв'язку. Це приводить до кодових книг використовується відношенням слабзменшення вимог до необхідної пропускної спрокого мажорування векторів. Відношення слабкого можності каналу для передачі мовного сигналу, мажорування виконується за таких умов: вектор Y зменшення цін на послуги цифрового зв'язку, збіслабо мажорує Х, якщо виконується нерівність: льшення кількості абонентів систем цифрового k k зв'язку. (6) å xi £ å yi k=1,2, …, n, Поставлена задача досягається тим, що в i =1 i=1 способі дельта-ущільнення мовних сигналів споДля структуризації кодової книги за властивісчатку виконують попередню структуризацію вектотю мажорування створюється додаткова кодова рів у кодовій книзі згідно з відношенням мажорукнига, яка містить відстані від векторів значень вання їх відстаней до заданих точок відліку, далі LSP до заданих n точок відліку V0=(0, 0,.... 0), за допомогою аналого-цифрового перетворювача V1=(N 1, 0,..., 0), ..., Vn-1=(0, 0, ..., N n-1, 0), де n - розперетворюють мовний сигнал в набір оцифровамірність підвектора LSP-параметрів. них вибірок та кодують фрейми отриманих вибірок Оскільки LSP-параметри лежать в межах у вектор коефіцієнтів лінійного прогнозування на (0,4000), обрано значення N1=N2= ... = N n-1=4000. основі моделі лінійного прогнозування, перетвоПерехід від вектора LSP-параметрів X=(x1, x2 , рюють коефіцієнти лінійного прогнозування в вектор лінійних спектральних пар, проводять буфери' ' …, xn) до вектора відстаней X' = ( x1, x '2 ,..., x n ) зазацію групи фреймів, за алгоритмом Вітербі дається формулами: виконують перерахунок цінової функції для квантованих значень фреймів, в канал зв'язку для кожного фрейму передають різницю між індексами в кодовій книзі від поточного до попереднього квантованого значення. Спосіб здійснюється наступним чином: сигнал представляється за допомогою набору параметрів: спектральної обвідної сигналу, що описується коефіцієнтами лінійного прогнозування, періоду основного тону та коефіцієнту підсилення. Оцінка параметрів виконується для кожного фрейму звукового сигналу, довжина яких становить 20мс. Коефіцієнти лінійного прогнозування (LPC), обчислені з використанням моделі лінійного прогнозування, є параметрами передатної функції Ap(z), що описує голосовий тракт людини: p -k , (1) A p (z ) = 1 + å a k × z k =1 ' ' x1 = D( X, V0 ),..., xn = D( X, Vn - 1) , (7) де D - евклідова відстань між векторами, що обчислюється за формулою: D(X, Y) = n å ( xi - yi ) 2 , (8) i=1 Ущільнення LSP-параметрів відбувається за рахунок передачі в канал зв'язку відстані між індексами в кодовій книзі для сусідніх фреймів (дельта-кодування). Основна ідея дельта-ущільнення базується на тому, що квантоване значення наступного за даним вектору LSP-параметрів, як правило, лежить на тому ж чи сусідніх рівнях, за рахунок чого є можливим кодувати вектори як відстані між індексами в структурованій кодовій книзі. Різниця між індексами визначається розміром вікна та є значно меншою за загальну кількість векторів, що дозволяє кодувати її меншою кількістю бітів. 5 38505 6 За рахунок введення затримки в кілька фрейРеалізація алгоритму Вітербі враховує розпомів розглядається не окремий фрейм, а їх сукупділ векторів за рівнями мажоризації, тому цінова ність, що надає змогу додатково корегувати знафункція будується не для кожного вектора у кодочення індексів для підвищення якості вихідного вій книзі, а для кожного рівня мажоризації. Оскільмовного сигналу. Кодування групи фреймів відбуки кількість рівнів мажоризації значно менше за вається за допомогою алгоритму Вітербі. Алгокількість векторів, це дозволяє суттєво заощадити ритм Вітербі забезпечує пошук шляху, цінова фунресурси пам'яті. кція для якого є мінімальною. Цінова функція для У роботі алгоритму можна виділити стадії інірівня l на n-му фреймі Dln обчислюється за форціалізації та виконання. На стадії ініціалізації утвомулою рюються структури даних, необхідні для програми та визначається стартовий рівень, для якого відn стань від початкового весктора - мінімальна. (9) Dln = å Dij , Виконання алгоритму зводиться до перерахуj = n -k нку значення відстані та знаходження мінімальноде n=1,2,...., N - номер фрейма в мовному сигго значення її для кожного рівня після отримання налі, чергового вхідного вектора. Далі аналізуються k - максимально припустима затримка (у рівні, які знаходяться у вікні пошуку і за формулою фреймах), (9) обчислюється сумарна відстань до даного векDij=D(Xi, Xj) - відстань від вектора Xi в кодовій тора за k фреймів, де k - затримка у фреймах. При книзі до вхідного вектора Хj на j-му фреймі, що цьому для кожного рівня знаходиться та зберігаобчислюється за формулою (10). ється в списку траєкторій лише той шлях, для яко10 го відстань мінімальна. 2, d( Xi , X j ) = å c k w k ( Xi [k] - X j [k ]) (10) У канал зв'язку передається індекс "кращого" k =1 вектора для даного рівня. При цьому абсолютне де ck - коефіцієнт зваження, який враховує різзначення цього індексу замінюється на "відносне", ну вагу елементів залежно від позиції, яке обчислюється як різниця між абсолютним знаwk - коефіцієнт зваження елементу, що базученням та індексом початку вікна, з якого даний ється на значенні спектральної потужності сигнавектор є доступним. лу. [ ] Комп’ютерна в ерстка В. Мацело Підписне Тираж 28 прим. Міністерство осв іт и і науки України Держав ний департамент інтелектуальної в ласності, вул. Урицького, 45, м. Київ , МСП, 03680, Україна ДП “Український інститут промислов ої в ласності”, вул. Глазунова, 1, м. Київ – 42, 01601
ДивитисяДодаткова інформація
Назва патенту англійськоюMethod for delta-compression of language signals
Автори англійськоюTkachenko Oleksandr Mykolaiovych, Feferman Oleh Dmytrovych, Khruschak Serhii Viktorovych
Назва патенту російськоюСпособ дельта-уплотнения языковых сигналов
Автори російськоюТкаченко Александр Николаевич, Феферман Олег Дмитриевич, Хрущак Сергей Викторович
МПК / Мітки
МПК: G10L 19/00, G10L 21/00
Мітки: сигналів, дельта-ущільнення, мовних, спосіб
Код посилання
<a href="https://ua.patents.su/3-38505-sposib-delta-ushhilnennya-movnikh-signaliv.html" target="_blank" rel="follow" title="База патентів України">Спосіб дельта-ущільнення мовних сигналів</a>
Попередній патент: Стіна будівлі
Наступний патент: Електрично-керований помножувач частоти
Випадковий патент: Спосіб одержання таблетованого вуглецевого ентеросорбенту