Спосіб усунення часових викривлень сигналу-детонації в аудіозаписах

Завантажити PDF файл.

Формула / Реферат

Спосіб усунення часових викривлень сигналу - детонації в аудіозаписах, який полягає в тому, що звукові фонограми, що відтворюють з носіїв запису, перетворюють у цифрову форму та здійснюють усунення детонації сигналу методом передискретизації - зміни частоти дискретизації, який відрізняється тим, що застосовують сигнал керування зміною частоти дискретизації у вигляді функції зміни висоти тону, яку знаходять шляхом аналізу максимальних значень обчисленого спектра фонограми для оцінки миттєвої частоти тональних компонентів, а потім за допомогою локальних максимумів в значеннях модуля спектра визначають сукупність синусоїдальних складових - частотних треків, які зберігають в матриці даних, після чого проводять нормування даних матриці, а потім обчислюють матрицю даних для знаходження вектор-рядка, що містить значення серединних елементів кожної колонки матриці.

Текст

Реферат: Cпосіб усунення часових викривлень сигналу-детонації в аудіозаписах належить до технології цифрової обробки звукових сигналів з метою покращення звучання відтворених фонограм. UA 103074 C2 (12) UA 103074 C2 Cпосіб полягає в тому, що звукові фонограми, що відтворюються з носіїв запису, перетворюють у цифрову форму та здійснюють усунення паразитної частотної модуляції методом передискретизації, який відрізняється тим, що як сигнал керування зміною частоти дискретизації використовується функція зміни висоти тону, яку знаходять шляхом спектрального аналізу звукової фонограми та обчислення локальних максимумів в значеннях модуля спектра. Технічним результатом, що досягається є підвищення надійності усунення часових викривлень сигналу-детонації в аудіо записах, зчитаних з будь-яких носіїв запису і усунення паразитної частотної модуляції в звукових фонограмах, відтворених з носіїв запису виконаних як акустичним способом, так і електричним способом. UA 103074 C2 5 10 15 20 25 30 35 40 45 50 55 Винахід стосується технології цифрової обробки звукових сигналів з метою покращення звучання відтворених фонограм, в яких присутня детонація. У механічному звукозапису, особливо старому, неможливо отримати сталу швидкість носія запису через обмежену точність механічного приводу. В результаті через нерівномірний рух носія запису виникають різні форми викривлень. Серед них паразитна частотна модуляція або детонація, яку особливо важко усунути. Паразитна частотна модуляція у відтвореному сигналі - це форма деградації сигналу з якою, звичайно, стикаються у фонограмах аналогових носіїв запису - фоноциліндрах, грамплатівках, магнітних стрічках, кіноплівках. На слух такого роду викривлення сигналу сприймаються як плавання й дроблення звуку та зміни висоти тону. І як наслідок низька якість звучання спричинює погіршення сприйняття записів, бо людське вухо надто чутливе до коливань висоти тону. Є кілька закономірних причин, при яких може відбуватися детонація. Однією з них є зміна частоти обертання носія запису протягом процесу реєстрації. Іншою причиною є ексцентриситет як деталей механізмів, так і самого носія запису. Нарешті, деформація із часом відносно м'якого матеріалу фоноциліндра. Детонація - це окремий випадок часових викривлень сигналу. Фізичний механізм прояву ефекту детонації еквівалентний нерівномірній зміні масштабу осі часу. На фіг. 1, a представлено типовий приклад коливань швидкості носія запису w(t). Якщо неспотворену форму хвилі сигналу в часі записати як s(t), а деформовану вісь часу позначити монотонно зростаючою функцією fw(t), тоді викривлений сигнал буде: xt   sfw t  . Якщо функція зміни масштабу часу f w(t) відома (фіг. 1, б), тоді можливе відновлення неспотвореної форми хвилі сигналу s(t) як  st   z f w1 t  . Усунення детонації, таким чином, в основному співвідноситься із знаходженням функції зміни масштабу часу, що еквівалентно функції зміни висоти тону (функції "детонації") рw(t): dfw t  . p w t   dt Відомий спосіб вирішення проблеми часових викривлень сигналу-детонації, в якому застосовується техніка запису із пілот-тоном (контрольним сигналом) на магнітних стрічках [1, 2], на кіноплівках [3]. В цьому випадку додатковий сигнал пілот-тон записується одночасно зі звуковим сигналом окремою доріжкою. При відтворенні стрічки сигнал пілот-тону з контрольної доріжки підсилюється і обмежується. Так отримується контрольний сигнал, який надходить до частотного детектора. Якщо в записі присутній компонент детонації, то контрольний сигнал буде частотно-модульованим і на виході частотного детектора виділятиметься напруга, яка пропорційна зміні частоти. Цей сигнал напруги надходить до блока керування швидкістю обертання двигуна. Таким чином отримується нормальна швидкість руху стрічки і усувається детонація. Відомий спосіб вирішення проблеми часових викривлень сигналу-детонації, в якому застосовується техніка запису із пілот-тоном (контрольним сигналом) на магнітних стрічках [4], грамплатівках [5], кіноплівках [6]. В цьому випадку додатковий сигнал пілот-тону частотою ультразвукового або дозвукового (інфразвукового) діапазону частот спеціально вводиться під час запису в звуковий сигнал або записується окремою доріжкою на носії запису. При відтворенні запису звуковий сигнал оцифровується і подається до оперативної пам'яті, а сигнал пілот-тону детектується і подається на схему управління тактовою частотою пристрою затримки сигналу (оперативної пам'яті), який в свою чергу змінює вихідний сигнал пристрою відтворення шляхом відхилення частоти вибірки оцифрованого сигналу. Цим відомим способам властиві вагомі загальні недоліки, що приводять до обмеження області їхнього застосування. Перший недолік полягає в тому, що при неправильному зберіганні стрічки, її розтягненні або інших фізичних ушкодженнях носія запису, контрольний сигнал пілот-тону не буде відповідати справжньому, внаслідок чого виникнуть помилки в його детектуванні. Другий недолік - аудіозаписи фонограм повинні бути записані та відтворені на спеціальному обладнанні і обов'язково мати записаний сигнал пілот-тону, що дуже сильно обмежує використання цих способів. Найбільш близький спосіб до даного технічного рішення, що був обраний за прототип, описаний у патенті US7933084 "Corrective adjustment of recording characteristics in digital renditions of analog recordings" [7], в якому для аналізу нерівномірності швидкості носія запису і   1 UA 103074 C2 5 10 15 20 25 30 35 40 45 50 55 усунення коливань тону застосовуються сучасні методи цифрової обробки сигналів. Цей спосіб не потребує наявності сигналу пілот-тону. Відомий спосіб передбачає, що як контрольний сигнал пілот-тону можна використовувати так звані артефакти, що є наявними в записах і які не були присутніми в оригінальному сигналу запису. У випадку магнітного запису артефактами є сигнал високочастотного підмагнічування частотою 38-120 кГц та сигнал мережевої перешкоди частотою 50 або 60 Гц. Відтворені записи із грамплатівок мають сигнал мережевої перешкоди частотою 50 або 60 Гц. Сигнал високочастотного підмагнічування із відтвореної фонограми виділяється за допомогою цифрової фільтрації. Сигнал аудіозапису пропускають через фільтр 8-го порядку із частотою зрізу 38 кГц, і потім на схему автоматичного регулювання посилення. Далі сигнал передається через фільтр 4-го порядку з обрізанням близько 400 кГц. Потім сигнал дискретизується із частотою вибірки в межах 80-120 кГц. Частота вибирається DSP (цифровим сигнальним процесором) так, щоб мати максимальний динамічний діапазон для частотно-модульованих коливань сигналу високочастотного підмагнічування. Таким чином отримується сигнал зміни швидкості руху носія запису, тобто функція зміни висоти тону. Оцифрований сигнал аудіозапису подається в буфер (оперативну пам'ять) з якого цифрові відліки сигналу зчитуються з тактовою частотою, яка змінюється у відповідності до отриманої функції зміни висоти тону, усуваючи викривлення в звуковому сигналі, які викликані детонацією. Недоліком відомого способу є та обставина, що дуже важко записати такий високочастотний сигнал на апаратурі магнітного запису звукового сигналу. Це можливо тільки на професійній студійній апаратурі, де швидкість запису 38 м/с і вище. Цей підхід більше стосується записів магнітних відеострічок. Тому також існує обмежена наявність записів архівних звукових фонограм з таким рівнем запису амплітудно-частотної характеристики. Також, дуже вагомим істотним недоліком відомого способу є те, що усувати паразитну частотну модуляцію (детонацію) у відтворених звукозаписах можливо тільки з носіїв інформації, що були записані електричним способом запису. Як відомо, перші записи звукового сигналу були здійснені акустичним способом на фоноциліндрах (воскових валиках Едісона) та грамплатівках. І саме вони мають найбільшу ступінь ушкодження паразитною частотною модуляцією. Тому, до таких носіїв запису запропоновані вище способи неможливо застосувати. В основу винаходу поставлено задачу усунення часових викривлень сигналу - детонації в аудіозаписах, який забезпечує відновлення аудіоінформації, що ушкоджена паразитною частотною модуляцією, з будь-яких носіїв запису, включаючи записи здійснені акустичним способом на фоноциліндрах і грамплатівках. Поставлена задача вирішується тим, що усунення часових викривлень сигналу - детонації в аудіозаписах відбувається методом передискретизації звукового сигналу, при цьому фонограма аудіозапису попередньо перетворена в цифрову форму. Як сигнал керування зміною частоти дискретизації використовується функція зміни висоти тону, яку знаходять шляхом аналізу максимальних значень обчисленого спектра фонограми для оцінки миттєвої частоти тональних компонентів, а потім за допомогою локальних максимумів в значеннях модуля спектра визначають сукупність синусоїдальних складових - частотних треків, які зберігають в матриці даних, після чого проводять нормування даних матриці, а потім обчислюють матрицю даних для знаходження вектор-рядка, що містить значення серединних елементів кожної колонки матриці. Використання як контрольного сигналу пілот-тону функції зміни висоти тону, отриманої за допомогою математичних обчислень із спектра відтвореного сигналу звукової фонограми, забезпечує усунення паразитної частотної модуляції як з раритетних носіїв запису, виконаних акустичним способом, так і з носіїв запису виконаних електричним способом. Пропонований спосіб не потребує наявних в аудіозаписах артефактів, таких як сигнал високочастотного підмагнічування та сигнал мережевої перешкоди. Суть винаходу пояснюється наступними кресленнями. На фіг. 2 подана блок-схема процесу по відновленню звукового сигналу, ушкодженого паразитною частотною модуляцією, для реалізації запропонованого способу. На фіг. 3,а представлено зображення сонограми сигналу тривалістю 2 сек, а на фіг. 3,б відповідні їй частотні треки. На фіг. 4,а графічно представлена функція зміни висоти тону pw(t) за результатами обчислення даних матриці, яка відповідна частотним трекам, зображеним на фіг. 3,б. На фіг. 4,б наведено результат згладжування даних функції зміни висоти тону pw(t). На фіг. 5 представлено результат процесу відновлення звукового сигналу у вигляді сонограм сигналів. На фіг. 5,а представлена сонограма сигналу із наявною паразитною 2 UA 103074 C2 5 10 частотною модуляцією, а на фіг. 5,б відповідно сонограма відновленого сигналу, в якому відсутня паразитна частотна модуляція. У способі, що заявляється, усунення часових викривлень сигналу-детонації вирішується у два етапи: 1) знаходження функції зміни висоти тону (функції "детонації") і 2) компенсація детонації за допомогою операції передискретизації. Як випливає з наведеної блок-схеми (фіг. 2), процедура детектування детонації, тобто ~ знаходження функції зміни висоти тону p w t  складається із чотирьох кроків. На першому кроці застосовується розкладання сигналу на спектральні складові за допомогою короткочасного перетворення Фур'є [8]: N1 Xn   xk   w k   e j 2 nk N , k 0 15 20 25 30 35 40 45 50 55 де х(k) - послідовність вхідних відліків; n - індекс перетворення в частотній області; N довжина вагового вікна; w(k) - вагове вікно. При цьому довжина вагового вікна вибирається достатньо невеликою, так щоб частотні компоненти в окремому блоці даних були майже однаковими. Типові значення довжини вікна при звуковому сигналі частотою дискретизації 44,1 кГц - 512, 1024 і 2048 відліків, при частоті дискретизації 22,05 кГц - 256, 512 і 1024 відліків. Потім проводиться аналіз максимальних значень обчисленого спектра для оцінки миттєвої частоти тональних компонентів у кожному блоці даних. Для цього використовується синусоїдальний аналіз/синтез запропонований МакАулау та Кватієрі для обробки голосу [9]. Передумовою для методу МакАулау та Кватієрі є те, що звук може бути представлений, як сукупність синусоїдальних складових (так званих треків), кожен з яких змінює з часом амплітуду і частоту. Максимальне значення визначається як локальний максимум в значеннях модуля спектру за правилом: найбільше із двох суміжних відліків, тобто Xn  1  Xn  Xn  1 . Максимуми в сусідніх блоках даних порівнюються і якщо їх значення частоти подібні то вони сполучаються. Наближеність до значень подібності частоти визначається параметром контролю відхилень від максимуму. Безперервний ланцюг цих сполучених максимумів називається частотним треком. Максимум, який не сполучається являє собою початок або кінець треку. Процес створення частотних треків відбувається за таких умов: 1) якщо наступний максимум узгоджується з інтервалом відхилень, то траєкторія треку подовжується; 2) якщо не узгоджується, то трек закінчується; 3) якщо трек знаходить узгодження із максимумом який вже присутній в іншому треку, то з двох треків буде подовжений той, до якого це максимум ближче, а інший трек закінчиться. Прораховані таким чином частотні треки зберігаються в матриці даних Z. Колонки матриці Z співвідносяться з колонками матриці розгорнутого в часі спектра (сонограми), однак вони містять тільки інформацію, що описує синусоїдальний склад сигналу. Нагадаємо, що сонограма являє собою діаграму розподілу спектральної енергії сигналу в координатах частоти й часу. При цьому по вертикалі відкладається частота, по горизонталі - час, а колір (або відтінок сірого) указує на амплітуду спектра. На фіг. 3,а представлена сонограма фрагмента фонограми звукового сигналу з частотою дискретизації 22,05 кГц зчитаного із фонографічного циліндра, який ушкоджений паразитною частотною модуляцією, а на фіг. 3,б відповідні їй частотні треки. Наступним кроком процесу усунення детонації є отримання функції зміни висоти тону pw(t) після відповідних обчислень матриці даних Z, в якій міститься інформація про частотні треки. Спочатку проводиться нормування Z для того, щоб значення величин даних матриці були співрозмірні зі значеннями величин функції зміни висоти тону. Процедура нормування Z обчислюється наступним виразом: Zn, t  , n=1…N, Rn, t   max Zn де n - номер частотного трека (номер рядка матриці Z); t - часовий індекс (номер колонки матриці Z); N - кількість рядків матриці Z, max{z(n)} - максимальне значення в рядку n матриці Z. Функція зміни висоти тону pw(t) знаходиться як вектор-рядок, що містить значення серединних елементів кожної колонки матриці R(n,t): pw(t) = median(R(1,t) R(2,t) ... R(N,t)). При значеннях функції pw(t) = 1 зміни висоти тону не відбувається. Тому для правильної оцінки функції pw(t) необхідно провести корекцію рівнів даних (тобто зрівноважити) навколо 3 UA 103074 C2 5 10 одиниці. Обчислена, таким чином, функція зміни висоти тону pw(t), яка відповідна частотним трекам зображеним на фіг. 3,б, графічно представлені на фіг. 4. Для видалення можливих викидів та різких змін висоти тону проводиться згладжування даних за допомогою методу ковзної середньої, що сприяє стійкій оцінці детонації (фіг. 4,б). ~ Отримана, таким чином, функція зміни висоти тону p w t  дозволяє реконструювати деградований сигнал, у якому присутня детонація. Оскільки деградований сигнал можна розглядати як неспотворений звуковий сигнал з нерівномірною дискретизацією, тоді можливе відновлення деградованого сигналу використовуючи особливу техніку передискретизації [10], тобто реконструювати рівномірні відліки оцифрованого сигналу. Зауважимо, що зміни висоти тону відбуваються дуже повільно порівняно із частотою дискретизації. Таким чином, в кожний момент часу можливо апроксимувати нерівномірні відліки ~ вхідного сигналу як рівномірні з частотою дискретизації F'  F  p w t  . ~ Отже, після знаходження функції зміни висоти тону p t  переходимо до другого етапу w 15 20 25 30 35 40 45 50 55 вирішення задачі по усуненню паразитної частотної модуляції в звуковому сигналі - операції передискретизації. Для виконання операції передискретизації автори використали спосіб динамічного перетворення частоти дискретизації на основі поліфазного фільтра докладно описаний в роботі [11]. В якості сигналу керування зміною частоти використовується функція ~ зміни висоти тону p w t  . Результати процесу усунення часових викривлень сигналу-детонації в аудіозаписах представлено на фіг. 5,б у вигляді сонограми сигналів. На фіг. 5,а представлена сонограма сигналу із наявною паразитною частотною модуляцією, а на фіг. 5,б відповідно сонограма відновленого сигналу, в якому відсутня паразитна частотна модуляція. Для наведеного вище прикладу був використаний фрагмент фонограми звукового сигналу зчитаний із фонографічного циліндра. Для оцінки ступеня придушення паразитної частотної модуляції використано непрямий метод, через неможливість використання вимірювального приладу-детонометра. тому що в фонограмі звукового сигналу відсутній вимірювальний сигналу частотою 3150 Гц, який необхідний при вимірюванні коефіцієнта детонації. Таким чином, вимірюючи на сонограмі девіацію частоти якого-небудь частотного треку можна одержати коефіцієнт паразитної частотної модуляції. Наприклад, на фіг. 5,а відхилення частотного треку лежать у межах 9531031 Гц. Отже, повна зміна частоти дорівнює 78 Гц, або 7,56 %. Після відновлення деградованого сигналу відхилення того ж частотного треку тепер лежать у межах 985-992 Гц (фіг. 5,б) і повна зміна частоти дорівнює 7 Гц, або 0,704 %. Аналіз отриманих результатів свідчить про те, що придушення паразитної частотної модуляції відбувається більш ніж в 10 разів. Це підтверджує досягнення технічного результату при здійсненні заявленого способу і його можна використовувати для усунення паразитної частотної модуляції в звукових фонограмах відтворених з носіїв запису виконаних як акустичним способом, так і електричним способом. Джерела інформації: 1. Патент Японії JP57158057, МПК G11В 15/52, пріоритет 29.09.1982. 2. Daniel E. D., Мее C. D., Clark M. H. Magnetic Recording: The First 100 Years. - IEEE Press, New York, 1999. - P. 341. 3. Read P., Meyer M. P. Restoration of Motion Picture Film. - Butterworth Heinemann. Oxford, UK, 2000. - P. 388. 4. Патент США US4535368, МПК G11В 5/02, пріоритет 13.08.1985. 5. Патент Японії JP58080102, МПК G11В 20/22, пріоритет 14.05.1983. 6. Патент США US3832045, МПК G03B 31/02, пріоритет 27.08.1974. 7. Патент США US7933084, МПК G11В 5/02, пріоритет 26.04.2011. 8. Рабинер Л. Р., Шафер Р. В. Цифровая обработка речевых сигналов. Пер. с англ. М. В. Назарова, Ю. Н. Прохорова. - М.: Радио и связь, 1981. - 312 с. 9. McAulay R. J., Quatieri T. F. Speech Analysis / Synthesis Based on a Sinusoidal Representation // IEEE Transactions on Acoustics, Speech, Signal Processing. - 1986, August. - Vol. 34. - p. 744-754. 10. Crochiere R., Rabiner L. R. Multirate Digital Signal Processing. - Englewood Cliffs, NJ : Prentice-Hall, 1983. 11. Косяк І. В. Динамічне перетворення частоти дискретизації на основі поліфазного фільтра // Реєстрація, зберігання і оброб. даних. - 2009. - Т. 11, № 4. - С.68-77. 4 UA 103074 C2 ФОРМУЛА ВИНАХОДУ 5 10 Спосіб усунення часових викривлень сигналу-детонації в аудіозаписах, який полягає в тому, що звукові фонограми, що відтворюють з носіїв запису, перетворюють у цифрову форму та здійснюють усунення детонації сигналу методом передискретизації - зміни частоти дискретизації, який відрізняється тим, що застосовують сигнал керування зміною частоти дискретизації у вигляді функції зміни висоти тону, яку знаходять шляхом аналізу максимальних значень обчисленого спектра фонограми для оцінки миттєвої частоти тональних компонентів, а потім за допомогою локальних максимумів в значеннях модуля спектра визначають сукупність синусоїдальних складових - частотних треків, які зберігають в матриці даних, після чого проводять нормування даних матриці, а потім обчислюють матрицю даних для знаходження вектор-рядка, що містить значення серединних елементів кожної колонки матриці. 5 UA 103074 C2 6 UA 103074 C2 Комп’ютерна верстка А. Крулевський Державна служба інтелектуальної власності України, вул. Урицького, 45, м. Київ, МСП, 03680, Україна ДП “Український інститут промислової власності”, вул. Глазунова, 1, м. Київ – 42, 01601 7

Дивитися

Додаткова інформація

МПК / Мітки

МПК: G11B 20/22, G06F 17/00, G11B 7/28, G11B 20/10, G11B 27/031

Мітки: викривлень, аудіозаписах, сигналу-детонації, спосіб, усунення, часових

Код посилання

<a href="https://ua.patents.su/9-103074-sposib-usunennya-chasovikh-vikrivlen-signalu-detonaci-v-audiozapisakh.html" target="_blank" rel="follow" title="База патентів України">Спосіб усунення часових викривлень сигналу-детонації в аудіозаписах</a>

Подібні патенти