Обробка динамічних властивостей аудіо з використанням перенастройки

Номер патенту: 94968

Опубліковано: 25.06.2011

Автори: Сіфельдт Алан Джеффрі, Гандрі Кеннет Джеймс

Є ще 4 сторінки.

Дивитися все сторінки або завантажити PDF файл.

Формула / Реферат

1. Спосіб обробки звукового сигналу з використанням перенастройки, який полягає в тому, що:

міняють динамічні властивості звукового сигналу відповідно до послідовності операцій регулювання динамічних властивостей,

виявляють подію у часовому розвитку звукового сигналу, при якому рівень звукового сигналу знижується на величину, більшу ніж поріг помітності, Ldrop, в межах часового інтервалу, не більшого ніж друге порогове значення часу, tdrop, при цьому згадане виявлення виявляє зниження рівня звукового сигналу у множині смуг частот, і

перенастроюють послідовність операцій регулювання динамічних властивостей у відповідь на згадане виявлення.

2. Спосіб за п. 1, що додатково містить етапи, на яких:

виявляють подію у часовому розвитку звукового сигналу, при якому рівень звукового сигналу залишається нижчим порогового значення, Lsilence, протягом всього часового інтервалу, не меншого ніж перше порогове значення часу, tsilence, і

перенастроюють послідовність операцій регулювання динамічних властивостей у відповідь на згадане виявлення.

3. Спосіб за п. 1 або 2, в якому перенастройка послідовності операцій регулювання динамічних властивостей прискорює швидкість, з якою обробка динамічних властивостей пристосовується до змін у вхідному сигналі.

4. Спосіб за будь-яким одним з пп. 1-3, в якому перенастройка послідовності операцій регулювання динамічних властивостей встановлює значення одного або більше параметрів керування послідовністю операцій або сигнал, функцією якого є такі один або більше параметрів керування послідовністю операцій, в значення, що зберігається, або значення за умовчанням.

5. Спосіб за будь-яким одним з пп. 1-4, в якому перенастройка послідовності операцій регулювання динамічних властивостей зменшує значення однієї або більше постійних часу, застосовуваних при визначенні одного або більше параметрів керування послідовністю операцій, або сигнал, функцією якого є такі один або більше параметрів керування послідовністю операцій.

6. Спосіб за будь-яким одним з пп. 1-5, що додатково містить етапи, на яких:

приймають сигнал запуску перенастройки, що подається ззовні, який вказує зміну в звуковому сигналі, і

перенастроюють послідовність операцій регулювання динамічних властивостей у відповідь на сигнал запуску перенастройки.

7. Спосіб за п. 6, в якому сигнал запуску перенастройки вказує одну або більше з:

дії користувача, що змінює канал,

дії користувача, що змінює джерела вхідного сигналу,

дії користувача, що вибирає функцію відтворення, перемотки назад або перемотки вперед,

перемикання з одного файла на інший,

зміни програми,

перемикання з одного формату кодування звуку на інший, і

зміни параметрів кодування.

8. Пристрій для обробки динамічних властивостей звукового сигналу, що містить засіб, виконаний з можливістю виконання етапів способу за будь-яким одним з пп. 1-7.

9. Машинозчитуваний носій, що містить комп'ютерну програму, призначену для інструктування комп'ютера на виконання етапів способу обробки динамічних властивостей звукового сигналу з використанням перенастройки за будь-яким одним з пп. 1-7.

Текст

1. Спосіб обробки звукового сигналу з використанням перенастройки, який полягає в тому, що: міняють динамічні властивості звукового сигналу відповідно до послідовності операцій регулювання динамічних властивостей, виявляють подію у часовому розвитку звукового сигналу, при якому рівень звукового сигналу знижується на величину, більшу ніж поріг помітності, Ldrop, в межах часового інтервалу, не більшого ніж друге порогове значення часу, tdrop, при цьому згадане виявлення виявляє зниження рівня звукового сигналу у множині смуг частот, і перенастроюють послідовність операцій регулювання динамічних властивостей у відповідь на згадане виявлення. 2. Спосіб за п. 1, що додатково містить етапи, на яких: виявляють подію у часовому розвитку звукового сигналу, при якому рівень звукового сигналу залишається нижчим порогового значення, Lsilence, протягом всього часового інтервалу, не меншого ніж перше порогове значення часу, tsilence, і перенастроюють послідовність операцій регулювання динамічних властивостей у відповідь на згадане виявлення. 3. Спосіб за п. 1 або 2, в якому перенастройка послідовності операцій регулювання динамічних властивостей прискорює швидкість, з якою обробка динамічних властивостей пристосовується до змін у вхідному сигналі. 2 (19) 1 3 Винахід стосується обробки звукових сигналів. Зокрема винахід стосується процесора або способу обробки динамічних властивостей аудіо, який використовує механізм або послідовність операцій перенастройки, для того щоб швидко пристосуватися до змін контенту в звуковому сигналі. Сигнал перенастройки може формуватися за допомогою аналізу самого звукового сигналу, або перенастройка може запускатися від зовнішньої події, такої як зміна каналу на телевізійному приймачі або зміна вибору входу на аудіо/відео-приймачі. У разі зовнішнього пускового сигналу, одна або більше ознак стану процесора динамічних властивостей для поточного джерела звуку можуть зберігатися і асоціативно зв'язуватися з таким джерелом звуку перед перемиканням на нове джерело звуку. Потім, якщо система перемикається назад на перше джерело звуку, процесор динамічних властивостей може бути перенастроєний на стан, збережений раніше, або його наближення. Винахід також стосується комп'ютерних програм для здійснення таких способів на практиці або керування таким пристроєм. Мета обробки динамічних властивостей аудіо полягає в тому, щоб міняти рівень або динамічні властивості звукового сигналу, щоб були в-межах деяких бажаних меж. Це загалом досягається створенням вимірювання рівня звукового сигналу (наприклад, середньоквадратичного рівня або пікового рівня), що залежить від часу, а потім, обчисленням і застосуванням модифікації сигналу (наприклад, зміни коефіцієнта підсилення), що залежить від часу, яка є функцією оцінки рівня. Процесори динамічних властивостей, що застосовують такий режим роботи, містять в собі автоматичне регулювання підсилення (АРП, AGC), регулювання динамічного діапазону (КДД, DRC), розширювачі, обмежувачі, шумові заслони, і т. д. Різні типи обробки динамічних властивостей сигналів викладені в заявці PCT/US 2005/038579 на видачу міжнародного патенту Алана Джеффрі Шифельда, опублікованій як WO 2006/047600 4 травня 2006 року. Заявка вказує Сполучені Штати серед інших суб'єктів права. Заявка даним включена в склад за допомогою посилання у всій своїй повноті. Фіг. 1 зображує високорівневу структурну схему типового процесора динамічних властивостей аудіо. Може вважатися, що процесор повинен мати два тракти, верхній «сигнальний» тракт 2 і нижній тракт 4 «керування». У нижньому тракті, послідовність операцій керування або контролер 6 динамічних властивостей («Елемент регулювання динамічних властивостей») вимірює рівень звукового сигналу і формує один або більше параметрів модифікації, які залежать від часу як функція вимірювання рівня. Як показано, параметри модифікації виводяться з вхідного звукового сигналу. Як альтернатива, параметри модифікації можуть виводитися з обробленого (вихідного) аудіо або з комбінації вхідного і вихідного звукових сигналів. У верхньому звуковому тракті 2, параметри модифікації, сформовані елементом 6 регулювання ди 94968 4 намічних властивостей, застосовуються до аудіо для формування обробленого аудіо. Застосування параметрів модифікації до звукового сигналу може виконуватися багатьма відомими способами і, загалом, показано символом 8 помножувача. Наприклад, у разі пристрою або послідовності операцій автоматичного регулювання підсилення, може бути єдиний параметр модифікації широкосмугового коефіцієнта підсилення, який регулює коефіцієнт підсилення пристрою або послідовності операцій змінного підсилення/ослаблення в основному тракті. На практиці, аудіо також може затримуватися перед застосуванням параметрів модифікації, для того щоб компенсувати будь-яку затримку, асоціативно пов'язану з обчисленням параметрів модифікації в послідовності операцій регулювання динамічних властивостей. Для простоти в уявленні, затримка не показана на фіг. 1 або інших фігурах в матеріалах даної заявки. У послідовності операцій регулювання динамічних властивостей, типово, що як вимірювання рівня сигналу, так і результуючі параметри модифікації, обчислюються безперервно у часі. У доповнення, будь-яке або обидва з вимірювань рівня сигналу і параметрів модифікації звичайно згладжуються за часом, щоб мінімізувати артефакти, що сприймаються, від внесення в оброблений звук. Згладжування, частіше за все, виконується з використанням «швидкого наростання» і «повільного спаду», що означає, що параметри модифікації змінюються відносно швидко у відповідь на збільшення рівня сигналу і повільно реагують, в той час як рівень сигналу зменшується. Таке згладжування відбувається відповідно до динамічних властивостей природних звуків і способу, яким люди сприймають зміни гучності у часі. Отже, таке часове згладжування є майже універсальним в процесорах динамічних властивостей аудіо. Для деяких додатків обробки динамічних властивостей, постійні часу, асоціативно пов'язані з таким згладжуванням, можуть бути досить великими; близько однієї або більше секунд. Наприклад, АРП може обчислювати оцінку довготривалого середнього рівня сигналу з використанням великих постійних часу, а потім, використовувати результуючу оцінку для формування параметрів модифікації, що повільно міняються, які переміщують середній рівень звуку ближче до необхідного цільового рівня. У цьому випадку, великі постійні часу можуть бути бажані для того, щоб зберігати короткочасні динамічні властивості звукового сигналу. Припустимо, що таке АРП оперує зі звуком телевізійного приймача з метою підтримки погоджувального середнього рівня по програмах і по різних каналах. У такій ситуації, контент звукового сигналу, оброблюваного АРП, може раптово змінюватися або містити стрибок, наприклад, коли змінюється канал, а тому, асоціативно пов'язаний середній рівень звукового сигналу також може раптово змінюватися або містити стрибок. Зі своїми великими постійними часу, однак, АРП вимагає значної кількості часу для сходження до нового рівня і приведення модифікованого рівня оброб 5 94968 6 леного звуку у відповідність до необхідного цільоснює спосіб на практиці) містить в собі зміну динавого рівня. Протягом такого часу адаптації, глядач мічних властивостей звукового сигналу відповідно телебачення може сприймати рівень звуку дуже до послідовності операцій регулювання динамічгучним або дуже приглушеним. Як результат, гляних властивостей, прийом сигналу запуску передач може швидко діставати пульт дистанційного настройки, що подається зовні, який вказує зміну в керування для настроювання тільки рівня гучності, звуковому сигналі, і перенастройку послідовності щоб виявитися таким, хто бореться з АРП, в той операцій регулювання динамічних властивостей у час як вона прямує до межі. відповідь на сигнали запуску перенастройки. СигТипове рішення попереднього рівня техніки нал запуску перенастройки може вказувати одну для щойно описаної проблеми містить в собі викоабо більше з (1) дії користувача, що змінює канал, ристання постійних часу, які пристосовуються на (2) дії користувача, що змінює джерела вхідного основі динамічних властивостей сигналу. Наприсигналу, (3) дії користувача, що вибирає функцію клад, якщо короткочасний рівень сигналу є значно відтворення, перемотки назад або перемотки впебільший або менший, ніж згладжений рівень, як ред, (4) перемикання з одного файлу на інший, (5) визначено декількома межами порогових значень зміни програми, (6) перемикання з одного формату навколо згладженого рівня, то операція згладжукодування звуку на інший, і (7) зміни параметрів вання перемикається на більш швидкі постійні кодування. часу наростання і/або спаду, відповідно, доти, поЗгідно з будь-ким з вищенаведених аспектів, ки короткочасний рівень не відступає в межі граперенастройка послідовності операцій регулюванниць порогових значень навколо згладженого рівня динамічних властивостей може прискорювати ня. Отже, система перемикається назад на вихідні, швидкість, з якою обробка динамічних властивосбільш повільні постійні часу. Така система може тей пристосовується до змін у вхідному сигналі. скорочувати час адаптації АРП, але порогові знаПеренастройка послідовності операцій регулючення і більш короткі постійні часу повинні ретельвання динамічних властивостей встановлює знано вибиратися. Взагалі, для будь-яких прийнятних чення одного або більше параметрів керування порогових значень, можуть існувати сигнали, в послідовністю операцій або сигнал, функцією якояких вихідні необхідні динамічні властивості сигго є такі один або більше параметрів керування налу відхиляються за межі границь порогових знапослідовністю операцій, в значення, що зберігачень навколо середнього рівня, таким чином, приється або значення за умовчанням. Перенастроймушуючи послідовність операцій згладжування ка послідовності операцій регулювання динамічних помилково перемикатися в режим швидкого наровластивостей може зменшувати значення однієї стання або спаду. Внаслідок можливо частого виабо більше постійних часу, застосовуваних при никнення такого помилкового перемикання, посвизначенні одного або більше параметрів керутійні часу режиму швидкого наростання і спаду не вання послідовністю операцій, або сигнал, функціповинні вибиратися дуже короткими, для того щоб єю якого є такі один або більше параметрів керууникнути нестабільності АРП під час нормального вання послідовністю операцій. програмного матеріалу. Як результат, сходження Хоч підхід з адаптивними постійними часу, АРП під час раптових перехідних процесів або описаний вище, може бути до деякої міри корисстрибків в звуковому контенті все ж може не бути ний в скороченні часу адаптації процесора або настільки швидким, наскільки потрібно. послідовності операцій динамічних властивостей Тому, мета даного винаходу полягає в тому, аудіо і може і використовуватися нарівні з аспекщоб запропонувати краще рішення для проблеми тами даного винаходу, такі процесор або послідочасу адаптації обробки динамічних властивостей вність операцій можуть бути значно поліпшені їх протягом змін звукового контенту. нарощуванням явними механізмом або послідовЗгідно з аспектом винаходу, спосіб обробки ністю операцій перенастройки, які приводяться в звукового сигналу (або пристрій, що здійснює сподію при виникненні деяких раптових змін або стрисіб на практиці) містить в собі зміну динамічних бків в контенті звукового сигналу, який є оброблювластивостей звукового сигналу відповідно до пованим. Фіг. 2 зображує даний винахід в узагальнеслідовності операцій регулювання динамічних ному вигляді, в якому додатковий тракт керування, властивостей, виявлення зміни в контенті звуковотракт 10 керування перенастройкою, доданий у го сигналу і перенастройку послідовності операцій вихідний процесор динамічних властивостей за регулювання динамічних властивостей у відповідь фіг. 1. Механізм або послідовність 12 операцій на виявлення такої зміни. Виявлення зміни в конкерування перенастройкою («Елемент керування тенті звукового сигналу може містити одне або перенастройкою») може реагувати на один або обидва з (1) виявлень події у часовому розвитку обидва із самого звукового сигналу (вхідного звузвукового сигналу, при якому рівень звукового сигкового сигналу або комбінації вхідного і вихідного налу залишається нижчим порогового значення, звукових сигналів) і зовнішнього сигналу запуску. Lsilence, протягом всього часового інтервалу, не меТаким чином, є три можливі конфігурації. (1) Сам ншого ніж перше порогове значення часу, tsilence, і звуковий сигнал (який, в свою чергу, може містити (2) виявлення події у часовому розвитку звукового вхідний звуковий сигнал або комбінацію вхідного і сигналу, при якому рівень звукового сигналу знивихідного звукових сигналів), (2) зовнішній сигнал жується на величину, більшу ніж поріг помітності, запуску, і (3) обидва, сам звуковий сигнал і зовніtdrop, в межах часового інтервалу, не більшого, ніж шній сигнал запуску. Якщо елемент 12 керування друге порогове значення часу, tdrop. перенастройкою, механізм або послідовність опеЗгідно з ще одним аспектом винаходу, спосіб рацій керування перенастройкою, відправляє повіобробки звукового сигналу (або пристрій, що здійдомлення перенастройки в елемент 6 регулюван 7 94968 8 ня динамічних властивостей, даючи йому вказівку корпорації Dolby Laboratories Licensing. Наприперенастроїти певні аспекти його стану регулюклад, система кодування звуку формату Dolby вання динамічних властивостей деяким чином, Digital є обов'язковим стандартом запису звуку для який надає обробці динамічних властивостей аудіо телебачення високої чіткості в Сполучених Штаможливість швидко пристосуватися до нового рівтах. На заданому каналі програмування, звук відпня звукового сигналу, який надходить. Перенастравляється безперервно, але формат Dolby Digital ройка деяких аспектів стану регулювання динамічможе змінюватися на границях програми. Наприних властивостей, наприклад, може (1) клад, основна програма може кодуватися у форвстановлювати одну або більше постійних часу в маті каналу 5.1, але комерційна може кодуватися в менше значення на короткий період часу (тим састереофонічному форматі. Декодер Dolby Digital мим, прискорюючи швидкість адаптації обробки обов'язково виявляє такі зміни і може пересилати звуку), і/або (2) встановлювати згладжене вимірюінформацію в процесор динамічних властивостей вання рівня звукового сигналу або одного або біаудіо за даним винаходом як пусковий сигнал пельше параметрів модифікації в збережене значенренастройки. Також можуть застосовуватися інші ня, або в середнє значення, або значення за зміни в параметрах кодув, наприклад, зміни в паумовчанням. раметрі нормалізації діалогу Dolby Digital, Аналіз звукового сигналу для визначення події «DIALNORM», який звичайно зберігається постійраптової зміни або стрибка в контенті сигналу ним для одиночної ділянки контенту. Подібний Рішення про перенастройку може ініціюватися зовнішній пусковий сигнал перенастройки може елементом 12 керування перенастройкою деякою формуватися також з інших форматів кодування, кількістю способів, наприклад, за допомогою анатаких як формат МРЗ і ААС. У доповнення до лізу самого звукового сигналу, який надходить або щойно перерахованих джерел зовнішніх пускових за допомогою прийому зовнішнього сигналу запуссигналів перенастройки, можливі інші, і винахід не ку перенастройки. При аналізі звукового сигналу, мається на увазі обмеженим перерахованими таелемент 12 керування перенастройкою намагаєтькими. ся виявити умови в сигналі, які вказують на раптоУ випадку, коли винахід використовується у ву зміну або стрибок в контенті. При виявленні пристрої, в якому аудіо може виникати з набору такої умови з певною мірою достовірності, елевідомих джерел, винахід може бути додатково мент 12 керування перенастройкою ухвалює ріполіпшений, як показано на фіг. 3. По низу фігури шення про перенастройку і згодом дає елементу 6 зображені N джерела з 14-1 по 14-N звуки (з регулювання динамічних властивостей вказівку «Джерела 1 звуку» по «Джерело N звуку»), де пеперенастроїти один або більше аспектів його старедбачається, що одне з N джерел звуку вибирану регулювання динамічних властивостей. Хоча ється для відтворення через систему обробки диінші технології можуть використовуватися для винамічних властивостей за допомогою пристрою явлення раптових змін або стрибків в контенті сигабо послідовності 16 операцій вибору джерела налу, нижче описані два практичні й ефективні («Елемента вибору джерела»). Такі джерела звуку приклади для виконання цього. Використання зовмогли б представляти, але не як обмеження, різні нішнього пускового сигналу для визначення події канали на телевізорі або телевізійній абонентській раптової зміни приставці, різні входи на аудіо/відео-приймачі, або або стрибка в контенті сигналу різні файли в портативному медіаплеєрі. З кожним У багатьох застосуваннях, високонадійна зовджерелом звуку зберігаються ознаки стану одного нішня інформація може бути такою, що є в розпоабо більше аспектів послідовності операцій регурядженні для запуску перенастройки. Наприклад, лювання динамічних властивостей, як вони мали в телевізійному приймачі або кабельній «телевімісце в останній раз, коли відтворювалося конкрезійній абонентській приставці», дія користувача, тне джерело звуку. Такі аспекти стану регулюванщо змінює канал, може служити як зовнішній пусня динамічних властивостей, наприклад, можуть ковий сигнал перенастройки. До того ж, в телевімістити в собі одне або більше із (1) згладженого зійному або аудіо/відео-приймачі, дія користувача, вимірювання рівня звукового сигналу, (2) один або що змінює джерела вхідного сигналу, наприклад, з більше параметрів модифікації, що є результатом «Відео 1» на «Відео 2», може служити для запуску згладженого вимірювання рівня звукового сигналу, перенастройки. Інші приклади містять в собі осноі (3) одну або більше з постійних часу, застосовуваний на файлах медіаплеєр, наприклад, портативаних при одержанні згладженого вимірювання вний звуковий пристрій або цифровий відеомагнірівня звукового сигналу. У зразковому варіанті тофон. У такому випадку, перенастройка може здійснення, описаному нижче, застосовується запускатися ззовні, коли система завершує відтвозгладжене вимірювання рівня звукового сигналу, рення одного файлу і перемикається на іншій. Пеяке опосередковано впливає на параметр модифіренастройка також могла б запускатися, коли кокації коефіцієнта підсилення (у прикладі, коефіціристувач сам або сама явним чином змінює файл, єнт підсилення є функцією згладженого рівня звунатискає відтворення або швидку перемотку впекового сигналу). Коли інше джерело звуку ред або перемотку назад в нове місцеположення вибирається завдяки послідовності операцій вибона ділянці контенту. У випадку, в якому звук, що є ру джерела, перед фактичним перемиканням на оброблюваним, був декодований із стисненого нове джерело звуку, елемент 16 вибору джерела потоку цифрових даних, наприклад, звуку в форвідправляє зовнішній пусковий сигнал перенастматі Dolby Digital, можуть існувати інші джерела ройки на елемент 12' керування перенастройкою. зовнішнього сигналу запуску перенастройки. Це, в свою чергу, спонукає елемент 12' керування «Dolby» і «Dolby Digital» є торгівельними марками перенастройкою фіксувати ознаки поточного стану 9 94968 10 послідовності операцій регулювання динамічних ройки, послідовність операцій регулювання динавластивостей для поточного відтворення джерела мічних властивостей може перенастроюватися звуку. Елемент 12' керування перенастройкою поцим станом, і існує перепад всього лише в -33 дБ тім зберігає ознаки стану регулювання динамічних (-28 дБ) = -5 дБ. Таким чином, для наближення до властивостей в N місцях з 18-1 по 18-N зберігання необхідного рівня за половину секунди, потрібна стану регулювання динамічних властивостей, асошвидкість адаптації всього лише в -10 дБ на секуціативно пов'язаних з поточним вибором аудіо нду (вимагаючи меншого скорочення постійною (запам'ятовуючих пристроях з 1 по N стану регучасу). Цей приклад ілюструє переваги в збереженлювання динамічних властивостей). Потім, елені останнього стану послідовності операцій регумент 16 вибору джерела перемикається на нове лювання динамічних властивостей у джерела звуджерело звуку і відправляє асоціативно пов'язані ку, яке давало в результаті такий стан. ознаки стану регулювання динамічних властивосРезультат, коли запускається перенастройка тей, що зберігаються, в послідовність операцій Запуск перенастройки прискорює швидкість регулювання перенастройки, які, в свою чергу, адаптації обробки динамічних властивостей аудіо перенастроюють послідовність операцій регулю(швидкість, з якою обробка динамічних властивосвання динамічних властивостей з використанням тей пристосовується до змін у вхідному сигналі). ознак стану, що зберігаються. Наприклад, коли запускається перенастройка, одЗа допомогою використання аспектів останна або більше постійних часу, асоціативно пов'янього стану регулювання динамічних властивостей заних зі швидкістю адаптації, можуть швидко педжерела звуку для перенастройки послідовності ремикатися на значно менші значення, а потім, операцій регулювання динамічних властивостей плавно повертатися до своїх вихідних великих при перемиканні на таке джерело, можуть досягазначень через заданий період часу. Як альтернатися кращі експлуатаційні якості, ніж за відсутності тива, одна або більше постійних часу можуть пезастосування такого вихідного стану. Без такої ремикатися на значно менші значення і залишатиінформації, послідовність операцій регулювання ся в таких значеннях протягом заданого періоду динамічних властивостей покладається на звукочасу. У компонуванні АРП, сигнал c[t] регулювання вий сигнал, що надходить після перенастройки, в постійного часу може вмить зменшувати постійні той час як пристосовується до нового джерела часу, використовувані при обчисленні згладженого звуку. На короткочасній основі, рівень звуку може середнього рівня. Наприклад, постійні часу зглашвидко флуктуювати, а тому, параметри модифіджування можуть бути зменшені протягом тривакації також можуть швидко флуктуювати в міру лості приблизно в одну секунду, яка йде за перетого, як послідовність операцій регулювання династройкою. У зразковому варіанті здійснення, намічних властивостей намагається швидко приссигнал с[t] регулювання постійного часу може потосуватися до нового аудіо. За допомогою викоричинатися зі значення в «1» (вказуючи вплив макстання аспектів останнього стану процесора симальної зміни на одну або більше постійних чадинамічних властивостей, асоціативно пов'язаного су) при виникненні пускового сигналу з джерелом звуку, для перенастройки процесора перенастройки; коли він дорівнює «1», коефіцієнти динамічних властивостей, ймовірно, що процесор зростання і спаду встановлюються в значення, динамічних властивостей буде починати зі стану, значно менші, ніж їх номінальні значення. Оскільки який ближче до стану, до якого він буде прямуваc[t] затухає до нуля через короткий період часу, ти, зрештою, для такого джерела звуку. Як результакий як одна секунда (тривалість періоду часу не тат, швидким постійним часу адаптації після переє критичною), коефіцієнти видозмінюються назад в настройки не треба зменшуватись настільки, свої номінальні звичайні (не перенастроювані) наскільки могло б зажадатися в іншому випадку, значення. Як альтернатива або в доповнення, при тим самим, з наданням поліпшеної стійкості без виникненні пускового сигналу перенастройки, знапринесення в жертву загального часу адаптації. Як чення згладженого середнього рівня, обчисленого приклад, розглянемо перемикання між двома тепослідовністю операцій регулювання динамічних левізійними станціями, першої, зі звуком на середвластивостей, може перенастроюватися на стан, ньому рівні в -15 дБ відносно цифрового значення що зберігається з конкретним джерелом звуку, або повної шкали, і другий, зі звуком на середньому на значення за умовчанням. рівні в -30 дБ, обидві з діапазоном плюс або мінус Фіг. 1 - схематична функціональна структурна 5 дБ навколо своїх відповідних середніх значень. схема, що показує, на високому рівні, вихідний Припустимо, що якраз перед перемиканням на процесор динамічних властивостей аудіо. другу станцію, середній рівень першої станції знаФіг. 2 - схематична функціональна структурна ходиться на -13 дБ. Крім того, припустимо, що сесхема, що показує, відповідно до аспектів даного редній рівень другої станції знаходиться на -33 дБ винаходу, приклад варіанта здійснення даного після перемикання. Це перепад в -20 дБ. Якщо винаходу, в якому, в загальному вигляді, додаткокомусь потрібно, щоб система обробки динамічних вий тракт керування, тракт керування перенаствластивостей адаптувалася за половину секунди, ройкою, доданий у вихідний процесор динамічних наприклад, швидкість адаптації в -40 дБ на секунвластивостей за фіг. 1. ду потрібно при відсутності будь-якої іншої інфорФіг. 3 - схематична функціональна структурна мації. Така швидкість досить швидка і може привсхема, що показує, відповідно до аспектів даного носити нестійкість в оброблений звук. З іншого винаходу, приклад варіанта здійснення даного боку, припустимо, що останній стан обробки динавинаходу, в якому процесор динамічних властивомічних властивостей, збережений у другій станції, стей аудіо додатково поліпшений. відповідає рівню в -28 дБ. Потім, після перенаст 11 94968 12 Фіг. 4 показує зразкову функцію входу/виходу обчислювати такі величини для перекривних блодля типового автоматичного регулювання підсиків відліків цифрового звукового сигналу, які йдуть лення (АРП). один за одним. Це, головним чином, відбувається Фіг. 5 показує набір частотних характеристик внаслідок тієї обставини, що цифрова блокова смуг пропускання, вибраний для імітації критичної обробка корисна для виявлення умов перенастсмугової фільтрації, що спостерігається по базиройки із самого сигналу, як описано пізніше. Даючи лярній мембрані в людському вусі. можливість цифровому звуковому сигналу бути Фіг. 6 - схематична функціональна структурна представленим за допомогою х[n], перекривні блосхема, що показує, відповідно до аспектів даного ки звукового сигналу можуть бути обчислені як: винаходу, приклад варіанта здійснення АРП за x[n, t]  w[n]x[n  tN / 2] for 0  n  N  1 (1) даним винаходом. де N - довжина блока, N/2 - ступінь перекриття Описаний винахід застосовний до широкого між блоками, які йдуть один за одним, t - індекс різноманіття додатків обробки динамічних властиблока, a w[n] - віконна функція, така як синусне востей, таких як регулювання динамічного діапавікно. Для сигналів, що піддаються вибірці на зону, компресори, обмежувачі, розширювачі, і т. д. 44100 Гц, добре працює настройка N=512 або Однак, він особливо корисний, коли застосовуєтьN=1024. Додаткові подробиці про компонування ся до АРП, в якому, типово, великі постійні часу обробки цифрового звуку із застосуванням перекмають наслідком повільну адаптацію за відсутносривних блоків відліків викладені в патенті ті даного винаходу. Таким чином, переважні варіа5,899,969 США Філдера й інших («Frame-based нти здійснення описують, як приклад, застосуванaudio with gain-control words» («Основане на блоня винаходу до АРП. ках аудіо зі словами регулювання підсилення»)), Базова реалізація АРП такий патент даним включений в склад за допомоБазова реалізація АРП обчислює оцінку серегою посилання у всій своїй повноті. Як описано днього рівня сигналу, що залежить від часу і обчинижче, АРП обчислює коефіцієнт G[t] підсилення, слює необхідний модифікований вихідний рівень, що залежить від часу, який потім перемножується який є функцією вхідного рівня і необхідного ціз кожним блоком сигналу. Кожний з цих модифікольового рівня. Модифікація сигналу, що залежить ваних блоків потім додається з перекриттям, щоб від часу потім може обчислюватися як функція створити заключний модифікований звуковий сигперепаду між вхідним рівнем і необхідним вихіднал у[n + tN/2]. ним рівнем. Функція, що відображає вхід у вихід y[n  tN/ 2]  G[t]x[n, t]  G[t  1]x[n  N / 2, t  1] for 0  n  N / 2 (2) призначена для приведення рівня модифікованого Як перший етап при обчисленні коефіцієнта звуку ближче до необхідного цільового рівня, а G[t] підсилення, змінюваний у часі миттєвий рівень фіг. 4 зображує таку функцію входу/виходу. Для сигналу L[t] обчислюється як середньоквадратична вхідного сигналу вище цільового рівня, АРП вимапотужність кожного блока х[n,t]. У децибелах, рігає ослаблення сигналу, а для вхідного сигналу вень обчислюється як: нижче цільового рівня, АРП вимагає підсилення  1 N1  сигналу. Ступінь ослаблення або підсилення може L[ t]  10 log10   x2 [n, t]  (3) N  керуватися зміною нахилу лінії на фіг. 4.  n 0  Теоретично, вимірювання, використовуване де 0 дБ відповідає рівню цифрової прямокутдля обчислення середнього рівня звуку, повинне ної хвилі повної шкали. корелювати з людським сприйняттям гучності. Це Потім, миттєвий рівень може згладжуватися зі може досягатися багатьма способами, наприклад, швидким наростанням і повільним спадом для зваженим вимірюванням середньоквадратичним формування згладженого середнього рівня звукопотужності або вимірюванням психоакустичної вого сигналу L[t]: гучності. Просте незважене вимірювання серед [ t]  L[ t  1]  (1  [ t ])L( t ) L[ t]  Lmin  ньоквадратичної потужності є злегка менш точним, L[ t ]   (4a) L[ t]  Lmin ніж два щойно згаданих способи, але як і раніше L[ t  1]   демонструє високий ступінь кореляції з людським де сприйняттям гучності для більшості звукових сигattack L[ t]  L[ t  1] налів реального світу. Внаслідок своєї обчислюва [ t]   (4b) льної простоти, незважене вимірювання середньоrelease L[ t]  L[ t  1]  квадратичної потужності використовується в переважному варіанті здійснення, але не повинне і розглядатися як таке, що обмежує винахід. release  attack (4с) Хоча, в принципі, аспекти винаходу можуть буКоефіцієнти attack і release згладжування вибити реалізовані аналоговою і/або цифровою галузраються, щоб давати необхідні часи наростання і зю, наскільки можна чекати, практичні реалізації спаду. Одним зі способів задати це є час половинповинні бути реалізовані в цифровій галузі, в якій ного загасання згладжувального фільтра, тобто, кожний із звукових сигналів представлений окречас, який віднімається, щоб імпульсна характерисмими відліками або відліками всередині блоків тика часового згладжувального фільтра затухала даних. Оцінка вхідного рівня і відповідного необдо половини свого вихідного значення. Хоча вибір хідного вихідного рівня, і параметри модифікації аttack, що відповідає часу половинного загасання сигналу можуть обчислюватися безперервно для за 1 секунду, і release, що відповідає часу половинаналогового звукового сигналу, або на основі відного загасання за 4 секунди, добре працює для лік за відліком у цифрового сигналу, але для цього АРП, значення не є критичними. Значення Lmin у зразкового варіанта здійснення, натомість, бажано 13 94968 14 рівнянні 4а представляє мінімальний рівень, вище ням) через заданий період часу. Можливі інші споза який повинен бути миттєвий рівень L[t] сигналу, соби для прискорення швидкості адаптації після для того щоб оновлювався згладжений рівень. Це того, як запущена перенастройка. Наприклад, заоберігає згладжений середній рівень від падіння мість плавного повернення до своїх вихідних знадуже низько, а відповідний коефіцієнт підсилення чень або їх наближень, постійні часу можуть зберівід зростання дуже високо, коли сигнал попадає у гатися на своїх менших значеннях через заданий відносну тишу. За умови, що 0 dB представляє період часу, а потім, повертатися безпосередньо рівень цифрової прямокутної хвилі повної шкали, до своїх вихідних значень або їх наближень. Ще настройка Lmin = -60 dB є прийнятним вибором, одна можливість полягає в тому, щоб забезпечухоча рівень не є критичним. вати стрибкоподібне повернення постійних часу через заданий період часу. Не мається на увазі, Зі згладженого середнього рівня L[ t ] і функції що винахід повинен бути обмежений способом, FAGC входу/виходу, як показано на фіг. 4, обчислюяким постійні часу повертаються до своїх вихідних ється необхідний вихідний рівень Lout [t] . значень або їх наближення. Для запуску перенастройки, може існувати (5) Lout [t]  FAGC L[t] двійковий сигнал R[t] перенастройки, такий R[t] = 0 На закінчення, коефіцієнт G[t] підсилення обпід час нормальної роботи, і R[t] = 1, коли переначислюється по перепаду між вихідним рівнем стройка потрібна на часовому блоці t. Перенастройка може запускатися згідно з аналізом звуковоLout [t] і вхідним рівнем L[ t ] : го сигналу або зовнішнім джерелом, як описано Lout [t]L[ t]/ 20 (6) G[ t]  10 раніше. Подробиці прикладів запуску перенастройки за допомогою аналізу сигналу описані нижКоли Lout [t] > L[ t ] , коефіцієнт підсилення є біче. У разі зовнішнього пускового сигналу, може льшим, ніж одиниця, означаючи, що сигнал посиіснувати збережений стан, яким може перенастлюється, а коли Lout [t] < L[ t ] , коефіцієнт підсироюватися послідовність операцій динамічних властивостей, як показано на фіг. 3. Для описанолення є меншим, ніж одиниця, означаючи, що го переважного варіанта здійснення, такий збересигнал ослаблюється. жений стан може складатися із значення згладжеАРП з перенастройкою Як згадано вище, механізм або функція переного середнього рівня L[ t ] в останньому часовому настройки може викликати одну з двох або обидві блоці, в якому оброблялося конкретне джерело з двох дій: (1) установлення однієї або більше посзвуку. Вихідний стан, витягнутий із запам'ятовуютійних часу в менше значення на короткий період чого пристрою під час запущеної ззовні перенастчасу (тим самим, прискорення швидкості адаптації ройки (або, як альтернатива, вихідний стан може обробки звуку), і (2) установлення згладженого бути значенням за умовчанням, застосовується вимірювання рівня звукового сигналу чи одного або ні перенастройка, що запускається ззовні), або більше параметрів модифікації в збережене може бути представлений значенням Linit . значення чи в середнє значення або значення за По двійковому сигналу R[t] перенастройки, умовчанням, яке може бути виражене як Linit (див. може формуватися сигнал регулювання постійного рівняння 8а, приведене нижче і описи перед і після часу і згодом використовуватися для миттєвого такого рівняння). Передусім, описана перенастскорочення постійних часу, використовуваних при ройка однієї або більше постійних часу. обчисленні згладженого середнього рівня L[ t ] , тим Оскільки параметр модифікації, коефіцієнт G[t] підсилення, є функцією згладженого середнього самим, прискорюючи швидкість адаптації обробки. Сигнал c[t] регулювання постійного часу може обрівня L[ t ] , швидкість, з якою описана АРП присточислюватися, так що він дорівнює «1» в момент, совується до звуку, зумовлена часами наростання коли відбувається перенастройка (R[t] = 1), а потім і спаду, використовуваними при обчисленні L[t]. Як експоненційно затухає до «0» зі швидкістю, керовстановлено вище, такі постійні часу згладжування ваною коефіцієнтом загасання  L[ t ] , коефіціпам'ять або носії, або магнітні або оптичні носії), легкі для читання комп'ютером загального застоєнт підсилення є більшим, ніж одиниця, означаюсування, що програмується або спеціального причи, що сигнал посилюється, а коли Lout [t] < L[ t ] , значення, для конфігурування і керування комп'юкоефіцієнт підсилення є меншим, ніж одиниця, тером, коли запам'ятовуючі носії або пристрої означаючи, що сигнал послаблюється. Коефіцієнт прочитуються комп'ютерною системою, щоб викоG[t] підсилення, що залежить від часу, параметр нувати процедури, описані в матеріалах даної замодифікації, потім подається в пристрій або посліявки. Система, що має ознаки винаходу також модовність 28 операцій «Помножити», де він потім же вважатися реалізованою як машиночитаний перемножується з кожним блоком сигналу х[n,t] запам'ятовуючий носій, сконфігурований комп'юдля створення модифікованого звукового сигналу терною програмою, де запам'ятовуючий носій, у [n+tN/2] (див. рівняння 2). Хоч, як описано, парасконфігурований таким чином, спонукає комп'ютеметр G[t] модифікації коефіцієнта підсилення є рну систему працювати спеціальним і приреченим незалежним від частоти, може обчислювати парачином для виконання функцій, описаних в матеріметр G[b,t] модифікації коефіцієнта, що залежить алах даної заявки. від частоти підсилення, в якому b є індексом сму 21 94968 22 Була описана деяка кількість варіантів здійсописаних в матеріалах даної заявки, можуть бути нення винаходу. Проте, буде зрозуміло, що різні незалежними від черговості і, таким чином, можуть модифікації можуть бути зроблені, не виходячи з виконуватися в черговості, відмінній від тієї, яка суті і обсягу винаходу. Наприклад, деякі з етапів, описана. 23 Комп’ютерна верстка Т. Чепелева 94968 Підписне 24 Тираж 24 прим. Міністерство освіти і науки України Державний департамент інтелектуальної власності, вул. Урицького, 45, м. Київ, МСП, 03680, Україна ДП “Український інститут промислової власності”, вул. Глазунова, 1, м. Київ – 42, 01601

Дивитися

Додаткова інформація

Назва патенту англійською

Audio dynamics processing using a reset

Автори англійською

Seefeldt, Alan, Jeffrey, Gundry, Kenneth, James

Назва патенту російською

Обработка динамических свойств аудио с использованием перенастройки

Автори російською

Сифельдт Алан Джеффри, Гандри Кеннет Джеймс

МПК / Мітки

МПК: H03G 7/00, H03G 3/00

Мітки: аудіо, перенастройки, динамічних, обробка, властивостей, використанням

Код посилання

<a href="https://ua.patents.su/12-94968-obrobka-dinamichnikh-vlastivostejj-audio-z-vikoristannyam-perenastrojjki.html" target="_blank" rel="follow" title="База патентів України">Обробка динамічних властивостей аудіо з використанням перенастройки</a>

Подібні патенти