Спосіб для неруйнівної нормалізації гучності аудіосигналів у портативних пристроях, пристрій, що містить засоби для виконання етапів способу, та носій даних, що записує програму інструкцій, яка виконується прис
Номер патенту: 105277
Опубліковано: 25.04.2014
Автори: Вольтерс Мартін, Шуг Міхєль, Рідміллер Джеффрі С., Мундт Харальд Х.
Формула / Реферат
1. Спосіб декодування вхідного кодованого сигналу для генерування вихідного аудіосигналу, де спосіб включає етапи, на яких:
одержують вхідний кодований сигнал, який містить кодовану аудіоінформацію й супутні метадані, що включають один або більше параметрів керування декодуванням і один або більше перших параметрів, що визначають стиск динамічного діапазону згідно з першим профілем стиску динамічного діапазону, і що факультативно включають один або більше других параметрів, що визначають стиск динамічного діапазону згідно із другим профілем стиску динамічного діапазону, де один або більше перших параметрів мають значення, які були встановлені згідно із процесом кодування, який генерує кодовану аудіоінформацію для виставлення звукових сигналів, що задають, з амплітудами, які не досягають рівня обмеження для відтворення на першому номінальному рівні відтворення, і де один або більше других параметрів мають значення, які були встановлені згідно із процесом кодування, який генерує кодовану аудіоінформацію для виставлення звукових сигналів, що задають, з амплітудами, які не досягають рівня обмеження для відтворення на другому номінальному рівні відтворення, який вище ніж перший номінальний рівень відтворення;
застосовують процес декодування до кодованої аудіоінформації для одержання сигналів піддіапазону, що представляють спектральний склад звукових сигналів, що задають; де процес декодування адаптований у відповідь на один або більше параметрів керування декодуванням;
модифікують сигнали піддіапазону для одержання модифікованих сигналів піддіапазону зі зміненими характеристиками динамічного діапазону, де модифікування адаптується у відповідь на один або більше других параметрів, якщо метадані включають один або більше других параметрів або адаптовані у відповідь на один або більше перших параметрів, якщо метадані не включають один або більше других параметрів;
застосовують блок фільтрів, що синтезують, до модифікованих сигналів піддіапазону для одержання аудіосигналу тимчасової області; та
якщо метадані не включають один або більше других параметрів, застосовують посилення й обмежник до аудіосигналу тимчасової області у відповідь на метадані, причому застосування посилення модифікує аудіосигнал тимчасової області для одержання вихідного аудіосигналу з амплітудами для відтворення на другому номінальному рівні відтворення, причому застосування обмежника запобігає перевищенню рівня обмеження амплітудами вихідного аудіосигналу.
2. Спосіб за п. 1, який відрізняється тим, що один або більше других параметрів представляють відмінності між відповідними параметрами для першого профілю стиску динамічного діапазону й другого профілю стиску динамічного діапазону.
3. Спосіб за п. 1 або 2, який відрізняється тим, що вхідний кодований сигнал відповідає ATSC-стандарту, MPEG-2 ААС-стандарту або MPEG-4 Audio-стандарту, причому перший номінальний рівень відтворення відповідає амплітуді 20 дБ нижче рівня обмеження, а другий номінальний рівень відтворення відповідає амплітуді 11 дБ нижче рівня обмеження.
4. Спосіб кодування вхідного аудіосигналу, що представляє звукові сигнали, що задають, де спосіб включає етапи, на яких:
одержують вхідний аудіосигнал;
застосовують блок фільтрів, що аналізують, до вхідного аудіосигналу для генерування сигналів піддіапазону, що представляють спектральний склад вхідного аудіосигналу;
аналізують один або більше сигналів, добутих із вхідного аудіосигналу для обчислення метаданих, що включають один або більше перших параметрів, що визначають стиск динамічного діапазону згідно з першим профілем стиску динамічного діапазону, й один або більше других параметрів, що визначають стиск динамічного діапазону згідно із другим профілем стиску динамічного діапазону, причому один або більше перших параметрів мають значення, які встановлені для виставлення звукових сигналів, що задають, з амплітудами, які не перевищують рівень обмеження для відтворення на першому номінальному рівні відтворення, причому один або більше других параметрів мають значення, які встановлені для вистави звукових сигналів, що задають, з амплітудами, які не перевищують рівень обмеження для відтворення на другому номінальному рівні відтворення;
застосовують процес кодування до сигналів піддіапазону для одержання кодованої аудіоінформації; та
компонують кодовану аудіоінформацію й метадані у вихідний кодований сигнал, що має придатний формат для передачі або зберігання, причому один або більше других параметрів представляють відмінності між відповідними параметрами для першого профілю стиску динамічного діапазону й другого профілю стиску динамічного діапазону.
5. Спосіб за п. 4, який відрізняється тим, що вихідний кодований сигнал відповідає ATSC-стандарту, MPEG-2 ААС-стандарту або MPEG-4 Audio-стандарту, причому перший номінальний рівень відтворення відповідає амплітуді 20 дБ нижче рівня обмеження і другий рівень відтворення відповідає амплітуді 11 дБ нижче рівня обмеження.
6. Спосіб транскодування вхідного кодованого сигналу для генерування вихідного кодованого сигналу, де спосіб включає етапи, на яких:
одержують вхідний кодований сигнал, який включає першу кодовану аудіоінформацію й супутні метадані, що включають один або більше параметрів керування декодуванням і один або більше перших параметрів, що визначають стиск динамічного діапазону згідно з першим профілем стиску динамічного діапазону, причому один або більше параметрів мають значення, які були встановлені згідно з першим процесом кодування, який генерує першу кодовану аудіоінформацію для вистави звукових сигналів, що задають, з амплітудами, які не перевищують рівня обмеження для відтворення на першому номінальному рівні відтворення;
застосовують процес декодування до першої кодованої аудіоінформації для одержання сигналів піддіапазону, що представляють спектральний склад звукових сигналів, що задають, причому процес декодування адаптований у відповідь на один або більше параметрів керування декодуванням;
аналізують один або більше сигналів, отриманих із сигналів піддіапазону для обчислення одного або більше параметрів, що визначають стиск динамічного діапазону згідно із другим профілем стиску динамічного діапазону, причому один або більше других параметрів мають значення, які встановлені для вистави звукових сигналів, що задають, з амплітудами, які не перевищують рівня обмеження для відтворення на другому номінальному рівні відтворення; та
компонують другу кодовану аудіоінформацію одного або більше перших параметрів і одного або більше других параметрів у вихідний кодований сигнал, що має формат, що підходить для передачі або зберігання, причому друга кодована інформація є кодованим поданням сигналів піддіапазону.
7. Спосіб за п. 6, який відрізняється тим, що один або більше других параметрів представляють відмінності між відповідними параметрами для першого профілю стиску динамічного діапазону й другого профілю стиску динамічного діапазону.
8. Спосіб за п. 6 або 7, який відрізняється тим, що включає застосування блока фільтрів, що синтезують, до сигналів піддіапазону для одержання одного або більше сигналів, які аналізуються для обчислення одного або більше других параметрів, що визначають стиск динамічного діапазону.
9. Спосіб за кожним з пп. 6-8, який відрізняється тим, що включає застосування другого процесу кодування до сигналів піддіапазону для генерування другої кодованої аудіоінформації.
10. Спосіб за кожним з пп. 6-8, який відрізняється тим, що друга кодована аудіоінформація є першою кодованою інформацією.
11. Спосіб за кожним з пп. 6-10, який відрізняється тим, що вхідний кодований сигнал відповідає ATSC-стандарту, MPEG-2 ААС-стандарту або MPEG-4 Audio-стандарту і перший номінальний рівень відтворення відповідає амплітуді 20 дБ нижче рівня обмеження.
12. Спосіб за кожним з пп. 6-10, який відрізняється тим, що вихідний кодований сигнал відповідає ATSC-стандарту, MPEG-2 ААС-стандарту або MPEG-4 Audio-стандарту й другий номінальний рівень відтворення відповідає амплітуді 11 дБ нижче рівня обмеження.
13. Пристрій, що містить засоби для виконання етапів способу за кожним з пп. 1-12.
14. Носій даних, що записує програму інструкцій, які виконуються пристроєм, для виконання етапів способу за кожним з пп. 1-12.
Текст
Реферат: Багато портативних пристроїв не можуть декодувати й відтворювати кодований аудіоконтент, що має широку смугу пропускання й широкий динамічний діапазон з постійною гучністю й розбірливістю, якщо кодований аудіоконтент не був спеціально підготовлений для цих пристроїв. Ця проблема може бути вирішена включенням у кодований контент деяких метаданих, які визначають придатний профіль стиску динамічного діапазону за кожним з абсолютних значень або диференціальних значень щодо іншого відомого профілю стиску. Пристрій відтворення може також адоптивно застосовувати посилення й обмеження до відтвореного аудіо. UA 105277 C2 (12) UA 105277 C2 UA 105277 C2 5 10 15 20 25 30 35 40 45 50 55 60 Перехресні посилання на родинні заявки Дана заявка заявляє пріоритет до попередньої заявки на патент США № 61/303,643, поданої 11 лютого 2010 р., яка повністю включена в даний документ за допомогою посилання. Область техніки Даний винахід відноситься головним чином до кодування й декодуванню аудіо сигналів і відноситься конкретно до технік, які можуть бути використані для кодування й декодування аудіо сигналів для більш широкого діапазону пристроїв відтворення й умов слухання. Рівень техніки Зростаюча популярність переносних і інших типів портативних пристроїв створила нові можливості й стимули для творців і розповсюджувачів медіа контенту для відтворення на цих пристроях, так само як і для розроблювачів і виробників даних пристроїв. Багато портативних пристроїв мають можливість відтворювати широкий спектр типів і форматів медіа контенту, включаючи медіа контент високої якості, із широкою смугою пропускання й широким динамічним діапазоном для HDTV, Blu-ray або DVD. Портативні пристрої можуть використовуватися для відтворення аудіо контенту цього типу або через їхні внутрішні акустичні перетворювачі або через зовнішні акустичні перетворювачі, такі як навушники; однак вони, як правило, не можуть відтворити цей контент із постійною гучністю й розбірливістю через зміну медіа формату й типів контенту. Розкриття винаходу Даний винахід спрямований на надання поліпшених способів для кодування й декодування аудіо сигналів для відтворення на різноманітних пристроях, включаючи переносні й інші типи портативних пристроїв. Різні аспекти даного винаходу викладені в незалежних пунктах формули, наведених нижче. Різні властивості даного винаходу і його кращі варіанти здійснення можуть бути більш зрозумілими при посиланні на наступний розгляд і прикладені графічні матеріали, на яких цифрові позначення позицій відносяться до аналогічних елементів на декількох фігурах. Зміст наступного розгляду й графічних матеріалів викладене тільки в якості прикладів і не повинне тлумачитися як внесення обмежень в обсяг даного винаходу. Короткий опис графічних матеріалів Фіг. 1 являє собою схематичну блок-схему пристрою відтворення. Фіг. 2 являє собою схематичну блок-схему пристрою, що кодує. Фіг. 3-5 являють собою схематичні блок-схеми транскодуючих пристроїв. Фіг. 6 являє собою схематичну блок-схему пристрою, який може бути використане для здійснення різних аспектів даного винаходу. Режими для виконання винаходу A. Подання Даний винахід спрямований на кодування й декодування аудіо інформації для відтворення у важких умовах слухання, з якими зустрічаються користувачі переносних і інших типів портативних пристроїв. Кілька зразків аудіо кодування й декодування описані опублікованими стандартами, такими як описані в «Стандарті цифрового стиску аудіо (AC-3, E-AC-3)», редакція B, документ A/52B, 14 червня 2005, опублікованому Комітетом перспективних телевізійних систем (ATSC) (згаданий тут як «ATSC-стандарт»), а також в ISO/IEC 13818-7, перспективне звукове кодування (AAC) (згадане тут як «MPEG-2 AAC-стандарт»), і ISO/IEC 14496-3, підчастина 4 (згаданий тут як «MPEG-4 Audio-стандарт»), опубліковані Міжнародною організацією по стандартизації (ISO). Кодування й декодування, відповідні до цих стандартів, згадані тут тільки в якості прикладів. Також принципи даного винаходу можуть бути використані із системами кодування, відповідними до інших стандартів. Винахідники виявили, що доступні характеристики пристроїв, відповідних до деяких стандартів кодування, найчастіше є недостатніми для застосувань і умов слухання, типових для переносних і інших типів портативних пристроїв. Коли дані типи пристроїв використовуються для декодування аудіо контенту кодованих вхідних сигналів, відповідних до цих стандартів, декодований аудіо контент часто відтворюється на рівнях гучності, які суттєво нижче, чим рівні гучності аудіо контенту, отриманого за допомогою декодування кодованих вхідних сигналів, спеціально підготовлених для відтворення на цих пристроях. Кодовані вхідні сигнали, що відповідають ATSC-стандарту (згадані тут як «ATSC-сумісні кодовані сигнали»), наприклад, містять кодовану аудіо інформацію й метадані, які описують, як ця інформація може бути декодована. Деякі параметри метаданих визначають профіль стиску динамічного діапазону, який визначає, як динамічний діапазон аудіо інформації може бути стиснутий, коли кодована аудіо інформація декодується. Повний динамічний діапазон декодованого сигналу може бути збережений або може бути стиснутий c мінливими ступенями 1 UA 105277 C2 5 10 15 20 25 30 35 40 45 50 55 60 під час декодування для задоволення вимог різних застосувань і умов слухання. Інші метадані визначають деякий захід гучності кодованої аудіо інформації, такий як середній рівень звукового сигналу в одиницях гучності або рівень діалогу в кодованому сигналі. Ці метадані можуть бути використані для коректування амплітуд декодованого сигналу для того, щоб досягти певної гучності або номінального рівня відтворення під час відтворення. У деяких застосуваннях можуть бути визначені або прийнято один або більше номінальних рівнів відтворення, у той час як в інших застосуваннях користувач має контроль над установкою номінального рівня відтворення. Наприклад, кодування, застосовуване для кодування й декодування ATSCсумісних кодованих сигналів, допускає, що діалог повинен бути відтворено на одному із двох номінальних рівнів відтворення. Один рівень перебуває на 31 дБ нижче рівня обмеження, який є максимально можливим цифровим значенням або верхньою межею виміру (ВМВ), і позначений тут як -31 дБВМВ. Режим декодування, який використовує цей рівень, іноді згадується як «Лінійний режим» і призначений для використання в застосуваннях і умовах, яким відповідає більше широкий динамічний діапазон. Інший рівень установлений на -20 дБВМВ. Режим декодування, який використовує цей другий рівень, часто згадується як «РЧ режим», призначений для використання в застосуваннях і умовах, як ті, з якими зустрічаються в трансляції при модуляції радіочастотних (РЧ) сигналів, де, щоб уникнути перемодуляції, потрібні більше вузькі динамічні діапазони. Для іншого прикладу, кодовані сигнали, які підкоряються стандартам MPEG-2 AAC і MPEG-4 Audio включають метадані, які визначають рівень гучності для кодованої аудіо інформації. Декодування MPEG-2 AAC і MPEG-4 Audio-сумісних кодованих сигналів можуть дозволяти слухачеві визначати бажаний рівень відтворення. Щоб досягти бажаного рівня відтворення декодер використовує бажаний рівень відтворення й метадані усередненої гучності для коректування амплітуд декодованого сигналу. При використанні переносних і інших типів портативних пристроїв для декодування й відтворення аудіо контенту ATSC-сумісних, MPEG-2 AAC-сумісних і MPEG-4 Audio-сумісних кодованих сигналів згідно з даними параметрами метаданих, динамічний діапазон і рівень гучності часто також не підходять із-за несприятливих умов слухання, з якими зустрічаються дані типи пристроїв або через електричні обмеження, обумовлені використанням у даних пристроях більш низьких керуючих напруг. Кодовані сигнали, які відповідають іншим стандартам, використовують схожі типи метаданих і можуть включати умова визначення наміченого рівня гучності відтворення. З такими ж проблемами зустрічаються портативні пристрої, які декодують дані сигнали. Даний винахід може бути використаний для поліпшення якості слухання для користувачів переносних і портативних пристроїв без використання спеціально підготовленого для цих пристроїв контенту. B. Огляд пристрою Фіг. 1 представляє схематичну блок-схему одного типу, що ухвалює/декодувального пристрою 10, який включає різні аспекти даного винаходу. Пристрій 10 одержує кодований вхідний сигнал по каналу 11 сигналу, застосовує відповідні процеси в деформаттері 12 для добування кодованої аудіо інформації й супутніх метаданих із вхідного сигналу, пропускає кодовану аудіо інформацію в декодер 14 і пропускає метадані по каналу 13 сигналу. Кодована аудіо інформація включає кодовані сигнали піддіапазону, що представляють спектральний состав звукових сигналів, що задають, і метадані визначають значення для різних параметрів, що включають один або більше параметрів керування декодуванням і один або більше параметрів, які визначають стиск динамічного діапазону згідно із профілем стиску динамічного діапазону. Термін «профіль стиску динамічного діапазону» відноситься до характеристик таким, як коефіцієнт підсилення, час спрацьовування обмежника стиску й час вивільнення стиску, які визначають експлуатаційні характеристики пристрою стиску динамічного діапазону. Декодер 14 застосовує декодування до кодованої аудіо інформації для одержання декодованих сигналів піддіапазону, які проходять у пристрій 16 керування динамічним діапазоном. Робота й функції декодування можуть бути адаптовані у відповідь на параметри керування декодуванням, отриманих з каналу 13 сигналу. Приклади параметрів керування декодуванням, які можуть бути використані для адаптації роботи й функцій декодування, є параметрами, які визначають число й конфігурацію аудіо каналів, представлених кодованої аудіо інформацією. Пристрій 16 керування динамічним діапазоном факультативно коректує динамічний діапазон декодованої аудіо інформації. Це коректування може бути включене або виключене й адаптовано у відповідь на метадані, отримані з каналу 13 сигналу й/або з керуючих сигналів, які можуть бути надані у відповідь на вхідний сигнал від слухача. Наприклад сигнал, що управляє, 2 UA 105277 C2 5 10 15 20 25 30 35 40 45 50 55 60 може бути наданий у відповідь на використання слухачем вимикача або вибору параметра для пристрою 10. У виконаннях, які відповідають ATSC-стандарту, MPEG-2 AAC-стандарту або MPEG-4 Audioстандарту, наприклад, кодований вхідний сигнал включає кодовану аудіо інформацію, вибудувану в послідовність сегментів або кадрів. Кожний кадр містить кодовані сигнали піддіапазону, що представляють спектральні компоненти аудіо сигналу з його повним динамічним діапазоном. Пристрій 16 керування динамічним діапазоном може не діяти, що дозволяє відтворювати аудіо сигнал з максимальною величиною динамічного діапазону, або воно може модифікувати декодовані сигнали піддіапазону для стиску динамічного діапазону з різним ступенем. Блок 18 фільтрів, що синтезують, застосовує блок фільтрів, що синтезують, до декодованих сигналів піддіапазону, які можуть бути скоректовані пристроєм 16 керування динамічному діапазоном, і забезпечує на своєму виході аудіо сигнал тимчасової області, який може бути цифровим або аналоговим сигналом. Обмежник 20 посилення використовується в деяких варіантах здійснення даного винаходу для коректування амплітуди аудіо сигналу тимчасової зони. Вихід обмежника 20 посилення проходить по каналу 21 для наступного відтворення за допомогою акустичного перетворювача. Фіг.2 представляє схематичну блок-схему, що кодує/передавального пристрою 30, яке включає різні аспекти даного винаходу. Пристрій 30 одержує вхідний аудіо сигнал з каналу 31 сигналу, який представляє звукові сигнали, що задають. Пристрій 30 застосовує блок фільтрів, що аналізують, до аудіо сигналу для одержання сигналів піддіапазону або у виставі в частотній області вхідного аудіо сигналу або в наборі сигналів з обмеженою смугою частот, що представляють вхідний аудіо сигнал. Обчислювач 34 метаданих аналізує вхідний аудіо сигнал та/або один або більше сигналів, отриманих із вхідного аудіо сигналу, як наприклад, модифікована версія вхідного аудіо сигналу або сигналів піддіапазону із блоку 32 фільтрів, що аналізують, для обчислення метаданих, які визначають значення різних параметрів, включаючи параметри керування кодуванням, один або більше параметрів керування кодуванням, один або більше параметрів, які визначають стиск динамічного діапазону згідно із профілем стиску динамічного діапазону. Обчислювач 34 метаданих може аналізувати сигнали тимчасової області, сигнали частотної області або комбінацію сигналів тимчасовий і частотної областей. Обчислення, виконувані обчислювачем 34 метаданих, можуть також бути адаптовані у відповідь на один або більше параметрів метаданих, отриманих з каналу 33. Кодер 36 застосовує кодування до вихідного сигналу блоку 32 фільтрів, що аналізують, для одержання кодованої аудіо інформації, що включає кодовані сигнали піддіапазону, які проходять у форматтер 38. Кодування адаптоване у відповідь на параметри керування кодуванням, отримані з каналу 33. Кодування може також генерувати інші параметри керування декодуванням по каналу 33 для використання процесами в пристрої 10 для декодування й кодування аудіо інформації. Форматтер 38 компонує кодовану аудіо інформацію й щонайменше деякі метадані, що включають один або більше параметрів керування декодуванням і один або більше параметрів, які визначають стиск динамічного діапазону в кодований вихідний сигнал, що має формат, що підходить для передачі або зберігання. У варіантах здійснення, які відповідають ATSC-стандарту, MPEG-2 AAC-стандарту, MPEG-4 Audio-стандарту, наприклад, кодований аудіо сигнал включає кодовану аудіо інформацію, вибудувану в послідовність сегментів або кадрів. Кожний кадр містить кодовані сигнали піддіапазону, що представляють спектральні компоненти аудіо сигналу з його повним динамічним діапазоном, що й мають амплітуди для відтворення на номінальному рівні відтворення. Деформаттер 12, декодер 14, блок 18 фільтрів, що синтезують, блок 34 фільтрів, що аналізують, кодер 36 і форматтер 38 можуть бути традиційними по конструкції й функціонуванню. Кілька прикладів включають відповідні компоненти, що відповідають згаданим раніше опублікованим стандартам. Варіанти здійснення компонентів, певних або запропонованих у цих стандартах, є підходящими для використання з даним винаходом, але не є обов'язковими. Конкретне виконання цих компонентів не є критичним. Фіг. 3-5 представляють схематичні блок-схеми інших варіантів здійснення транскодуючого пристрою 40, які містять деякі компоненти пристрою 10 і пристрою 30, описаних раніше. Ці компоненти функціонують у значній мірі, так само як і їхні еквіваленти. Пристрій 40 показаний на фіг. 3 допускає транскодування кодованого вхідного сигналу, отриманого з каналу 11 у модифіковану версію, яка відповідає тим же стандартам кодування. У даному варіанті здійснення пристрій 40 одержує вхідний кодований сигнал з каналу 11 сигналу, застосовує відповідний процес у деформаттері 12, щоб добути першу кодовану аудіо інформацію й супутні 3 UA 105277 C2 5 10 15 20 25 30 35 40 45 50 55 60 метадані із вхідного кодованого сигналу, пропускає першу кодовану інформацію в декодер 14 і у форматтер 38, і пропускає метадані по каналу 43 сигналу. Перша кодована інформація включає кодовані сигнали піддіапазону, що представляють спектральний состав звукових сигналів, що задають, і визначають значень метаданих для різних параметрів, що включають один або більше параметрів керування декодуванням і один або більше параметрів, які визначають стиск динамічного діапазону згідно з першим профілем стиску динамічного діапазону. Декодер 14 застосовує процес декодування до першої кодованої аудіо інформації для одержання декодованих сигналів піддіапазону. Робота й функції процесу декодування можуть бути адаптовані у відповідь на один або більше параметрів контролю декодування, отримані з каналу 43 сигналу. Сигнали піддіапазону можуть бути або поданням звукових сигналів, що задають, у частотній області або набором сигналів з обмеженою смугою частот, що представляють звукові сигнали, що задають. Обчислювач 44 метаданих аналізує декодовані сигнали піддіапазону й/або один або більше сигналів, добутих з декодованих сигналів піддіапазону для обчислення одного або більше значень параметрів, які визначають динамічний діапазон стиску згідно із другим профілем стиску динамічного діапазону. Наприклад, один або більше сигналів можуть бути добуті за допомогою застосування блоку 18 фільтрів, що синтезують, для декодування сигналів піддіапазону. Обчислення, виконувані обчислювачем 44 метаданих, можуть бути адаптовані у відповідь на метадані, отримані з каналу 43. Блок 18 фільтрів, що синтезують, може бути пропущений у даному варіанті здійснення, якщо для його вихідного сигналу не потрібно обчислення метаданих. Інший варіант здійснення пристрою 40 показаний на фіг. 4. Цей варіант здійснення схожий на представлений на фіг. 3, але включає кодер 36. Включення кодера 36 дозволяє пристрою 40 транскодувати вхідний кодований сигнал, отриманий з каналу 11, який відповідає першому стандарту кодування, у вихідний кодований сигнал, який відповідає другому стандарту кодування, який може бути таким же або відрізнятися від першого стандарту кодування, якщо сигнали піддіапазону двох стандартів кодування сумісні. Це може бути виконане в даному варіанті здійснення при наявності кодера 36 кодування, що застосовує процес, до сигналів піддіапазону для одержання другий кодованої аудіо інформації, яка відповідає другому стандарту кодування. Друга кодована інформація проходить у форматтер 38. Процес кодування може бути адаптований у відповідь на отримані з каналу 43 метадані. Процес кодування може також генерувати інші метадані по каналу 43 для використання процесами, виконуваними в пристрої 10 для декодування кодованої аудіо інформації. Форматтер 38 компонує метадані, отримані з каналу 43 і кодована аудіо інформація, яку він одержує у вихідний кодований сигнал відповідного формату для передачі або зберігання. Ще один варіант здійснення пристрою 40 показаний на фіг. 5. Цей варіант здійснення включає блок 18 фільтрів, що синтезують, який застосовується для декодування сигналів піддіапазону, щоб одержувати виставу тимчасової області або широкосмугова вистава кодованої інформації. Включення блоку 18 фільтрів, що синтезують, і блоку 32, що аналізують фільтрів дозволяє пристрою 40 транскодувати сигнал, головним чином, між будь-якими стандартами кодування. Вихідний сигнал блоку 18 фільтрів, що синтезують, проходить у блок 32 фільтрів, що аналізують, який генерує сигнали піддіапазонів для кодування кодером 36. Кодер 36 застосовує процес кодування до вихідного сигналу блоку 32 фільтрів, що аналізують, щоб одержати другу аудіо інформацію, яка проходить у форматер 38. Процес кодування може також генерувати інші метадані по каналу 43 для використання процесами, виконуваними в пристрої 10 для декодування кодованої аудіо інформації. Обчислювач 44 метаданих може обчислювати значення параметрів метаданих з його аналізу будь-яких або всіх сигналів піддіапазону, отриманих з декодера 14, виходу блоку 18 фільтрів, що синтезують, і вихід блоку 32 фільтрів, що аналізують. Деякі аспекти пристрою 10 і пристрою 30 описані детально далі. Ці описи застосовні до відповідних характеристик пристрою 40. Ці аспекти описані на основі властивостей і характеристик методів і пристроїв, які відповідають згаданому раніше ATSC-стандарту. Ці певні властивості й характеристики розглянуті винятково як приклад. Принципи, що лежать в основі даних варіантів здійснення, безпосередньо застосовні до методів і пристроїв, які відповідають іншим стандартам. C. Приймач/декодер Проблеми відтворення, описані вище, можуть бути адресовано до використання однієї або більше із трьох різних технік, описаних нижче. Перша техніка використовує обмеження посилення й може бути реалізована з характеристиками тільки пристрою 10. Друга й третя техніки використовують стиск динамічного діапазону і їх варіанти здійснення вимагають 4 UA 105277 C2 5 10 15 20 25 30 35 40 45 50 55 60 характеристик і в пристрої 10 і в пристрої 30. 1.Обмежник посилення По першій техніці пристрій 10 працює в РЧ-режимі замість лінійного режиму, так що воно декодує ATSC-сумісний вхідний кодований сигнал за допомогою пристрою 16 керування динамічним діапазоном, забезпечуючи більше високі рівні стиску динамічного діапазону й більше високий номінальний рівень відтворення. Обмежник 20 посилення забезпечує додаткове посилення, збільшуючи ефективний номінальний рівень відтворення до значення від -14 дБВМВ до -8 дБВМВ. Емпіричні результати показують номінальний рівень -11 дБ, що як дає гарні результати для багатьох застосувань. Обмежник 20 посилення також застосовує операцію обмеження щоб уникнути досягнення посиленим цифровим сигналом рівня 0 дБВМВ. Робочі характеристики обмежника можуть впливати на сприйману якість відтвореного аудіо, але конкретний обмежник не є критичним для даного винаходу. Обмежник може бути реалізований, по суті, будь-яким бажаним способом. Переважно обмежник призначений для забезпечення «м'якої» обмежуючої функції замість «твердої» обмежуючої функції. 2. Значення диференціального стиску Друга техніка дозволяє пристрою 10 застосовувати один або більше модифікованих параметрів стиску динамічного діапазону в пристрої 16 керування динамічним діапазоном. Деформаттер 12 одержує значення диференціального параметра стиску динамічного діапазону (СДД) із вхідного кодованого сигналу й пропускає значення диференціального параметра разом зі звичайними значеннями параметра СДД по каналу 13 у пристрій 16 керування динамічним діапазоном. Пристрій 16 керування динамічним діапазоном обчислює одне або більше значень параметра СДД, необхідні згідно з арифметичним комбінуванням звичайних значень параметра СДД із відповідними значеннями диференціального параметра СДД. Використання обмежника 20 посилення в даній ситуації не потрібно. Значення диференціального параметра СДД забезпечуються у вхідному кодованому сигналі пристрою 30, що кодує/передає, яке генерує вхідний кодований сигнал. Це описане нижче. Якщо вхідний кодований сигнал не містить диференціальних значень СДД, пристрій 10 може використовувати обмежник 20 посилення згідно з першою технікою описаної раніше. 3. Особливий профіль стиску Третя техніка дозволяє пристрою 10 застосовувати стиск динамічного діапазону згідно з новим профілем стиску динамічного діапазону в пристрої 16 керування динамічним діапазоном. Деформаттер 12 одержує одне або більше значень параметра СДД для нового профілю із вхідного кодованого сигналу й пропускає їх через канал 13 у пристрій 16 керування динамічним діапазоном. Використання обмежника 20 посилення в даній ситуації не потрібно. Значення параметрів СДД для нового профілю стиску динамічного діапазону забезпечуються у вхідному кодованому сигналі пристрою 30, що кодує/передає, яке генерує вхідний кодований сигнал. Це описано нижче. Якщо вхідний кодований сигнал не містить одне або більше значень параметра СДД для нового СДД профілю пристрій 10 може використовувати обмежник 20 посилення згідно з першою технікою, описаною раніше. D. Кодер/передавач 1. Значення диференціального стиску Розглянутий раніше процес для другої техніки здійснюється в пристрої 10 за допомогою використання значень диференціального параметра СДД, які добуваються із вхідного кодованого сигналу. Ці значення диференціального параметра надаються пристроєм 30, який генерував кодований сигнал. Пристрій 30 надає набір значень диференціальних параметрів СДД, які представляють відмінність між набором значень параметрів СДД, які будуть присутні у кодованому сигналі й набір відповідних базових значень параметрів СДД для нового профілю СДД, які потрібні для запобігання дискретних значень декодованого аудіо сигналу від перевищення 0 дБВМВ для більш високого номінального рівня відтворення. Конкретний спосіб для обчислення значень параметрів СДД не є критичним для даного винаходу. Відомі способи обчислення значень параметрів, які відповідають ATSC стандарту розкриті в “ATSC Recommended Practice: Techniques for Establishing an Maintaining Audio Loudness for Television” Document A/85, 4 листопада 2009, опубліковане Advanced Television Systems Committee, Inc., особливо розділ 9 і додаток F, і в “Dynamic Range Control via Metadata”, Robinson та ін., препринт № 5028, 107 з'їзд Суспільства інженерів звукозапису, Нью-Йорк, вересень 1999. Якщо вихідний кодований сигнал відповідає ATSC-стандарту, MPEG-2 AAC-стандарту або MPEG-4 Audio-стандарту номінальний рівень відтворення підвищується до значення від -14 5 UA 105277 C2 5 10 15 20 25 30 35 40 45 50 55 60 дБВМВ до -8 дБВМВ. Емпіричні результати показують номінальний рівень рівний -11 дБВМВ, що як дає гарні результати для багатьох застосувань. Для ATSC-сумісних вихідних кодованих сигналів обчислювач 34 метаданих обчислює значення диференціального параметра для відповідного базового параметра «compr», певного в стандарті. Форматтер 38 може компонувати значення диференціального параметра в ділянки кожного кадра кодованого сигналу, позначеного як «addbsi» (додаткова інформація бітового потоку) та/або «auxdata» (додаткові дані). Якщо значення диференціального параметра зібрані в ділянки «addbsi» або «auxdata», кодований сигнал буде сумісний з усіма ATSC-сумісними декодерами. Ті декодери, які не розпізнають значення диференціального параметра, усе ще можуть коректно обробляти й декодувати кадри кодованого сигналу, ігноруючи ділянки «addbsi» і «auxdata». Для з'ясування деталей слід звернутися до документа A/52b. Для вихідних кодованих сигналів, які відповідають MPEG-2 AAC або MPEG-4 Audioстандартам форматтер 38 може компонувати значення диференціального параметра в ділянки кожного кадру кодованого сигналу, позначеного як «Fill_Element» або «Data_Stream_Element» у двох стандартах. Якщо значення диференціального параметра зібрані в кожній із цих ділянок, кодований сигнал буде сумісний з усіма декодерами, сумісними зі стандартами MPEG-2 AAC і MPEG-4 Audio. Для з'ясування деталей слід звернутися до документа ISO/IEC 13818-7 і ISO/IEC 14496-3. Значення диференціального параметра можуть бути обчислені й вставлені в кодований сигнал на частоті, яка більше, рівна або менше частоти, на якій значення відповідного базового параметра перебувають у кодованому сигналі. Частота для диференціальних значень може змінюватися. Прапори або біти, які показують, чи може в кодований сигнал також бути включене попереднє диференціальне значення, призначене для повторного використання. 2. Особливий профіль стиску Процеси для третьої техніки, розглянуті раніше, реалізовано в пристрої 10 з використанням значень параметра СДД для нового профілю стиску динамічного діапазону, які добуваються із вхідного кодованого сигналу. Ці значення параметра надаються пристроєм 30, яке генерує кодований сигнал. Пристрій 30 одержує значення параметра СДД для нового СДД профілю за допомогою обчислення значень параметра, які потрібні для запобігання дискретних значень декодованого аудіо сигналу від перевищення 0 дБВМВ для більше високого номінального рівня відтворення. Якщо вихідний кодований сигнал відповідає ATSC, MPEG-2 AAC або MPEG-4 Audioстандартам, обчислювач 34 метаданих обчислює значення стиску СДД, засноване на пропозиції, що номінальний рівень відтворення збільшується до значення від -14 дБВМВ до 8 дБВМВ. Емпіричні результати показують номінальний рівень рівний -11 дБВМВ, що як дає гарні результати для багатьох застосувань. Форматтер 38 може компонувати значення параметра для профілю СДД у ділянки кожного кадра кодованого сигналу, як описано вище для диференціальних параметрів. Використання цих ділянок кадрів дозволяє кодованому сигналу бути сумісним з усіма декодерами, які відповідають відповідному до стандарту. E. Здійснення Пристрою, які включають різні аспекти даного винаходу можуть бути здійснені різними способами, включаючи програмне забезпечення для виконання комп'ютером або яким-небудь іншим пристроєм, який включає більше спеціалізовані компоненти, такі як схема процесора цифрової обробки сигналів (ЦОС), з'єднана з компонентами, подібними тим, які можуть бути знайдені в універсальному комп'ютері. Фіг. 6 представляє схематичну блок-схему пристрою 70, яка може бути використана для здійснення аспектів даного винаходу. Процесор 72 надає обчислювальні засоби. ОЗП 73 - системний оперативний запам'ятовувальний пристрій (ОЗП), використовуване процесором 72 для обробки. ПЗП 74 представляє деякий вид пристрою постійного зберігання, такого як постійний запам'ятовувальний пристрій (ПЗП) для зберігання програм, необхідних для роботи пристрою 70 і, можливо, для виконання різних аспектів даного винаходу. Пристрій 75 керування введенням-виводом представляє інтерфейсну схему для одержання вхідних сигналів і передачі вихідних сигналів через канали 76, 77 зв'язку. У показаному варіанті здійснення всі основні системні компоненти з'єднано із шиною 71, яка може представляти більш ніж одну фізичну або логічну шину; однак, шинна архітектура не обов'язкова для здійснення даного винаходу. У варіантах здійснення, реалізованих на універсальній комп'ютерній системі, додаткові компоненти можуть бути включені для сполучення із пристроями, такими як клавіатура або миша й монітор, і керування пристроєм 78 зберігання, що має носій даних у вигляді магнітної стрічки або диска, або оптичного носія даних. Носій даних може бути використаний для запису програм інструкцій для операційних систем, утиліт і додатків, і може включати програми, які 6 UA 105277 C2 5 10 реалізують різні аспекти даного винаходу. Функції, необхідні для застосування різних аспектів даного винаходу, можуть бути виконані компонентами, які здійснюються широким вибором способів, що включають дискретні логічні компоненти, інтегральні мікросхеми, одну або більше спеціалізованих інтегральних схем та/або процесорів із програмним керуванням. Спосіб, яким реалізуються дані компоненти, не важливий для даного винаходу. Програмні реалізації даного винаходу можуть бути доставлені багатьма машинопрочитуваними засобами, такими як канали з модульованою й немодульованою передачею сигналів зі спектром від ультразвукової частоти до частот ультрафіолетового випромінювання, або носіями даних, які доставляють інформацію, використовуючи головним чином технологію записи, включаючи магнітну стрічку, карти або диски, що й виявляються мітки на носії, включаючи папір. ФОРМУЛА ВИНАХОДУ 15 20 25 30 35 40 45 50 55 60 1. Спосіб декодування вхідного кодованого сигналу для генерування вихідного аудіосигналу, де спосіб включає етапи, на яких: одержують вхідний кодований сигнал, який містить кодовану аудіоінформацію й супутні метадані, що включають один або більше параметрів керування декодуванням і один або більше перших параметрів, що визначають стиск динамічного діапазону згідно з першим профілем стиску динамічного діапазону, і що факультативно включають один або більше других параметрів, що визначають стиск динамічного діапазону згідно із другим профілем стиску динамічного діапазону, де один або більше перших параметрів мають значення, які були встановлені згідно із процесом кодування, який генерує кодовану аудіоінформацію для виставлення звукових сигналів, що задають, з амплітудами, які не досягають рівня обмеження для відтворення на першому номінальному рівні відтворення, і де один або більше других параметрів мають значення, які були встановлені згідно із процесом кодування, який генерує кодовану аудіоінформацію для виставлення звукових сигналів, що задають, з амплітудами, які не досягають рівня обмеження для відтворення на другому номінальному рівні відтворення, який вище ніж перший номінальний рівень відтворення; застосовують процес декодування до кодованої аудіоінформації для одержання сигналів піддіапазону, що представляють спектральний склад звукових сигналів, що задають; де процес декодування адаптований у відповідь на один або більше параметрів керування декодуванням; модифікують сигнали піддіапазону для одержання модифікованих сигналів піддіапазону зі зміненими характеристиками динамічного діапазону, де модифікування адаптується у відповідь на один або більше других параметрів, якщо метадані включають один або більше других параметрів або адаптовані у відповідь на один або більше перших параметрів, якщо метадані не включають один або більше других параметрів; застосовують блок фільтрів, що синтезують, до модифікованих сигналів піддіапазону для одержання аудіосигналу тимчасової області; та якщо метадані не включають один або більше других параметрів, застосовують посилення й обмежник до аудіосигналу тимчасової області у відповідь на метадані, причому застосування посилення модифікує аудіосигнал тимчасової області для одержання вихідного аудіосигналу з амплітудами для відтворення на другому номінальному рівні відтворення, причому застосування обмежника запобігає перевищенню рівня обмеження амплітудами вихідного аудіосигналу. 2. Спосіб за п. 1, який відрізняється тим, що один або більше других параметрів представляють відмінності між відповідними параметрами для першого профілю стиску динамічного діапазону й другого профілю стиску динамічного діапазону. 3. Спосіб за п. 1 або 2, який відрізняється тим, що вхідний кодований сигнал відповідає ATSCстандарту, MPEG-2 ААС-стандарту або MPEG-4 Audio-стандарту, причому перший номінальний рівень відтворення відповідає амплітуді 20 дБ нижче рівня обмеження, а другий номінальний рівень відтворення відповідає амплітуді 11 дБ нижче рівня обмеження. 4. Спосіб кодування вхідного аудіосигналу, що представляє звукові сигнали, що задають, де спосіб включає етапи, на яких: одержують вхідний аудіосигнал; застосовують блок фільтрів, що аналізують, до вхідного аудіосигналу для генерування сигналів піддіапазону, що представляють спектральний склад вхідного аудіосигналу; аналізують один або більше сигналів, добутих із вхідного аудіосигналу для обчислення метаданих, що включають один або більше перших параметрів, що визначають стиск 7 UA 105277 C2 5 10 15 20 25 30 35 40 45 50 55 60 динамічного діапазону згідно з першим профілем стиску динамічного діапазону, й один або більше других параметрів, що визначають стиск динамічного діапазону згідно із другим профілем стиску динамічного діапазону, причому один або більше перших параметрів мають значення, які встановлені для виставлення звукових сигналів, що задають, з амплітудами, які не перевищують рівень обмеження для відтворення на першому номінальному рівні відтворення, причому один або більше других параметрів мають значення, які встановлені для вистави звукових сигналів, що задають, з амплітудами, які не перевищують рівень обмеження для відтворення на другому номінальному рівні відтворення; застосовують процес кодування до сигналів піддіапазону для одержання кодованої аудіоінформації; та компонують кодовану аудіоінформацію й метадані у вихідний кодований сигнал, що має придатний формат для передачі або зберігання, причому один або більше других параметрів представляють відмінності між відповідними параметрами для першого профілю стиску динамічного діапазону й другого профілю стиску динамічного діапазону. 5. Спосіб за п. 4, який відрізняється тим, що вихідний кодований сигнал відповідає ATSCстандарту, MPEG-2 ААС-стандарту або MPEG-4 Audio-стандарту, причому перший номінальний рівень відтворення відповідає амплітуді 20 дБ нижче рівня обмеження і другий рівень відтворення відповідає амплітуді 11 дБ нижче рівня обмеження. 6. Спосіб транскодування вхідного кодованого сигналу для генерування вихідного кодованого сигналу, де спосіб включає етапи, на яких: одержують вхідний кодований сигнал, який включає першу кодовану аудіоінформацію й супутні метадані, що включають один або більше параметрів керування декодуванням і один або більше перших параметрів, що визначають стиск динамічного діапазону згідно з першим профілем стиску динамічного діапазону, причому один або більше параметрів мають значення, які були встановлені згідно з першим процесом кодування, який генерує першу кодовану аудіоінформацію для вистави звукових сигналів, що задають, з амплітудами, які не перевищують рівня обмеження для відтворення на першому номінальному рівні відтворення; застосовують процес декодування до першої кодованої аудіоінформації для одержання сигналів піддіапазону, що представляють спектральний склад звукових сигналів, що задають, причому процес декодування адаптований у відповідь на один або більше параметрів керування декодуванням; аналізують один або більше сигналів, отриманих із сигналів піддіапазону для обчислення одного або більше параметрів, що визначають стиск динамічного діапазону згідно із другим профілем стиску динамічного діапазону, причому один або більше других параметрів мають значення, які встановлені для вистави звукових сигналів, що задають, з амплітудами, які не перевищують рівня обмеження для відтворення на другому номінальному рівні відтворення; та компонують другу кодовану аудіоінформацію одного або більше перших параметрів і одного або більше других параметрів у вихідний кодований сигнал, що має формат, що підходить для передачі або зберігання, причому друга кодована інформація є кодованим поданням сигналів піддіапазону. 7. Спосіб за п. 6, який відрізняється тим, що один або більше других параметрів представляють відмінності між відповідними параметрами для першого профілю стиску динамічного діапазону й другого профілю стиску динамічного діапазону. 8. Спосіб за п. 6 або 7, який відрізняється тим, що включає застосування блока фільтрів, що синтезують, до сигналів піддіапазону для одержання одного або більше сигналів, які аналізуються для обчислення одного або більше других параметрів, що визначають стиск динамічного діапазону. 9. Спосіб за кожним з пп. 6-8, який відрізняється тим, що включає застосування другого процесу кодування до сигналів піддіапазону для генерування другої кодованої аудіоінформації. 10. Спосіб за кожним з пп. 6-8, який відрізняється тим, що друга кодована аудіоінформація є першою кодованою інформацією. 11. Спосіб за кожним з пп. 6-10, який відрізняється тим, що вхідний кодований сигнал відповідає ATSC-стандарту, MPEG-2 ААС-стандарту або MPEG-4 Audio-стандарту і перший номінальний рівень відтворення відповідає амплітуді 20 дБ нижче рівня обмеження. 12. Спосіб за кожним з пп. 6-10, який відрізняється тим, що вихідний кодований сигнал відповідає ATSC-стандарту, MPEG-2 ААС-стандарту або MPEG-4 Audio-стандарту й другий номінальний рівень відтворення відповідає амплітуді 11 дБ нижче рівня обмеження. 13. Пристрій, що містить засоби для виконання етапів способу за кожним з пп. 1-12. 14. Носій даних, що записує програму інструкцій, які виконуються пристроєм, для виконання етапів способу за кожним з пп. 1-12. 8 UA 105277 C2 9 UA 105277 C2 Комп’ютерна верстка А. Крулевський Державна служба інтелектуальної власності України, вул. Урицького, 45, м. Київ, МСП, 03680, Україна ДП “Український інститут промислової власності”, вул. Глазунова, 1, м. Київ – 42, 01601 10
ДивитисяДодаткова інформація
Назва патенту англійськоюSystem and method for non-destructively normalizing loudness of audio signals within portable devices
Автори англійськоюRiedmiller, Jeffrey C., Mundt, Harald H., Schug, Michael, Wolters, Martin
Автори російськоюРидмиллер Джеффри С., Мундт Харальд Х., Шуг Михель, Вольтерс Мартин
МПК / Мітки
МПК: G10L 19/00, H03G 7/00
Мітки: виконується, спосіб, прис, гучності, програму, неруйнівної, засоби, пристроях, способу, портативних, пристрій, інструкцій, аудіосигналів, записує, виконання, етапів, яка, носій, містить, даних, нормалізації
Код посилання
<a href="https://ua.patents.su/12-105277-sposib-dlya-nerujjnivno-normalizaci-guchnosti-audiosignaliv-u-portativnikh-pristroyakh-pristrijj-shho-mistit-zasobi-dlya-vikonannya-etapiv-sposobu-ta-nosijj-danikh-shho-zapisueh-pr.html" target="_blank" rel="follow" title="База патентів України">Спосіб для неруйнівної нормалізації гучності аудіосигналів у портативних пристроях, пристрій, що містить засоби для виконання етапів способу, та носій даних, що записує програму інструкцій, яка виконується прис</a>
Попередній патент: Комплексний бактеріальний препарат екофосфорин для обробки культурних рослин
Наступний патент: Спосіб отримання каталітично активних антитіл (абзимів) із сіалідазною активністю
Випадковий патент: Фітозасіб з активністю щодо вірусу західного нілу