Мікшування аудіопотоку з нормалізацією діалогового рівня
Номер патенту: 105590
Опубліковано: 26.05.2014
Автори: Грьошель Александер, Шільдбах Вольфганг А., Уільямс Філіп А., Купер Джарет А.
Формула / Реферат
1. Спосіб мікшування двох вхідних звукових сигналів у єдиний, зведений звуковий сигнал з підтримкою сприйманого рівня звуку зведеного звукового сигналу, при цьому спосіб включає етапи, на яких:
приймають основний вхідний звуковий сигнал;
приймають зв'язаний вхідний звуковий сигнал; причому зв'язаний вхідний звуковий сигнал з'єднують із основним вхідним звуковим сигналом;
приймають метадані мікшування, які містять інформацію масштабування, призначену для масштабування основного вхідного звукового сигналу і які визначають яким чином повинні бути мікшовані основний вхідний звуковий сигнал і зв'язаний вхідний звуковий сигнал, для того щоб генерувати зведений звуковий сигнал на сприйманому рівні звуку; причому інформація масштабування з метаданих мікшування містить масштабний коефіцієнт метаданих для основного вхідного звукового сигналу, для масштабування основного вхідного звукового сигналу щодо зв'язаного вхідного звукового сигналу;
приймають вхідний сигнал балансу мікшування, який указує регульований баланс між основним вхідним звуковим сигналом і зв'язаним вхідним звуковим сигналом, причому вхідний сигнал балансу мікшування містить інформацію масштабування, яка дозволяє відхилення від зважування основного вхідного звукового сигналу й зв'язаного вхідного звукового сигналу у зведеному звуковому сигналі, як визначено в метаданих мікшування;
ідентифікують переважний сигнал або як основний вхідний звуковий сигнал, або як зв'язаний вхідний звуковий сигнал з інформації масштабування, що надається метаданими мікшування, і із вхідного сигналу балансу мікшування, де відповідний інший вхідний сигнал тоді ідентифікують як непереважний сигнал; і
де переважний сигнал ідентифікують за допомогою порівняння вхідного сигналу балансу мікшування з масштабним коефіцієнтом метаданих для основного вхідного звукового сигналу;
масштабують непереважний сигнал щодо переважного сигналу; і
поєднують масштабований непереважний сигнал з переважним сигналом для вироблення зведеного звукового сигналу.
2. Спосіб за п. 1, який відрізняється тим, що додатково включає етап, на якому:
визначають масштабний коефіцієнт, призначений для масштабування непереважного сигналу, на основі інформації масштабування з метаданих мікшування й вхідного сигналу балансу мікшування;
де визначений масштабний коефіцієнт використовують для масштабування непереважного сигналу.
3. Спосіб за будь-яким з пп. 1-2, який відрізняється тим, що
якщо значення вхідного сигналу балансу мікшування більше, ніж масштабний коефіцієнт метаданих для основного вхідного звукового сигналу з метаданих мікшування,
то зв'язаний вхідний звуковий сигнал визначають як той, що є переважним сигналом;
інакше - основний вхідний звуковий сигнал визначають як той, що є переважним сигналом.
4. Спосіб за будь-яким з пп. 1-3, який відрізняється тим, що зв'язаний вхідний звуковий сигнал ідентифікують як той, що є переважним сигналом, де спосіб додатково включає етап, на якому:
обчислюють масштабний коефіцієнт для основного вхідного звукового сигналу як масштабний коефіцієнт метаданих для основного вхідного звукового сигналу з метаданих мікшування мінус значення вхідного сигналу балансу мікшування.
5. Спосіб за будь-яким з пп. 1-3, який відрізняється тим, що основний вхідний звуковий сигнал ідентифікують як той, що є переважним сигналом, де спосіб додатково включає етап, на якому:
обчислюють масштабний коефіцієнт для зв'язаного вхідного звукового сигналу як значення вхідного сигналу балансу мікшування мінус масштабний коефіцієнт метаданих з метаданих мікшування для основного вхідного звукового сигналу.
6. Спосіб за будь-яким з пп. 1-5, який відрізняється тим, що метадані мікшування втримуються у зв'язаному вхідному звуковому сигналі.
7. Спосіб за будь-яким з пп. 1-6, який відрізняється тим, що основний вхідний звуковий сигнал містить кілька звукових каналів.
8. Спосіб за п. 7, який відрізняється тим, що метадані мікшування додатково включають:
первинний масштабний коефіцієнт метаданих для основного вхідного звукового сигналу щодо зв'язаного вхідного звукового сигналу; та
один або кілька масштабних коефіцієнтів метаданих для різних каналів основного вхідного звукового сигналу щодо зв'язаного вхідного звукового сигналу.
9. Спосіб за будь-яким з пп. 1-8, який відрізняється тим, що масштабний коефіцієнт включає значення в дБ.
10. Спосіб за будь-яким з пп. 8-9, який відрізняється тим, що переважний сигнал ідентифікують шляхом порівняння значення вхідного сигналу балансу мікшування з первинним і канальним масштабними коефіцієнтами метаданих для основного вхідного звукового сигналу, і
якщо значення вхідного сигналу балансу мікшування більше, ніж сума первинного масштабного коефіцієнта метаданих для основного вхідного звукового сигналу плюс максимальний серед усіх канальних масштабних коефіцієнтів метаданих для всіх каналів основного вхідного звукового сигналу,
то зв'язаний вхідний звуковий сигнал визначають як той, що є переважним сигналом;
інакше - основний вхідний звуковий сигнал визначають як той, що є переважним сигналом.
11. Спосіб за п. 10, який відрізняється тим, що зв'язаний вхідний звуковий сигнал ідентифікують як той, що є переважним сигналом, при цьому спосіб додатково включає етап, на якому:
обчислюють канальний масштабний коефіцієнт для кожного каналу основного вхідного звукового сигналу, причому канальний масштабний коефіцієнт для каналу є первинним масштабним коефіцієнтом метаданих для основного вхідного звукового сигналу плюс канальний масштабний коефіцієнт метаданих для відповідного каналу основного вхідного звукового сигналу мінус значення вхідного сигналу балансу мікшування.
12. Спосіб за п. 10, який відрізняється тим, що основний вхідний звуковий сигнал ідентифікують як той, що є переважним сигналом, при цьому спосіб додатково включає етапи, на яких:
визначають масштабний коефіцієнт для зв'язаного вхідного звукового сигналу, що обчислюється як значення вхідного сигналу балансу мікшування мінус сума первинного масштабного коефіцієнта метаданих для основного вхідного звукового сигналу й максимального серед усіх канальних масштабних коефіцієнтів метаданих для всіх каналів основного вхідного звукового сигналу; і
визначають масштабний коефіцієнт для кожного каналу основного вхідного звукового сигналу, що обчислюється як первинний масштабний коефіцієнт для основного вхідного звукового сигналу плюс канальний масштабний коефіцієнт для відповідного каналу основного вхідного звукового сигналу мінус сума первинного масштабного коефіцієнта метаданих і максимального серед усіх канальних масштабних коефіцієнтів для каналів основного вхідного звукового сигналу.
13. Спосіб за будь-яким з пп. 10-12, який відрізняється тим, що масштабні коефіцієнти метаданих, призначені для визначення переважного сигналу, додатково включають масштабний коефіцієнт для зв'язаного вхідного звукового сигналу, який можуть використовувати як регулювання, де масштабний коефіцієнт для зв'язаного вхідного звукового віднімають від масштабного коефіцієнта метаданих для основного вхідного звукового сигналу для визначення переважного сигналу.
14. Спосіб за будь-яким з пп. 1-13, який відрізняється тим, що сприйманий рівень звуку заснований на середньозваженому рівні основного вхідного звукового сигналу й зв'язаного вхідного звукового сигналу.
15. Спосіб за будь-яким з пп. 1-13, який відрізняється тим, що сприйманий рівень звуку заснований на діалоговому рівні основного вхідного звукового сигналу й зв'язаного вхідного звукового сигналу.
16. Спосіб за п. 15, який відрізняється тим, що діалоговий рівень вимірюють як значення параметра dialnorm.
17. Спосіб за будь-яким з пп. 1-16, який відрізняється тим, що основний вхідний звуковий сигнал і зв'язаний вхідний звуковий сигнал кодують як сигнали Dolby Digital Plus "DD+" або Dolby Pulse.
18. Спосіб за будь-яким з пп. 1-16, який відрізняється тим, що основний вхідний звуковий сигнал і зв'язаний вхідний звуковий сигнал кодують як звукові сигнали Е-АС-3, MPEG-4 НЕ-ААС, aacplus, АС-3, MPEG-1 Layer 2, MPEG-4 ААС або будь-які похідні від MPEG-4.
19. Спосіб за п. 17 або п. 18, який відрізняється тим, що метадані мікшування включають метадані мікшування згідно з ETSI TS 102 366 VI.2.1 Ch. E.I.2.2 для мікшування сигналів DD+.
20. Спосіб за п 8 та п. 19, який відрізняється тим, що метадані мікшування включають масштабні коефіцієнти для ряду звукових каналів: extpgmscl, extpgmlscl, extpgmrscl, extpgmcscl, extpgmlsscl, extpgmrsscl, extpgmlfescl, що відповідають первинному масштабному коефіцієнту й масштабним коефіцієнтам для лівого каналу, правого каналу, центрального каналу, лівого навколишнього каналу, правого навколишнього каналу, каналу низькочастотних ефектів, названого "LFE"; і причому метадані мікшування, необов'язково, додатково включають величину panmean.
21. Спосіб за п. 20, який відрізняється тим, що основний вхідний звуковий сигнал додатково включає канал низькочастотних ефектів, названий "LFE", і канальний масштабний коефіцієнт для каналу LFE обчислюють як мінімальний канальний масштабний коефіцієнт для каналу LFE і максимальний масштабний коефіцієнт метаданих для інших каналів основного вхідного звукового сигналу.
22. Спосіб за п. 17 або п. 18, який відрізняється тим, що метадані мікшування включають метадані мікшування згідно з ETSI TS 101 154 VI.9.1 Annex E2 для мікшування вхідних звукових сигналів.
23. Спосіб за п. 8 та п. 22, який відрізняється тим, що метадані мікшування включають масштабні коефіцієнти для ряду звукових каналів: AD_fade_byte, AD_gain_byte_center, AD_gain_byte_front, AD_gain_byte_surround або AD_pan_byte, що відповідають первинному масштабному коефіцієнту й канальним масштабним коефіцієнтам для центрального каналу, одного або більше фронтальних каналів, одного або більше навколишніх каналів і панорамування.
24. Спосіб за п. 10, який відрізняється тим, що основний вхідний звуковий сигнал включає канал низькочастотних ефектів, названий "LFE", і причому канал LFE виключають із максимального серед усіх канальних масштабних коефіцієнтів метаданих для всіх каналів основного вхідного звукового сигналу так, що:
якщо значення вхідного сигналу балансу мікшування більше, ніж сума первинного масштабного коефіцієнта метаданих для основного вхідного звукового сигналу плюс максимальний серед усіх канальних масштабних коефіцієнтів метаданих для всіх каналів основного вхідного звукового сигналу, за винятком каналу LFE, то зв'язаний вхідний звуковий сигнал визначають як той, що є переважним сигналом;
інакше - основний вхідний звуковий сигнал визначають як той, що є переважним сигналом.
25. Спосіб за п. 12, який відрізняється тим, що основний вхідний звуковий сигнал включає канал низькочастотних ефектів, названий "LFE", і причому канал LFE виключають із максимального серед усіх масштабних коефіцієнтів метаданих для всіх каналів основного вхідного звукового сигналу так, що основний вхідний звуковий сигнал ідентифікують як той, що є переважним сигналом шляхом:
визначення масштабного коефіцієнта для зв'язаного вхідного звукового сигналу, що обчислюється як значення вхідного сигналу балансу мікшування мінус сума первинного масштабного коефіцієнта метаданих для основного вхідного звукового сигналу й максимального серед усіх канальних масштабних коефіцієнтів метаданих для всіх каналів основного вхідного звукового сигналу за винятком каналу LFE; і
визначення масштабного коефіцієнта для кожного каналу основного вхідного звукового сигналу, що обчислюється як первинний масштабний коефіцієнт для основного вхідного звукового сигналу плюс масштабний коефіцієнт для відповідного каналу основного вхідного звукового сигналу мінус сума первинного масштабного коефіцієнта метаданих і максимального серед усіх канальних масштабних коефіцієнтів для каналів основного вхідного звукового сигналу за винятком каналу низькочастотних LFE.
26. Спосіб за пп. 8-25, який відрізняється тим, що метадані мікшування для зв'язаного вхідного звукового сигналу додатково включають інформацію метаданих панорамування, зв'язаний вхідний звуковий сигнал включає монофонічний сигнал і основний вхідний звуковий сигнал включає стереофонічний або багатоканальний сигнал,
де зв'язаний вхідний звуковий сигнал мікшують з каналами основного вхідного звукового сигналу відповідно до інформації метаданих панорамування.
27. Спосіб за будь-яким з пп. 1-26, який відрізняється тим, що вхідний сигнал балансу мікшування включає зовнішній вхідний сигнал від користувача, що забезпечує значення в інтервалі від негативних значень до позитивних значень.
28. Спосіб за п. 7, який відрізняється тим, що ряд каналів основного вхідного звукового сигналу й ряд каналів зв'язаного вхідного звукового сигналу включають навколишні сигнали з лівим, правим, центральним, лівим навколишнім, правим навколишнім каналами й каналом низькочастотних ефектів, названим "LFE".
29. Спосіб за п. 28, який відрізняється тим, що ряд каналів основного вхідного звукового сигналуй зв'язаного вхідного звукового сигналу включає багатоканальні сигнали 5.1, 3.1 або 13.1.
30. Спосіб за будь-яким з пп. 21-29, який відрізняється тим, що зв'язаний вхідний звуковий сигнал включає монофонічний канал і канал LFE, де канал LFE зв'язаного вхідного звукового сигналу мікшують з каналом LFE основного вхідного звукового сигналу, і монофонічний канал зв'язаного вхідного звукового сигналу панорамують на канали основного вхідного звукового сигналу відповідно до інформації метаданих панорамування.
31. Пристрій, призначений для мікшування сигналів, який застосовує кожний зі способів мікшування сигналів за пп. 1-30.
32. Декодер, який застосовує кожний зі способів мікшування сигналів за пп. 1-30 для декодування двох вхідних звукових сигналів у єдиний, зведений звуковий сигнал з підтримкою погодженого сприйманого рівня звуку.
33. Носій даних, що читається процесором, у пам'яті якого зберігаються машинозчитувані команди, призначені для виконання способу за одним із пп. 1-30.
34. Пристрій для мікшування вхідних звукових сигналів у єдиний, зведений звуковий сигнал з підтримкою сприйманого рівня звуку зведеного звукового сигналу, при цьому пристрій містить:
приймач для приймання основного вхідного звукового сигналу, зв'язаного вхідного звукового сигналу й метаданих мікшування; причому зв'язаний вхідний звуковий сигнал пов'язаний з основним вхідним звуковим сигналом, причому метадані мікшування містять інформацію масштабування для масштабування основного вхідного звукового сигналу; причому інформація масштабування визначає, яким чином повинні бути мікшовані основний вхідний звуковий сигнал і зв'язаний вхідний звуковий сигнал, для генерації зведеного звукового сигналу на сприйманому рівні звуку; причому інформація масштабування з метаданих мікшування включає масштабний коефіцієнт метаданих для основного вхідного звукового сигналу, для масштабування основного вхідного звукового сигналу щодо зв'язаного вхідного звукового сигналу;
вхідний сигнал балансу мікшування, який указує регульований баланс між основним і зв'язаним вхідними звуковими сигналами; причому вхідний сигнал балансу мікшування включає інформацію масштабування, яка дозволяє відхилення від зважування основного вхідного звукового сигналу й зв'язаного вхідного звукового сигналу у зведеному звуковому сигналі, як визначено в метаданих мікшування; і
модуль мікшування, сконфігурований для ідентифікації переважного сигналу або як основного вхідного звукового сигналу, або як зв'язаного вхідного звукового сигналу з інформації масштабування, забезпеченої метаданими мікшування, й із вхідного сигналу балансу мікшування, причому тоді відповідний другий вхідний звуковий сигнал ідентифікований як непереважний сигнал; і причому переважний сигнал ідентифікований за допомогою порівняння вхідного сигналу балансу мікшування з масштабним коефіцієнтом метаданих для основного вхідного звукового сигналу;
який відрізняється тим, що модуль мікшування додатково сконфігурований для масштабування непереважного сигналу щодо переважного сигналу і для об'єднання масштабованого непереважного сигналу з переважним сигналом для вироблення зведеного звукового сигналу.
35. Пристрій за п. 34, який відрізняється тим, що масштабний коефіцієнт для непереважного сигналу визначається, виходячи безпосередньо з інформації масштабування з метаданих мікшування й із вхідного сигналу балансу мікшування;
непереважний сигнал зазнає масштабування з використанням обумовленого масштабного коефіцієнта; і
масштабований непереважний сигнал поєднується з переважним сигналом у зведений сигнал.
36. Пристрій за п. 34 або п. 35, який відрізняється тим, що метадані мікшування інтегровані у зв'язаний вхідний звуковий сигнал.
37. Пристрій за будь-яким з пп. 34-36, який відрізняється тим, що вхідний сигнал балансу мікшування додатково включає зовнішній вхідний сигнал від користувача, що забезпечує значення в інтервалі від негативних значень до позитивних значень.
38. Пристрій за будь-яким з пп. 34-37, який відрізняється тим, що приймач додатково сконфігурований для приймання багатоканальних основних вхідних звукових сигналів і зв'язаних вхідних звукових сигналів, і модуль мікшування сконфігурований для мікшування багатоканальних основних вхідних звукових сигналів і зв'язаних вхідних звукових сигналів.
Текст
Реферат: Спосіб мікшування звукових сигналів дозволяє зберігати сумісний сприйманий рівень звуку для зведеного сигналу шляхом підтримки постійного рівня звуку переважного сигналу у зведеному сигналі за допомогою регулювання рівня звуку непереважного сигналу (сигналів) щодо переважного сигналу. Спосіб також включає приймання вхідного сигналу балансу мікшування, який указує регульований баланс між основним і зв'язаним сигналами. Спосіб також включає ідентифікацію переважного сигналу, виходячи із вхідного сигналу балансу мікшування й метаданих мікшування, з яких відповідний масштабний коефіцієнт для непереважного сигналу також може визначатися безпосередньо, виходячи з інформації масштабування, без необхідності в якому-небудь аналізі або вимірюванні звукових сигналів, що підлягають мікшуванню. Спосіб також включає масштабування непереважного сигналу щодо переважного сигналу й об'єднання масштабованого непереважного сигналу з переважним сигналом у зведений сигнал. UA 105590 C2 (12) UA 105590 C2 UA 105590 C2 5 10 15 20 25 30 35 40 45 50 55 Перехресне посилання на родинні заявки Дана заявка заявляє пріоритет попередньої заявки на патент США №61/385428, поданої 22 вересня 2010 р., яка посиланням повністю включається в даний документ. Область технічного застосування Дана заявка відноситься до області звукових сигналів. Зокрема, вона відноситься до мікшування звукових сигналів. Передумови Включення метаданих поряд зі звуковими сигналами дозволило внести значні поліпшення у враження користувача від прослуховування. Для сприятливих вражень користувача, загалом, бажане, щоб загальний рівень звуку в різних програмах був погодженим. Однак звукові сигнали різних програм звичайно походять із різних джерел, зазнають мастерингу різними виготовлювачами, і можуть містити різноманітний інформаційний уміст у діапазоні від мовного діалогу до музики з низькочастотними ефектами для звукових доріжок кінокартин. Можливість зміни рівня звуку робить складним підтримку однакового загального рівня звуку для всіх зазначених програм у ході відтворення. На практиці небажано, щоб слухач відчував потребу в регулюванні гучності відтворення при перемиканні від однієї програми до іншої з метою регулювання однієї із програм так, щоб вона була голосніше або тихіше стосовно іншої програми через різниці в сприйманому рівні звуку для різних програм. Способи зміни звукових сигналів з метою підтримки погодженого рівня звуку між програмами, загалом, відомі як регулювання рівня сигналу. У контексті діалогових звукових доріжок, кількісний показник, що відноситься до сприйманого рівня звуку, відомий як діалоговий рівень, який ґрунтується на середньозваженому рівні звукового сигналу. Діалоговий рівень часто задається з використанням параметра dialnorm, який указує рівень у децибелах (дБ) стосовно повної цифрової шкали. У минулому віщальні компанії, що працюють зі звуковими сигналами, стикалися з особливо великими труднощами у випадку звукових сигналів, таких як звукові доріжки, рівні звуку яких відчувалися вище або нижче ніж в інших програмах, особливо, для таких звукових сигналів, як діалоги, які можуть значно змінюватися в часі. З розвитком цифрового звуку, багатоканального звуку й, особливо, можливості включення метаданих поряд зі звуковим сигналом, виготовлювачі й звукорежисери тепер мають широкий вибір можливостей завдання установок, які можуть впроваджуватися в сигнал як метадані з метою точного визначення рівнів відтворення для різних систем відтворення. Ці установки навіть можуть створюватися на етапі компонування, і, таким чином, віщальні компанії можуть доставляти найвищою мірою погоджений звуковий сигнал і гарантувати те, що найбільш важливі елементи звукового сигналу будуть повідомлені кінцевому користувачеві. Аналогічно, при мікшуванні звукових сигналів для сприятливих вражень користувача також бажано підтримувати однаковий сприйманий рівень звуку при мікшуванні вхідних звукових сигналів у єдиний сигнал. Одним зі способів досягнення цієї мети для вхідних сигналів є включення метаданих мікшування, які визначають те, яким чином сигнал повинен зазнати масштабування при мікшуванні. Багато сучасних звукових стандартів дозволяють виготовлювачам інформаційного вмісту включати зв'язані звукові сигнали, які пов'язані з основним звуковим сигналом і включають мінливі в часі метадані поряд зі зв'язаними звуковими сигналами. Наприклад, виготовлювач інформаційного вмісту може передбачати доріжку з коментарями режисера в зазначеному зв'язаному звуковому сигналі. Метадані, що супроводжують зв'язаний сигнал, точно визначають те, яким чином виготовлювач інформаційного вмісту бажає, щоб звуковий сигнал основної доріжки зазнав регулювання в ході мікшування для спільного відтворення. Наприклад, двома прикладами стандартів, які передбачають зазначені метадані мікшування, є E-AC-3 (Dolby Digital Plus) і високоефективне перспективне звукове кодування (HE-AAC). Подробиці див. у документі "ETSI TS 102 366 vl.2.1 (2008-08): Digital Audio Compression (AC-3, Enhanced-Ac-3) Standard", який описує E-AC-3 (Dolby Digital Plus); або див. документ "ETSI TS 101 154 Vl.9.1 (2009-09): Digital Video Broadcasting (DVB); Specification for the use of Video and Audio Coding in Broadcasting Applications based on the MPEG-2 Transport Stream", який описує високоефективне перспективне звукове кодування (HE-AAC). Обидва ці документа посиланням повністю включаються в даний документ. Однак користувач може виявити бажання відхилитися від передбачених виготовлювачем установок, які диктуються метаданими, переданими поряд зі зв'язаним сигналом. Наприклад, користувач, який активує коментарі режисера при перегляді кінокартини в деякій точці в ході відтворення, ухвалює рішення щодо того, що він більше прагне чути оригінальний діалог, який 1 UA 105590 C2 5 10 15 20 25 30 35 40 45 50 55 60 виготовлювач указав у метаданих як підлягаючий ослабленню при мікшуванні для того, щоб він не переважав над коментарями режисера. Тому існує потреба в створенні регулювання, яке дозволяло б користувачеві регулювати мікшування вхідних звукових сигналів і, у той же час, забезпечувала б сприятливі враження користувача шляхом збереження сприйманого рівня звуку у зведеному сигналі. Крім того, також існує потреба в створенні регулювання мікшування вхідних звукових сигналів і, у той же час, збереження погодженого рівня звуку для зведеного сигналу навіть тоді, коли інформація масштабування з метаданих і зовнішній вхідний сигнал від користувача можуть бути мінливими в часі так, щоб не було необхідності у виконанні додаткового регулювання рівня зведеного сигналу. Короткий опис винаходу Використання метаданих мікшування дозволяє виготовлювачеві інформаційного вмісту точно управляти й визначати те, яким чином сигнали повинні сполучатися в ході відтворення. Таким чином, рівень звуку, або діалоговий рівень, вхідних звукових сигналів може бути перед мікшуванням нормалізований за допомогою інформації масштабування, що передбачається метаданими, для того, щоб кожний вхідний сигнал у мікшер був належним чином масштабований для досягнення погодженого сприйманого рівня звуку. Таким чином, у ході мікшування відносний рівень кожного вхідного сигналу, що вносить внесок у зведений сигнал, управляється за допомогою інформації масштабування, що втримується в метаданих, які доставляються із сигналом. На практиці цей спосіб звичайно включає ідентифікацію одного основного сигналу й одного або декількох пов'язаних з ним сигналів, що підлягають мікшуванню. Як припускають найменування, основний сигнал - це стандартний сигнал, а зв'язаний сигнал - це сигнал, що якимось чином стосується відповідного його основного сигналу. Відповідно, тоді метадані доставляють інформацію масштабування для основного сигналу відносно зв'язаного сигналу при їх мікшуванні. Наприклад, часто в якості спеціальної функції виготовлювач може включити в якості зв'язаного сигналу поряд з кінокартиною додаткову голосову доріжку з "коментарем режисера", де користувач може чути коментар режисера, що накладається в реальному часі поверх кінокартини. Таким чином, користувач може одночасно дивитися кінокартину з її оригінальним звуком і з коментарем режисера. У ході відтворення зазначений зв'язаний сигнал призначається для мікшування з основним звуковим сигналом оригінальної кінокартини, наприклад, на такому встаткуванні кінцевого користувача, як телевізійна приставка. Однак інші діалоги, ефекти й музика основного звукового сигналу кінокартини можуть бути дуже голосними й тому можуть маскувати зв'язаний звуковий сигнал. Таким чином, у деякі моменти часу основний звуковий сигнал кінокартини бажано, у цілому, понизити, або послабити, для того, щоб можна було належним чином зрозуміти коментар режисера поверх основного звукового сигналу. Зазначене ослаблення основного сигналу може виконуватися, наприклад, шляхом надання метаданих, що супроводжують додатковий зв'язаний звуковий сигнал, де метадані точно визначають, яким чином і наскільки повинен послаблятися основний сигнал. Крім того, може знадобитися, щоб зазначене ослаблення було мінливим у часі. Наприклад, у кінобойовику при мікшуванні сигналів може виявитися необхідним, щоб основний звуковий сигнал сильно послаблявся в ході занадто голосних сцен, які можуть включати такі особливості, як їзда автомобілів з недозволеною швидкістю на шинах, що верещать, або вибухи літаків і ракет, за якими кінцевому користувачеві буде важко досить добре розчути коментарі режисера зі зв'язаного сигналу. Наприклад, режисер може мати бажання пояснити, як відбувається головний вибух у бойовій сцені, включаючи напрямні дроти й спеціальне віддалені камери, і те, як синхронізувалися ці особливості, і все це в той час як у тлі відбувається сама сцена. У цьому випадку, виготовлювач інформаційного вмісту навіть може виявити бажання ще сильніше послабити низькочастотні ефекти й, у той же час, як і раніше підтримувати нормальний рівень звуку для діалогу. Іншими словами, високі рівні звуку деяких типів основного звукового сигналу можуть у деякі моменти часу блокувати коментарі режисера. В інші моменти часу, такі як тиха інтимна сцена в кінокартині, режисер може захотіти зберегти повний рівень звуку в кінокартині, наприклад, так, щоб кінцевий користувач міг точно розчути передачу пошепки важливого повідомлення в ключовій сцені кінокартини. Однак користувач може виявити бажання мати можливість регулювання установок, що поставляються виготовлювачем інформаційного вмісту. Наприклад, користувач, який переглядає кінокартину з активованими коментарями режисера, може в деякий момент у ході відтворення вирішити, що він, скоріше, вважає більш важливим прослуховування оригінального діалогу, музики, звуків і ефектів, ніж коментарі режисера. Однак, оскільки установки метаданих від виготовлювача можуть указувати, що основний сигнал повинен сильно послаблятися при 2 UA 105590 C2 5 10 15 20 25 30 35 40 45 50 55 60 мікшуванні для того, щоб він не перекривав коментарі режисера, у користувача немає прямого способу модифікувати установки мікшування, передбачені виготовлювачем інформаційного вмісту (зрозуміло, для того, щоб краще чути ослаблені звуки, користувач може збільшити гучність, але з небажаним ефектом того, що інші, неослаблені звуки також будуть голосніше). Таким чином, існує потреба в створенні способу модифікації мікшування вхідних звукових сигналів відповідно до вимог користувача. Для виконання зазначеної функції користувач може бути постачити забезпечений пристроєм введення, призначеним для регулювання балансу між основним і зв'язаними сигналами. Однак, оскільки мікшування явно впливає на рівень звуку, без додаткових заходів рівень звуку в процесі може легко підстроюватися, що буде приводити до стрибка гучності при перемиканні від програми зі зведеним сигналом, відрегульованим користувачем за допомогою пристрою введення, до програми з незведеним звуковим сигналом. Крім того, оскільки метадані й дані, що вводяться користувачем, можуть бути мінливими в часі, без акуратної обробки сприйманий рівень звуку зведеного сигналу також може бути мінливим у часі. Тому існує додаткова потреба в масштабуванні основного й зв'язаного вхідних сигналів у ході мікшування так, щоб сприйманий рівень звуку зведеного сигналу програми залишався постійним. Відповідно одній з особливостей, розкривається спосіб, який дозволяє підтримувати сумісний сприйманий рівень звуку для зведеного сигналу шляхом підтримки постійного рівня звуку переважного сигналу у зведеному сигналі й регулювання рівня звуку непереважного сигналу щодо переважного сигналу. Спосіб також включає приймання вхідного сигналу балансу мікшування, який указує регульований баланс між основним і зв'язаними сигналами. Спосіб також включає ідентифікацію переважного сигналу на основі вхідного сигналу балансу мікшування й метаданих мікшування. Спосіб також може включати визначення підходящого масштабного коефіцієнта для непереважного сигналу безпосередньо з інформації масштабування без необхідності в якому-небудь аналізі або вимірі звукових сигналів, що підлягають мікшуванню. Тому що зазначені способи не вимагають якого-небудь аналізу або виміру звукових сигналів, апаратне забезпечення, необхідне для реалізації цих способів, може бути набагато простіше в порівнянні з апаратними системами, які повинні дискретизувати сигнал або виконувати розрахунки з більшим обсягом обчислень. Аналогічно, мікшування в реальному часі може виконуватися з відносною легкістю, оскільки всі дані вже є доступними, без необхідності в дискретизації або аналізі великих обсягів даних в реальному часі. Згідно з першою особливістю, передбачається спосіб мікшування двох вхідних звукових сигналів у єдиний, зведений звуковий сигнал з погодженим сприйманим рівнем звуку. Перші етапи зазначеного способу мікшування включають приймання основного вхідного звукового сигналу, приймання зв'язаного вхідного звукового сигналу, приймання метаданих мікшування, які містять інформацію масштабування, і приймання вхідного сигналу балансу мікшування, який указує регульований баланс між основним і зв'язаним сигналами. Виходячи із зазначених вхідних сигналів, на основі інформації масштабування, що доставляється за допомогою метаданих мікшування, і вхідного сигналу балансу мікшування ідентифікується переважний сигнал. Потім непереважний сигнал зазнає масштабування щодо переважного сигналу. В остаточному підсумку, масштабований непереважний сигнал поєднується з переважним сигналом у зведений сигнал. Таким чином, шляхом використання вхідного сигналу балансу мікшування, спосіб уможливлює для користувача надання впливу на мікшування, дозволяючи користувачеві вибирати переважний сигнал, а також рівень масштабування непереважного сигналу щодо переважного сигналу, у той час як сприйманий рівень звуку зведеного сигналу підтримується постійним шляхом масштабування непереважного сигналу щодо переважного сигналу. Згідно з іншою особливістю, рівень звуку може бути представлений середньозваженим рівнем сигналів. Рівень звуку також може бути виражений як діалоговий рівень сигналу. Таким чином, спосіб може відноситися до мікшування двох вхідних звукових сигналів у єдиний, зведений звуковий сигнал з погодженим сприйманим діалоговим рівнем. Крім того, діалоговий рівень може кількісно виражатися величиною dialnorm, пов'язаною з кожним сигналом. Параметр dialnorm часто передбачається як параметр метаданих, призначений для керування коефіцієнтом підсилення декодера. Згідно з документом стандарту ETSI TS 102 366 v1.2.1, параметр метаданих "dialnorm" являє собою 5-бітний код зі значеннями в інтервалі від 1 до 31 (значення 0 є зарезервованим). Цей код слід інтерпретувати як рівень зі значеннями в інтервалі від –1 дБ до –31 дБ щодо повної шкали. Виходячи з параметра метаданих dialnorm, можна визначити масштабний коефіцієнт. Масштабний коефіцієнт еквівалентний (31–dialnorm) дБ. Таким чином, значення dialnorm, що дорівнює 31, указує масштабний коефіцієнт, що дорівнює 0 дБ, у той час як значення dialnorm, що дорівнює 1, указує масштабний коефіцієнт, що дорівнює 3 UA 105590 C2 5 10 15 20 25 30 35 40 45 50 55 60 –30 дБ. Коротко, dialnorm являє собою цілочислову величину зі значеннями від 31 до 1, де значення 31 указує коефіцієнт підсилення декодера, що залишається рівним одиниці, і значення 1 указує коефіцієнт підсилення декодера, що підлягає зменшенню на 30 дБ. За умови, що рівень звуку переважного сигналу залишається погодженим, будь-які зміни в рівнях непереважних сигналів будуть менш помітними, і сприйманий рівень звуку, а також сприйманий діалоговий рівень зведеного сигналу повинен залишатися сумісним. Переважно, вхідні сигнали повинні бути відповідним чином нормалізовані. Крім того, слід приділити увагу тому, щоб параметр dialnorm інформаційного вмісту вхідних сигналів при мікшуванні підтримувався на сумісному сприйманому діалоговому рівні. Для найкращих результатів, параметр dialnorm інформаційного вмісту для вхідних сигналів повинен бути заданий відповідним чином, звичайно зі значенням dialnorm, що дорівнює 31, що вказує на коефіцієнт підсилення, дорівнює одиниці. Однак параметр dialnorm необов'язково завжди повинен задаватися значенням 31, але, переважно, на обох вхідних сигналах уже повинна бути застосована діалогова нормалізація. У ході мікшування переважний сигнал, як правило, не зазнає масштабування, у той час як непереважний вхідний сигнал зазнає масштабування за допомогою обумовленого масштабного коефіцієнта. Тому після мікшування діалогового звукового сигналу відповідно до описуваних способів діалоговий рівень переважного сигналу буде залишатися сумісним, у той час як діалоговий рівень непереважного сигналу щодо переважного сигналу буде відповідати даній інформації масштабування з метаданих мікшування й вхідному сигналу балансу мікшування. Згідно з іншою особливістю, вхідний сигнал балансу мікшування також може включати зовнішній вхідний сигнал від користувача, що передбачає значення в інтервалі від дуже великих негативних значень до дуже великих позитивних значень, за допомогою чого в ході процесу мікшування допускається віддання переваги або зв'язаному сигналу, або основному сигналу на бажану величину. Загалом, вхідний сигнал балансу мікшування може являти собою позитивне або негативне дійсне число. Зазначений вхідний сигнал балансу мікшування дозволяє користувачеві при мікшуванні двох вхідних сигналів за бажанням регулювати бажаний сигнал у фокусі. Крім того вхідний сигнал балансу мікшування дозволяє користувачеві точно визначати в процесі мікшування ослаблення непереважного сигналу щодо переважного сигналу, що, як правило, дозволяє користувачеві вибирати з повного діапазону від відсутності ослаблення до повного ослаблення. Застосування способів, описуваних у даному документі, дозволяє користувачеві плавно перемикати мікшування від повного ослаблення основного сигналу до повного ослаблення зв'язаного сигналу. Відповідно одній з особливостей, спосіб також може включати етап визначення масштабного коефіцієнта, за допомогою якого зазнає масштабування непереважний сигнал, де масштабний коефіцієнт визначається безпосередньо з інформації масштабування, що втримується в метаданих мікшування, і із вхідного сигналу балансу мікшування. Тоді спосіб також може включати масштабування непереважного сигналу з використанням обумовленого масштабного коефіцієнта. Крім того, метадані мікшування можуть включати масштабний коефіцієнт метаданих для основного сигналу, що позначає масштабний коефіцієнт, призначений для масштабування основного сигналу щодо зв'язаного сигналу, і метадані мікшування, необов'язково, можуть включати масштабний коефіцієнт метаданих для зв'язаного сигналу, що позначає масштабний коефіцієнт, призначений для масштабування зв'язаного сигналу щодо основного сигналу. Зазначені масштабні коефіцієнти також можуть включати значення в дБ. Оскільки номінальний рівень звуку для сигналів звичайно визначається шляхом присвоєння параметру dialnorm значення 31, для найкращих результатів вхідні сигнали також повинні мати установки значення параметра dialnorm, рівні 31. Спосіб також може включати етап ідентифікації переважного сигналу шляхом виконання наступного порівняння за умови, що масштабний коефіцієнт для зв'язаного сигналу відсутній: у випадку, якщо значення вхідного сигналу балансу мікшування більше, ніж масштабний коефіцієнт метаданих для основного сигналу з метаданих мікшування, зв'язаний сигнал визначається як той, що є переважним сигналом; інакше як той, що є переважним сигналом, визначається основний сигнал. Якщо в якості переважного сигналу ідентифікується зв'язаний сигнал, спосіб також може включати визначення масштабного коефіцієнта для основного сигналу, який обчислюється як різниця між масштабним коефіцієнтом метаданих для основного сигналу з метаданих мікшування й вхідним сигналом балансу мікшування. В альтернативному варіанті, якщо в якості переважного сигналу ідентифікується основний сигнал, спосіб також може включати визначення масштабного коефіцієнта для зв'язаного сигналу, який обчислюється як різниця між вхідним сигналом балансу мікшування й масштабним коефіцієнтом метаданих з метаданих мікшування для основного сигналу. 4 UA 105590 C2 5 10 15 20 25 30 35 40 45 50 55 60 У випадку, коли є в наявності також і масштабний коефіцієнт метаданих для зв'язаного сигналу, спосіб також може включати етап ідентифікації переважного сигналу шляхом виконання наступного порівняння. Масштабний коефіцієнт метаданих для основного сигналу з метаданих мікшування може коректуватися за допомогою масштабного коефіцієнта метаданих для зв'язаного сигналу з метаданих мікшування шляхом вирахування масштабного коефіцієнта метаданих для зв'язаного сигналу з масштабного коефіцієнта метаданих для основного сигналу. У випадку, коли значення вхідного сигналу балансу мікшування більше, ніж скоректований масштабний коефіцієнт, зв'язаний сигнал ідентифікується, що як той, що є переважним сигналом; інакше, як той що є переважним сигналом ідентифікується основний сигнал. Якщо в якості переважного сигналу ідентифікований зв'язаний сигнал, спосіб також може включати визначення масштабного коефіцієнта для основного сигналу, який обчислюється як різниця між скоректованим масштабним коефіцієнтом і вхідним сигналом балансу мікшування. В альтернативному варіанті, якщо в якості переважного сигналу ідентифікується основний сигнал, спосіб також може включати визначення масштабного коефіцієнта для зв'язаного сигналу, який обчислюється як різниця між вхідним сигналом балансу мікшування й скоректованим масштабним коефіцієнтом. Шляхом визначення масштабного коефіцієнта для непереважного сигналу й мікшування вхідних сигналів, на основі чого сигнал визначається як той, що є переважним сигналом, сприйманий рівень звука зведеного сигналу може підтримуватися постійним, незважаючи на те, що як і раніше допускається як регулювання сигналу у фокусі, так і відповідне масштабування непереважного сигналу. По-іншому, щонайменше один із сигналів завжди є переважним сигналом, який являє собою сигнал у фокусі. Тому що переважний сигнал, як правило, не є масштабованим, рівень звуку зведеного сигналу щодо інших програм зберігається незалежно від того, наскільки сильно ослабляється непереважний сигнал щодо переважного сигналу на основі комбінації вхідного сигналу балансу мікшування й масштабних коефіцієнтів мікшування, що передбачаються метаданими. У деяких випадках, вхідні сигнали можуть складатися з декількох каналів аудіоданих. В одному з альтернативних варіантів здійснення винаходу, для кожного каналу основного вхідного сигналу можуть визначатися окремі масштабні коефіцієнти. Тоді в ході мікшування кожний канал непереважного сигналу може зазнати масштабування за допомогою його відповідним чином визначеного масштабного коефіцієнта й, як і в попередньому варіанті здійснення винаходу, переважний сигнал залишається необмеженим. Тому сигнали також можуть включати кілька каналів, де метадані мікшування тоді можуть також включати первинний масштабний коефіцієнт метаданих для основного сигналу щодо зв'язаного сигналу й масштабні коефіцієнти метаданих для кожного з каналів основного сигналу щодо зв'язаного сигналу. Кілька каналів у сигналах можуть включати навколишні канали з лівим, правим, центральним, лівим навколишнім, правим навколишнім каналами й каналом низькочастотних ефектів (LFE). Кілька каналів можуть, наприклад, включати багатоканальні сигнали 5.1, багатоканальні сигнали 3.1, багатоканальні сигнали 13.1 або інші багатоканальні сигнали. Для багатоканальних сигналів, що включають канал низькочастотних ефектів (LFE) спосіб також може включати обчислення масштабного коефіцієнта для каналу LFE як мінімального масштабного коефіцієнта метаданих LFE і максимального з масштабних коефіцієнтів метаданих інших каналів основного сигналу. Ця характерна риса призначена для запобігання занадто сильної переваги каналу LFE у зведеному сигналі. Що особливо корисно для вхідних сигналів, що включають кілька каналів, спосіб також може включати наступну нижче ідентифікацію переважного сигналу виходячи із вхідного сигналу балансу мікшування й масштабних коефіцієнтів метаданих для основного сигналу й масштабного коефіцієнта метаданих для зв'язаного сигналу. Даний спосіб використовує визначення максимального вторинного масштабного коефіцієнта метаданих як максимального серед усіх масштабних коефіцієнтів метаданих для всіх каналів основного сигналу за винятком каналу низькочастотних ефектів (LFE). Таким чином, канал LFE, у випадку його присутності, не використовується при визначенні максимального вторинного масштабного коефіцієнта метаданих. Спосіб також включає обчислення суми зазначеного максимального вторинного масштабного коефіцієнта метаданих і первинного масштабного коефіцієнта метаданих для основного сигналу. Тоді, якщо значення вхідного сигналу балансу мікшування більше, ніж зазначена сума, то зв'язаний сигнал визначається, як той, що є переважним сигналом; інакше, як той, що є переважним сигналом, визначається основний сигнал. В альтернативному варіанті, у випадку, коли також є присутнім масштабний коефіцієнт метаданих для зв'язаного сигналу, наведене вище визначення переважного сигналу визначається шляхом порівняння того, чи 5 UA 105590 C2 5 10 15 20 25 30 35 40 45 50 55 60 більше значення вхідного сигналу балансу мікшування, ніж зазначена сума, і чи менше воно, ніж масштабний коефіцієнт метаданих для зв'язаного сигналу. Крім того, у випадку, коли зв'язаний сигнал визначається, як той, що є переважним, спосіб також може включати обчислення масштабних коефіцієнтів для кожного з каналів основного сигналу, які обчислюються як первинний масштабний коефіцієнт метаданих для основного сигналу плюс масштабний коефіцієнт метаданих для відповідного основного каналу мінус вхідний сигнал балансу мікшування. У випадку, коли основний сигнал визначається, як той, що є переважним, і масштабний коефіцієнт метаданих для зв'язаного сигналу відсутній, спосіб також може включати визначення масштабного коефіцієнта для зв'язаного сигналу, який обчислюється як значення вхідного сигналу балансу мікшування мінус сума первинного масштабного коефіцієнта метаданих для основного сигналу й максимального вторинного масштабного коефіцієнта метаданих, який являє собою максимальний серед усіх масштабних коефіцієнтів метаданих для всіх каналів основного сигналу за винятком каналу низькочастотних ефектів (LFE), якщо він є присутнім. У випадку, коли основний сигнал визначається як той, що є переважним сигналом, і є присутнім масштабний коефіцієнт метаданих для зв'язаного сигналу, спосіб також може включати визначення масштабного коефіцієнта для зв'язаного сигналу, який обчислюється як значення вхідного сигналу балансу мікшування плюс масштабний коефіцієнт метаданих для зв'язаного сигналу мінус сума первинного масштабного коефіцієнта метаданих для основного сигналу й максимального вторинного масштабного коефіцієнта метаданих, який являє собою максимальний серед усіх масштабних коефіцієнтів метаданих для всіх каналів основного сигналу за винятком каналу низькочастотних ефектів (LFE), якщо він присутній. Даний спосіб також може включати визначення масштабного коефіцієнта для кожного каналу основного сигналу, який обчислюється як первинний масштабний коефіцієнт для основного каналу плюс масштабний коефіцієнт для основного каналу мінус сума первинного основного масштабного коефіцієнта й максимального вторинного основного масштабного коефіцієнта, що представляє собою максимальний серед усіх масштабних коефіцієнтів для всіх каналів основного сигналу за винятком каналу низькочастотних ефектів (LFE), якщо він присутній. Згідно з наступною особливістю, сигнали можуть включати сигнали Dolby Digital Plus (DD+) або Dolby Pulse. Аналогічно, сигнали можуть кодуватися як звукові сигнали E-AC-3, MPEG-4 HEAAC, aacplus, AC-3, M PEG-1 Layer 2, MPEG-4 AAC, будь-які похідні від MPEG-4, або звукові сигнали в інших подібних форматах. Тому метадані можуть включати метадані мікшування рівня ES (елементарних потоків), призначені для мікшування сигналів DD+, наприклад, метадані мікшування згідно зі стандартом ETSI TS 102 366 V1.2.1 Ch. E.1.2.2. Зазначені метадані мікшування рівня ES також можуть включати масштабні коефіцієнти для каналів багатоканального сигналу: extpgmscl, extpgmlscl, extpgmrscl, extpgmcscl, extpgmlsscl, extpgmrsscl, extpgmlfescl, що відповідають первинному масштабному коефіцієнту й масштабним коефіцієнтам для лівого каналу, правого каналу, центрального каналу, лівого навколишнього каналу, правого навколишнього каналу й каналу низькочастотних звукових ефектів (LFE). Метадані рівня ES також можуть, необов'язково, включати величину panmean. Метадані рівня ES також можуть, необов'язково, включати величину pgmscl, відповідну до масштабного коефіцієнта для зв'язаного сигналу. У багатьох випадках сигналів, що відносяться до DD+, метадані мікшування можуть кодуватися разом зі зв'язаним сигналом або впроваджуватися у зв'язаний сигнал, хоча різні стандарти метаданих і реалізації різняться. Наприклад, в MPEG-4 HE-AAC метадані мікшування переміщаються поряд з аудіоданими, але не прямо в аудіоданих. Відповідно, застосування описаних вище способів не слід обмежувати тільки тими випадками, у яких метадані втримуються у зв'язаному сигналі. Згідно з іншою особливістю, метадані можуть включати метадані мікшування рівня PES (елементарних пакетизованих потоків), призначені для мікшування сигналів Pulse/HE-AAC, а також звукових сигналів E-AC-3, MPEG-4 H E-AAC, aacplus, AC-3, MPEG-1 Layer 2, MPEG-4 AAC або будь-яких похідних MPEG-4, наприклад, метадані мікшування згідно зі стандартом ETSI TS 101 154 V1.9.1 Annex E2. Зазначені метадані рівня PES також можуть включати масштабні коефіцієнти для каналів багатоканального сигналу: AD_fade_byte, AD_gain_byte_center, AD_gain_byte_front, AD_gain_byte_surround або AD_pan_byte, що відповідають первинному масштабному коефіцієнту й масштабним коефіцієнтам для центру, фронту, оточення й панорамування. У багатьох випадках, що включають сигнали Pulse, метадані мікшування можуть бути безпосередньо зв'язані зі зв'язаним сигналом. Наприклад, метадані мікшування й зв'язаний сигнал можуть передаватися спільно в тому самому потоці або у зв'язаних потоках. Однак застосування способів, описуваних у даному описі, не слід жодним чином обмежувати 6 UA 105590 C2 5 10 15 20 25 30 35 40 45 50 55 60 зазначеними випадками, і описані способи вимагають тільки приймання метаданих мікшування, які доставляють інформацію мікшування для основного сигналу відносно зв'язаного сигналу. Згідно з іншою особливістю, спосіб також може включати обмеження, яке полягає в тому, що зв'язаний сигнал не повинен містити канали, які відсутні в основному сигналі, якщо зв'язаний сигнал не є монофонічним. Монофонічний сигнал може вказуватися, наприклад, значенням параметра "режим звукового кодування", або acmod, що дорівнює 1, що вказує на те, що сигнал містить тільки центральний канал. Проте, зв'язаний сигнал також може включати монофонічний канал і канал LFE, де канал LFE зв'язаного сигналу мікшується з каналом LFE основного сигналу, а монофонічний канал зв'язаного сигналу панорамується на основні канали основного сигналу, де панорамування включає поділ, або розподіл, сигналу на кілька каналів відповідно до величини, що визначає, яким чином слід розподіляти сигнал, наприклад, у відповідності зі значенням ключа "panmean". Згідно з іншою особливістю, у випадку, коли основний канал не є монофонічним і, таким чином, містить лівий і правий канали, а зв'язаний сигнал є монофонічним (тобто не містить стереофонічних, оточуючих або лівих-правих складових), метадані для зв'язаного сигналу також можуть включати інформацію метаданих панорамування. Наприклад, зазначена інформація метаданих панорамування може передбачатися в метаданих мікшування ключем метаданих "panmean". Тоді спосіб включає використання величини панорамування для панорамування монофонічного зв'язаного сигналу на відповідні лівий і правий канали зведеного сигналу, де значення panmean визначає напрямок, з якого повинні розраховуватися масштабні коефіцієнти для кожного каналу. Розділ "E.4.3.5 Panning" стандарту ETSI TS 102 366 v1.2.1 надає подальші подробиці застосування значення panmean. Згідно даним технічним умовам, panmean визначає ефективний кут, під яким монофонічний зв'язаний сигнал проявляється в просторі декодованого основного сигналу, де 0 градусів являє собою центр, +/–90 указує повне панорамування вліво або вправо. Панорамування може застосовуватися до різних багатоканальних сигналів, таких як 3.1, 5.1 і 13.1. Точний інтервал значень panmean становить 0-239, що представляє 0-358,5 градусів із кроком 1,5 градусів, де 0 градусів - це напрямок центрального гучномовця. Наприклад, значення panmean, що дорівнює 121, може застосовуватися з наступними масштабними коефіцієнтами на п'ятьох каналах, що не відносяться до каналу LFE, багатоканального сигналу 5.1: лівий - 0,078, центральний - 0,997, правий - 0, лівий навколишній - 0,734, правий навколишній - 0,679. У ще одному альтернативному варіанті здійснення винаходу, до переважного сигналу може застосовуватися додатковий масштабний коефіцієнт. Цей масштабний коефіцієнт може визначатися виходячи з метаданих, з додаткового вхідного керуючого сигналу або з фіксованого значення в мікшуючому пристрої. Однак цей масштабний коефіцієнт також може визначатися з аналізу вхідних сигналів у реальному часі для того, щоб ще більше поліпшити підтримку постійного сприйманого рівня звуку. Іншою альтернативою є те, що додатковий масштабний коефіцієнт може бути отриманий з метаданих бітового потоку, наприклад, з використанням параметра dialnorm. У деяких випадках, масштабний коефіцієнт є рівним одиниці, що робить зведений вихідний сигнал з даного варіанта здійснення винаходу ідентичним вихідному сигналу попередніх варіантів здійснення винаходу. Однак в інших випадках, масштабний коефіцієнт не є рівним одиниці, і зведений вихідний сигнал з даного варіанта здійснення винаходу буде відрізнятися від вихідного сигналу попередніх варіантів здійснення винаходу. Однак, незалежно від того, який варіант здійснення винаходу використовується, діалоговий рівень переважного потоку буде залишатися погодженим, гарантуючи, що залишиться погодженим і сприйманий діалоговий рівень зведеного сигналу. Таким чином, згідно з іншою особливістю переважний сигнал, також може зазнати масштабування шляхом застосування масштабного коефіцієнта до переважного сигналу. Це додаткове масштабування переважного сигналу може служити, наприклад, для того, щоб допускати інтегруючу нормалізацію вхідних звукових сигналів у мікшуючому пристрої у випадку, якщо вхідні сигнали не були нормалізовані перед мікшуванням. Згідно з іншою особливістю, спосіб також може включати етап перевірки того, що параметр dialnorm інформаційного вмісту для вхідних сигналів заданий належним чином, і, можливо, забезпечення індикації у випадку, коли ця умова не задовольняється. Згідно з іншою особливістю, також передбачається пристрій для мікшування сигналів, який застосовує описаний вище спосіб мікшування сигналів. Подібним чином, також передбачається декодер, який застосовує описаний вище спосіб мікшування сигналів. Згідно з іншою особливістю, також передбачається носій даних, що читається процесором, , який зберігає в пам'яті машинозчитувані команди, призначені для виконання кожного з описаних вище способів. Подібним чином, також передбачається програмний продукт, що читається 7 UA 105590 C2 5 10 15 20 25 30 35 40 45 50 55 процесором, що включає команди, що виконуються, призначені для виконання кожного з описаних вище способів при виконанні на процесорі. Згідно з іншою особливістю, також передбачається пристрій для мікшування вхідних звукових сигналів у єдиний, зведений звуковий сигнал з погодженим сприйманим рівнем звуку. Пристрій включає приймач, призначений для приймання основного вхідного звукового сигналу, зв'язаного вхідного звукового сигналу й метаданих мікшування з інформацією масштабування. Пристрій також включає вхідний сигнал балансу мікшування, який указує регульований баланс між основним і зв'язаним сигналами. Пристрій також включає мікшер, сконфігурований для ідентифікації переважного сигналу, масштабування вхідних сигналів і об'єднання сигналів у зведений сигнал. Переважний сигнал ідентифікується шляхом аналізу інформації масштабування, що надається метаданими мікшування, й вхідним сигналом балансу мікшування, і непереважний сигнал зазнає масштабування відносно переважного сигналу. Крім того, також передбачається пристрій, призначений для мікшування вхідних звукових сигналів у єдиний, зведений звуковий сигнал з погодженим сприйманим рівнем звуку, де масштабний коефіцієнт для непереважного сигналу визначається прямо виходячи з інформації масштабування з метаданих мікшування й із вхідного сигналу балансу мікшування. Непереважний сигнал зазнає масштабування з використанням обумовленого масштабного коефіцієнта, і масштабований непереважний сигнал поєднується з переважним сигналом у зведений сигнал. Згідно з іншою особливістю, передбачається пристрій, призначений для мікшування вхідного звукового сигналу в єдиний, зведений звуковий сигнал з погодженим сприйманим рівнем звуку, який також сконфігурований для приймання метаданих мікшування, які інтегровані у зв'язаний вхідний звуковий сигнал. Вхідний сигнал балансу мікшування пристрою також може включати зовнішній вхідний сигнал від користувача, що доставляє величину зі значеннями в інтервалі від дуже великих негативних значень до дуже великих позитивних значень. Приймач пристрою також може конфігуруватися для приймання багатоканальних сигналів, де модуль мікшування сконфігурований для мікшування багатоканальних сигналів. Описані вище способи спроектовані для підтримки погодженого сприйманого рівня звуку у зведеному сигналі. Оскільки зазначені способи також можуть бути описані як регулювання рівня сигналу, описані вище способи, які масштабують сигнали, також можуть розглядатися в термінах регулювання рівня сигналу. Відповідно, для того, щоб узагальнити предмет винаходу як способи мікшування сигналів на основі результату, якого він досягає, вхідні сигнали повинні зазнати масштабування так, щоб результуюча різниця рівнів масштабування між масштабуванням основного сигналу й масштабуванням зв'язаного сигналу, по суті, являла собою суму масштабного коефіцієнта метаданих мікшування для основного сигналу й значення вхідного сигналу балансу мікшування. Аналогічно, якщо є присутнім масштабний коефіцієнт метаданих мікшування для зв'язаного сигналу, то результуюча різниця рівнів масштабування між масштабуванням основного сигналу й масштабуванням зв'язаного сигналу, по суті, являє собою суму різниці масштабних коефіцієнтів метаданих мікшування для основного сигналу й зв'язаного сигналу й значення вхідного сигналу балансу мікшування. За допомогою описаних вище способів автор інформаційного вмісту може впливати на різницю рівнів між основним і зв'язаним сигналами в усі моменти часу. Відповідно, кінцевий користувач також може впливати на різницю рівнів між основним і зв'язаним сигналами в усі моменти часу. Крім того, якщо вхідний сигнал балансу мікшування має нейтральну, нульову установку, сигнали мікшуються в точності так, як це визначається автором інформаційного вмісту. Способи, описані в даному описі, забезпечують плавне керування у всьому діапазоні вхідного сигналу балансу мікшування, на всьому шляху від основного сигналу як єдиного сигналу (коли зв'язаний сигнал повністю ослабляється) до іншої крайності, коли єдиним сигналом, що присутній при відтворенні, є зв'язаний сигнал (коли повністю ослабляється основний сигнал). Проте переважний сигнал має відрегульований рівень, і це означає, що, незалежно від значень метаданих мікшування або вхідного сигналу балансу мікшування, слухач не буде сприймати істотну зміну в рівні звуку при перемиканні від однієї програми до іншої. Так, для діалогового звукового сигналу користувач може вибрати діалог у фокусі, й переважний діалог завжди буде мати відрегульований рівень, оскільки переважний діалог пов'язаний з переважним сигналом. Способи й пристрої, у тому числі приклади й варіанти здійснення винаходу, описувані в даній патентній заявці, можуть використовуватися окремо або в комбінації з іншими способами й пристроями, розкритими в даному документі. Крім того, усі особливості способів і пристроїв, описані в даній патентній заявці, можуть довільно поєднуватися. Зокрема, характерні ознаки 8 UA 105590 C2 5 10 15 20 25 30 35 40 45 50 55 60 пунктів формули винаходу можуть поєднуватися один з одним довільним чином, що очевидно для фахівців у даній області. Короткий опис фігур Нижче винахід роз'ясняється шляхом використання прикладів з відсиланням до супровідних графічних матеріалів, де приклади проілюстровані наступними фігурами: Фіг. 1A показує рівні звуку в різних звукових програмах. Фіг. 1В показує рівні звуку в різних звукових програмах після регулювання рівня звуку. Фіг. 2 показує блок-схему телевізійної приставки з мікшером. Фіг. 3 показує схему процесів, призначених для ідентифікації переважного сигналу й мікшування вхідних сигналів. Фіг. 4 показує схему послідовності операцій для ідентифікації переважного сигналу й мікшування. Фіг. 5А показує графік масштабних коефіцієнтів для основного й зв'язаного сигналів для випадку, коли масштабний коефіцієнт метаданих мікшування рівний –10 дБ. Фіг. 5В показує приклад зчитування масштабних коефіцієнтів по фіг. 5А для основного й зв'язаного сигналів, де масштабний коефіцієнт метаданих мікшування рівний –10 дБ, для випадку, коли вхідний сигнал балансу мікшування, має значення +5 дБ. Фіг. 5С показує приклад зчитування масштабних коефіцієнтів по фіг. 5А для основного й зв'язаного сигналів, де масштабний коефіцієнт метаданих мікшування рівний –10 дБ, для випадку, коли вхідний сигнал балансу мікшування, має значення –15 дБ. Фіг. 6 показує блок-схему сигналу для мікшування багатоканальних сигналів 5.1. Фіг. 7А показує схему послідовності операцій прикладу мікшування багатоканальних сигналів 5.1. Фіг. 7В показує схему послідовності операцій визначення масштабного коефіцієнта для каналу LFE на етапі 703 по фіг. 7. Фіг. 8 показує блок-схему сигналу для мікшування багатоканального основного сигналу 5.1 зі зв'язаним сигналом 1.1 (моно+LFE). Докладний опис Впровадження метаданих звукового сигналу в цифровий аудіопоток, наприклад, у цифровому віщальному середовищі, є загальноприйнятою концепцією. Зазначені метадані являють собою "дані про дані", тобто дані про цифровий звуковий сигнал у потоці. Метадані можуть доставляти в аудіодекодер інформацію про те, яким чином відтворювати звуковий сигнал. Такі метадані, як правило, передаються поряд з бітовим потоком звукового сигналу. Ці метадані надають виготовлювачам інформаційного вмісту безпрецедентну можливість доставляти споживачам звуковий сигнал найвищої якості для деякого діапазону середовищ, призначених для прослуховування. Вони також передбачають варіанти, які дозволяють споживачам регулювати їхні установки для найкращої відповідності їх середовищам для прослуховування. Способи, описувані в даному документі, можуть застосовуватися до широкого діапазону форматів звукового сигналу й схем кодування. Для того щоб застосовувати зазначені способи, сигналам лише необхідно містити метадані, що супроводжують звуковий сигнал, що й доставляють інформацію мікшування. Вхідні сигнали можуть бути одноканальними, але часто будуть мати кілька каналів, як, наприклад, багатоканальні сигнали 5.1 із шістьма каналами: лівим, правим, центральним, лівим навколишнім, правим навколишнім і LFE (низькочастотних ефектів). Двома прикладами зазначених форматів звукового сигналу, які допускають зазначені метадані мікшування, є Dolby Digital Plus (DD+ або E-AC-3 (Enhanced AC-3)) і високоефективне перспективне звукове кодування (HE-AAC). Dolby Digital Plus (DD+ або E-AC-3 (Enhanced AC-3)) являє собою схему стиску цифрового звукового сигналу, яка являє собою вдосконалену систему кодування на основі кодека AC-3. EAC-3 підтримує до 13 повносмугових звукових каналів з бітовою швидкістю передачі кодованих даних 6,144 Мбіт/с. Наприклад, метадані DD+ докладно описуються в документі ETSI TS 102 366 v1.2.1, наприклад, "El.3.1.17 extpgmscl: Масштабний коефіцієнт зовнішньої програми — 6 біт: У деяких додатках можуть декодуватися й спільно мікшуватися два бітові потоки. Зазначене поле визначає масштабний коефіцієнт, який у ході мікшування слід застосувати до зовнішньої програми (тобто до програми, яка переноситься в окремому бітовому потоці або в незалежному бітовому потоці). Дане поле використовує той же масштаб, що й поле pgmscl". Найбільш підходящі метадані мікшування включають наступні ключі метаданих: extpgmscl, extpgmlscl, extpgmrscl, extpgmcscl, extpgmlsscl, extpgmrsscl, extpgmlfescl, pgmscl. У деяких випадках, наприклад, коли зв'язаний звуковий сигнал є монофонічним, також може використовуватися ключ метаданих panmean. 9 UA 105590 C2 5 10 15 20 25 30 35 40 45 50 55 Високоефективне перспективне звукове кодування (HE-AAC) являє собою схему стиску даних із втратами, призначену для цифрового звукового сигналу й обумовлену в документі ISO/IEC 14496-3 як профіль MPEG-4 Audio. Вона являє собою розширення ААС низької складності (AAC LC), оптимізоване для додатків з низькими бітовими швидкостями передачі даних, таких як потокове аудіо. Для підвищення ефективності стиску в частотній області профіль HE-AAC version 1 (HE-AAC v1) використовує реплікацію спектральної смуги (SBR). З метою підвищення ефективності стиску стереофонічних сигналів профіль HE-AAC version 2 (HEAAC v2) поєднує SBR з параметричним стереофонічним кодуванням (PS). Він є стандартизованою й удосконаленою версією кодека Aacplus. Найбільш підходящі метадані мікшування включають наступні ключі метаданих: AD_fade_byte, AD_gain_byte_center, AD_gain_byte_front, AD_gain_byte_surround і AD_pan_byte. HE-AAC використовується в таких стандартах цифрового радіомовлення, як DAB+ і Digital Radio Mondiale. Для того, щоб повною мірою скористатися їхніми можливостями, автори, або виготовлювачі, інформаційного вмісту повинні мати твердий контроль над метаданими звукового сигналу, які звичайно додаються в ході виготовлення й компонування. Як було описано в розділі Передумови, для того, щоб підтримувати погоджені рівні звуку для різних програм, найсучасніші звукові сигнали включають метадані, такі як метадані діалогового рівня, які використовуються для масштабування звукового сигналу. Зазначене масштабування дозволяє належним чином представляти кожний звуковий сигнал у формі, що допускає високоякісний і гарний стиск, але також і підтримку того самого рівня звуку. Фігура 1а показує приклад різних програм без зазначеного регулювання рівня, або нормалізації діалогового рівня. Як видно зі схеми, рівень звуку в різних програмах відрізняється, тому слухач при перемиканні від однієї програми до іншої може сприймати різний рівень звуку. Фігура 1а ілюструє рівні звуку для чотирьох різних програм S1, S2, S3 і S4, наприклад, у випадках, коли користувач перемикає канал, або в моменти часу t0, t1, t2, і t3 передається нова програма. Розвиток у часі показаний на горизонтальній осі, а рівень звуку - на вертикальній осі. Горизонтальна лінія А1 показує рівень звуку програми S1, яка виконується з моменту часу t0 до моменту часу t1. Аналогічно, горизонтальні лінії А2, А3 і А4, відповідно, показують рівень звуку програм S2, S3 і S4, які виконуються з моменту часу t1 до t2, від t2 до t3 і від t3 до t4. Як видно, рівень звуку А1 вище, ніж рівні звуку А2, А3 і А4. Для корекції зазначеної різниці в рівні звуку сигнали програм зазнають регулювання рівня, або масштабування, до загального номінального рівня. Так, фігура 1b показує сигнали програм після регулювання рівня до загального номінального рівня звуку. Номінальний рівень звуку для сигналів, як правило, представляється як середньозважений рівень, який часто задається в метаданих як присвоєння параметру dialnorm значення 31. Як видно на фігурі 1b, усі рівні звуку Α1', Α2', A3' і A4' є однаковими. Тому користувач при перемиканні між програмами не сприймає значну зміну в рівні звуку. У цей час, багато нових форматів звукових сигналів також дозволяють групувати з основним сигналом один або кілька зв'язаних сигналів. Ці звукові сигнали можуть активуватися або на основі установок пристрою, або на вибір користувача, наприклад, у ході відтворення. Як правило, зазначена активація включає об'єднання зв'язаного сигналу з його відповідним основним сигналом. Зазначене об'єднання сигналів в один сигнал називається мікшуванням. Наприклад, виготовлювач може передбачати доріжку коментарів режисера у звуковій доріжці, наприклад, на носії DVD video. Тоді слухач може використовувати телевізійну приставку або програвач DVD для активації цієї зв'язаної доріжки, яка часто накладається й мікшується з основним сигналом. Для того, щоб підтримувати такий же сприйманий рівень звуку, як в інших програмах, зазначений зв'язаний сигнал звичайно містить метадані, які визначають те, яким чином сигнали повинні мікшуватися. Метадані мікшування дозволяють виготовлювачеві точно управляти мікшуванням сигналів шляхом доставки конкретних подробиць про те, яким чином мікшувати сигнали, у тому числі, також включаючи можливість визначення деталей мікшування багатоканальних сигналів. Незважаючи на те, що метадані мікшування описують рівні мікшування так, як їх уявляє собі виготовлювач, у якийсь момент часу слухач може мати інше бажання у відношенні того, яким чином повинні мікшуватися сигнали. Так, слухач може вирішити, що він прагнув би, щоб "діалогом у фокусі" був інший сигнал. Таким чином, "діалог у фокусі" являє собою сигнал, який повинен переважати у зведеному сигналі. Однак зазначений "діалог у фокусі" є досить суб'єктивним. Автор інформаційного вмісту має уяву про те, який сигнал повинен перебувати у фокусі, однак для користувача також бажано, щоб він теж мав можливість управляти цим. Згідно з ідеями даної заявки, вказівка "користувацький фокус" може досягатися шляхом 10 UA 105590 C2 5 10 15 20 25 30 35 40 45 50 55 60 пропозиції керуючого вхідного сигналу балансу мікшування, призначеного для регулювання мікшування основного й зв'язаного сигналів. Таким чином, у випадку, коли користувач прагнув би відхилитися від зважування сигналу, обумовленого метаданими, шляхом регулювання зведеного сигналу на користь того або іншого сигналу, один з варіантів здійснення винаходу включає створення пристрою керування балансом мікшування, що робить можливим уведення вхідного сигналу балансу мікшування. Зазначений пристрій керування балансом мікшування дозволяє користувачеві вказувати, що один із сигналів повинен більшою мірою бути присутнім у зведеному сигналі, а також те, у якому ступені сигнал повинен бути переважним більшою мірою. Крім того, зазначений вхідний сигнал балансу мікшування надає користувачеві безпосереднє керування сигналом у фокусі. У стандартному положенні пристрій керування балансом мікшування нейтральний, що вказує на те, що мікшування повинне відбуватися так, як це вказується метаданими. Коли пристрій керування балансом мікшування повертається в одному з напрямків (у даному варіанті здійснення винаходу, у негативному напрямку), основний сигнал робиться голосніше щодо зв'язаного сигналу. Коли пристрій керування балансом мікшування повертається в іншому напрямку (у даному варіанті здійснення винаходу, у позитивному напрямку), зв'язаний сигнал робиться голосніше щодо основного сигналу. Однак, коли зазначений пристрій керування балансом мікшування або вхідний сигнал балансу мікшування потім використовується для підвищення або зниження рівнів основного й зв'язаного сигналів, імовірно, що рівень звуку, або сприйманий діалоговий рівень, зведеного сигналу буде, таким чином, змінений. Таким чином, імовірно, що перемикання між програмами, що містять і не містять активований зв'язаний сигнал, також буде приводити до небажаної ситуації, яка описана на фігурі 1а. Тому існує потреба в створенні способу мікшування зв'язаного й основного сигналів під дією вхідного сигналу балансу мікшування так, щоб сприйманий рівень звуку зведеного сигналу також підтримувався постійним. Способи, описувані в даному документі, можуть бути реалізовані в багатьох варіантах здійснення, таких як телевізійна приставка, переносний або непереносної звуковий програвач, мікшувальний пристрій, програвач DVD, телевізор, смартфон, телевізійний прийомний пристрій для комп'ютерної системи. Крім того, окремі особливості можуть реалізовуватися в комбінації із системами апаратного й програмного забезпечення. Компоненти одного конкретного варіанта здійснення винаходу будуть описані більш докладно на основі телевізійної приставки, що включає мікшер згідно зі способами, описуваними в даному документі. Даний варіант здійснення телевізійної приставки проілюстровано на фігурі 2. Телевізійна приставка 200 включає приймач 209, мікшер 204 і процесор 205. Незважаючи на те, що даний приклад показаний із цими компонентами, застосування способів, описуваних у даному документі, не слід обмежувати даною точною конфігурацією. Наприклад, приймач 209 може бути інтегровано в мікшер 204; крім того, телевізійна приставка 200 необов'язково потребує процесор, оскільки функціональна можливість може виконуватися традиційними електронними схемами. У даному прикладі приймач 209 телевізійної приставки 200 сконфігурований для приймання основного вхідного сигналу 201 і зв'язаного вхідного звукового сигналу 202, що включає відповідні метадані. У деяких випадках, приймач необхідно додатково адаптувати для приймання метаданих мікшування, які можуть передаватися або кодуватися окремо. Якщо буде потреба, приймач 209 може додатково конфігуруватися для декодування вхідних сигналів 201, 202 і відповідних метаданих 202а мікшування відповідно до кодування сигналів. Крім того, телевізійна приставка 200 і мікшер 204 також сконфігуровані для приймання керуючого вхідного сигналу 203 балансу мікшування. Необов'язково, приймач 209 також може конфігуруватися для виконання спеціального декодування керуючого вхідного сигналу 203 балансу мікшування. Для подальших характеристик і точної реалізації керуючого вхідного сигналу 203 балансу мікшування існують різні можливості. Наприклад, телевізійна приставка 200 може зв'язувати цей вхідний сигнал з віддаленим пристроєм керування для того, щоб дозволити користувачеві задавати зазначений рівень балансу мікшування за допомогою меню, до якого одержує доступ віддалений пристрій керування. Зрозуміло, телевізійна приставка 200, або її віддалений пристрій керування, може реалізовувати керуючий вхідний сигнал балансу мікшування за допомогою спеціально призначеного елемента, такого як номеронабирач для введення даних, клавіші "плюс" і "мінус" або подібний пристрій введення даних. Зрозуміло, телевізійна приставка 200 і мікшер 204 також можуть бути сконфігуровані для приймання вхідного сигналу 203 балансу мікшування як сигналу від іншої системи або пристрою. У кожному разі переважним сигналом 206 є вхідний сигнал, який ідентифікується процесором 204 мікшера 205 на основі основного вхідного сигналу 201, зв'язаного вхідного звукового сигналу 202, метаданих 202а мікшування й вхідного сигналу 203 балансу мікшування. Таким чином, непереважний сигнал 207 11 UA 105590 C2 5 10 15 20 25 30 35 40 45 50 55 60 представляє собою інший вхідний сигнал, який не визначається як той, що є переважним сигналом 206. Тоді масштабований непереважний сигнал 207s являє собою непереважний сигнал 207 після його масштабування. В остаточному підсумку переважний сигнал 206 і масштабований непереважний сигнал 207s мікшуються у зведений сигнал 208. На фігурі 3 проілюстровано один із прикладів розв'язку для досягнення зазначеної мети при мікшуванні звукових сигналів на основі конфігурації по фігурі 2. Так, вхідні сигнали складаються з основного вхідного сигналу 201, зв'язаного вхідного сигналу 202 і вхідного сигналу 203 балансу мікшування. У першу чергу, на етапі 301 основний вхідний сигнал 201 приймається мікшером 204, телевізійною приставкою 200 і/або приймачем 209. На етапі 302 ухвалюється зв'язаний вхідний сигнал 202, що включає метадані 202а мікшування. Відзначимо, що включення метаданих 202а мікшування у зв'язаний сигнал 202 призначене тільки для даного прикладу, і його не слід інтерпретувати як обмежуюче застосування способів, оскільки інші стандарти й формати кодування сигналу можуть відрізнятися. На етапі 303 приймається вхідний сигнал 203 балансу мікшування. Ці етапи включають будь-яке спеціальне декодування, яке може вимагати формат сигналів. Потім на етапі 304 інформація масштабування з метаданих 202а мікшування й вхідного сигналу 203 балансу мікшування використовується для ідентифікації переважного сигналу 206 серед підлягаючих мікшуванню вхідних сигналів 201, 202. Цей етап може виконуватися загальновідомим електронним пристроєм або схемою, оскільки він не вимагає яких-небудь високопотужних розрахунків, виміру, поглибленого аналізу або дискретизації вхідних сигналів. Потім, на необов'язковому етапі 305, безпосередньо виходячи з метаданих 202а мікшування й вхідного сигналу 203 балансу мікшування, може визначатися масштабний коефіцієнт для непереважного сигналу 207. На етапі 306 непереважний сигнал 207 зазнає масштабування. У випадку якщо масштабний коефіцієнт для непереважного сигналу 207 визначався на етапі 305 на основі метаданих 202а мікшування й вхідного сигналу 203 балансу мікшування, етап 306 включає масштабування непереважного сигналу відповідно до масштабного коефіцієнта, обумовленого на етапі 305. В остаточному підсумку, на етапі 307 масштабований непереважний сигнал 207s поєднується з переважним сигналом 206 як зведений сигнал 208 на завершальному етапі 308. Один з подальших варіантів здійснення винаходу включає необов'язковий етап 305, призначений для визначення масштабного коефіцієнта для непереважного сигналу 207 безпосередньо на основі метаданих 202а мікшування й вхідного сигналу 203 балансу мікшування. Фігура 4 показує схему послідовності операцій для зазначеного визначення в зазначеному подальшому варіанті здійснення винаходу. Ідентифікація переважного сигналу 206 ґрунтується на вхідному сигналі 203 балансу мікшування й метаданих 202а мікшування. У деяких випадках, метадані мікшування також можуть містити масштабний коефіцієнт для зв'язаного сигналу. Якщо зазначене значення метаданих є присутнім, то воно може використовуватися для коректування коефіцієнта метаданих, призначеного для мікшування сигналів. Так, на необов'язковому етапі 401 масштабний коефіцієнт для основного сигналу може коректуватися шляхом вирахування масштабного коефіцієнта для зв'язаного сигналу з масштабного коефіцієнта для основного сигналу. На етапі 402 значення вхідного сигналу 203 балансу мікшування рівняється зі скоректованим масштабним коефіцієнтом метаданих. У випадку, коли масштабний коефіцієнт на етапі 401 не коректується, значення вхідного сигналу 203 балансу мікшування рівняється з масштабним коефіцієнтом для основного сигналу з метаданих 202а мікшування. У випадку "так", - якщо вхідний сигнал 203 балансу мікшування більше, ніж масштабний коефіцієнт 202а метаданих мікшування, - то на етапі 403y зв'язаний сигнал 202 визначається як той, що є переважним сигналом 206, і основний сигнал 201 є непереважним сигналом 207. Інакше, у випадку "ні", - якщо значення вхідного сигналу 203 балансу мікшування менше або дорівнює масштабному коефіцієнту 202а метаданих мікшування, - то на етапі 403n основний сигнал 201 визначається як той, що є переважним сигналом 207, і зв'язаний сигнал 202 є непереважним сигналом 207. За обома етапами, 403у й 403n, йде етап 404, де непереважний сигнал 207 потім зазнає масштабування. На етапі 405 переважний сигнал 206 поєднується з масштабованим непереважним сигналом 207s, утворюючи на етапі 406 зведений сигнал 208. Фігура 5 показує графік, що ілюструє конкретний приклад масштабних коефіцієнтів, які підлягають застосуванню до основного й зв'язаного сигналів 201, 202 при мікшуванні зв'язаного сигналу 202 з основним сигналом 201. У даному прикладі масштабний коефіцієнт метаданих 202а мікшування зв'язаного сигналу 202 указує на те, що основний сигнал 201 повинен зазнати масштабування на –10 дБ. Зазначений масштабний коефіцієнт –10 дБ, призначений для масштабування основного сигналу 201 при мікшуванні зі зв'язаним сигналом 202, указує бажаний взаємозв'язок мікшування, заданий виготовлювачем інформаційного вмісту в ході 12 UA 105590 C2 5 10 15 20 25 30 35 40 45 50 55 60 мастерингу. Горизонтальна вісь на фігурі 5 показує вхідний сигнал 203 балансу мікшування, оскільки він змінюється від мінус нескінченності до плюс нескінченності. Вертикальна вісь указує масштабний коефіцієнт у дБ від –∞ до 0 знизу нагору. Обидва графіка по фігурі 5 показують масштабні коефіцієнти для двох вхідних сигналів, нанесені на графік для всіх значень вхідного сигналу балансу мікшування від –∞ дБ до +∞ дБ (значення вхідного сигналу балансу мікшування перебувають на горизонтальній осі). Два лінійні графіки, один - зі штриховою лінією, і другий - з пунктирною лінією, відповідно, представляють масштабні коефіцієнти для основного сигналу 201 і зв'язаного сигналу 202. Так, графік зі штриховою лінією 501а, 501b показує основний сигнал, а графік 502а, 502b показує зв'язаний сигнал. Як видно, коли вхідний сигнал 203 балансу мікшування перебуває в нейтральній установці, тобто при нулі дБ, вхідний сигнал 203 балансу не спричиняє впливу, і масштабним коефіцієнтом є масштабний коефіцієнт, що вказується в метаданих 202а: у даному прикладі, де зазначений масштабний коефіцієнт метаданих рівний –10 дБ, що вказує величину ослаблення основного сигналу відносно зв'язаних сигналів, зв'язаний сигнал 202, таким чином, є переважним сигналом 206 і не зазнає масштабування, а основний сигнал 201 зазнає масштабування відповідно до масштабного коефіцієнта метаданих, що дорівнює –10 дБ. Однак, як видно на фігурі, якщо вхідний сигнал 203 балансу робиться більш негативним, ніж масштабний коефіцієнт метаданих, тобто стає менше –10 дБ, то переважним сигналом 206 стає основний сигнал 201. Крім того, те, який із вхідних сигналів є переважним сигналом, додатково вказується на фігурі 5 мітками 501a, 501b і 502a, 502b, де горизонтальна лінія 501a представляє основний вхідний сигнал 201 тоді, коли він є переважним сигналом 206, діагональна лінія 501b представляє вхідний сигнал тоді, коли він є непереважним сигналом 207, горизонтальна лінія 502b представляє зв'язаний сигнал 202 тоді, коли він є переважним сигналом 206, і діагональна лінія 502a представляє зв'язаний сигнал тоді, коли він є непереважним сигналом 207. Для окремого прикладу зчитування масштабних коефіцієнтів у випадку по фігурі 5, фігура 5а показує масштабні коефіцієнти для випадку, коли вхідний сигнал 203 балансу мікшування має значення +5 дБ і, як і на фігурі 5, масштабний коефіцієнт метаданих мікшування для основного сигналу рівний –10 дБ. Згідно з фігурою, масштабний коефіцієнт 501 для основного сигналу 201, як видно, рівний –15 дБ, тобто –10-5= –15 дБ. Масштабний коефіцієнт 502а для зв'язаного сигналу 202 дорівнює 0 дБ. Оскільки переважним сигналом 206 є зв'язаний сигнал 202, очікується, що масштабний коефіцієнт для зв'язаного сигналу 202 повинен дорівнювати одиниці. Таким чином, якщо вхідний сигнал 203 балансу збільшується на користь зв'язаного сигналу 202, то зв'язаний сигнал 202 залишається переважним сигналом 206, зв'язаний сигнал 202 не зазнає масштабування, і масштабується тільки основний сигнал 201. З іншого боку, фігура 5b показує масштабні коефіцієнти для випадку по фігурі 5, де вхідний сигнал 203 балансу мікшування має значення –15 дБ і, як і на фігурі 5, масштабний коефіцієнт метаданих мікшування для основного сигналу становить –10 дБ. На фігурі можна бачити, що масштабний коефіцієнт для основного сигналу 501b дорівнює 0 дБ, тому основний сигнал 201 не зазнає масштабування, оскільки він є переважним сигналом 206, і що зв'язаний сигнал 202 зазнає масштабування зі зв'язаним масштабним коефіцієнтом 502b, що дорівнює –5 дБ, тобто – 15-(-10)=-5 дБ. Крім того, з фігур 5А, 5В и 5С видно, що, коли вхідний сигнал 203 балансу мікшування прирівнюється плюс нескінченності, основний сигнал 201 повністю ослабляється, і зв'язаний сигнал 202 не зазнає масштабування. Навпаки, коли вхідний сигнал 203 балансу мікшування прирівнюється мінус нескінченності, основний сигнал 201 не зазнає масштабування, і зв'язаний сигнал повністю пригнічується. Способи, описувані в даному документі, також можуть застосовуватися для мікшування багатоканальних сигналів. Оскільки метадані мікшування для багатоканальних сигналів можуть мати багато різних форм, як, наприклад, у загальновідомих багатоканальних сигналах вони можуть мати від 2 до 14 каналів (наприклад, 2 канали - для стереофонічного сигналу, 2 канали для монофонічного сигналу+LFE, 4 канали - для 3.1, 6 каналів - для 5.1, і 14 каналів - для 13.1), у даному документі спосіб буде описуватися через використання узагальнених ключів метаданих. На практиці фахівцям у даній області буде потрібно замінити узагальнені метадані, що перелічуються нижче, метаданими, відповідними до конкретного кодування, використовуваного сигналами. Так, нижче використовуються узагальнені терми "sclmain", "scl[ch]" і "pan", де "sclmain" - первинний масштабний коефіцієнт, "scl[ch]" - масштабний коефіцієнт для кожного окремого каналу, де [ch] - індекс каналу, і "pan" - необов'язкова величина, що вказує на те, яким чином канали повинні застосовуватися до зведеного сигналу з різною кількістю каналів (наприклад, те, яким чином монофонічний сигнал повинен застосовуватися до сигналу 5.1, наприклад, як 50 % монофонічного сигналу - на лівий канал, 13 UA 105590 C2 5 50 % - на правий канал або 0 % - на інші канали, або 60 % - на лівий канал, 40 % - на центральний канал, і 0 % - на правий, LFE і навколишні канали). Таблиця 1 показує узагальнене представлення метаданих мікшування (загальне для ES і PES), де перша колонка показує узагальнені ключі метаданих, друга колонка показує відповідні метадані для ES (наприклад, для Dolby Digital Plus, або DD+) і третя колонка показує відповідні метадані для PES (наприклад, для Dolby Pulse або DVB): Таблиця 1 Узагальнені Sclmain Sclasso scl[ch] Pan 10 15 20 25 30 35 ES (DD+) Extpgmscl Pgmscl Extpgmlscl, extpgmrscl, extpgmcscl, extpgmlsscl, extpgmrsscl, extpgmlfescl Panmean PES (DVB) AD_fade_byte — AD_gain_byte_center, AD_gain_byte_front, AD_gain_byte_surround AD_pan_byte У наступному розділі та псевдокоді, що приводиться нижче, вираз "pref" позначає значення 203 вхідного сигналу балансу мікшування, призначений для регулювання балансу між основним 201 і зв'язаним 202 сигналами. Значення вхідного сигналу 203 балансу мікшування може перебувати в інтервалі [-∞…+∞], де –∞ приводить до повного ослаблення зв'язаного сигналу 202, 0 являє собою нейтральне значення, що приводить до мікшування відповідно до метаданих 202а мікшування, і ∞ приводить до повного ослаблення основного сигналу 201. Для даного прикладу, що включає багатоканальний основний сигнал 5.1 201 і багатоканальний зв'язаний сигнал 5.1 202, застосування способів для багатоканального сигналу приводить до наступного псевдокоду, де gainA і gainM[ch] — ефективні коефіцієнти підсилення, або масштабні коефіцієнти, застосовувані, відповідно, на зв'язаному сигналі 202 і на каналах основного сигналу 201. Наведений нижче псевдокод діє в області дБ. Даний псевдокод виконується для кожного каналу вхідних сигналів. Таким чином, коли баланс мікшування має максимальне значення +∞ дБ, зв'язаний сигнал 202 є переважним сигналом 206 так, що основний сигнал 201 повністю ослабляється, і зведений сигнал 208, по суті, являє собою необмежений зв'язаний сигнал 202. Напроти, коли баланс 203 мікшування має мінімальне значення -∞ дБ переважним сигналом 206 є основний сигнал 201 так, що повністю ослабляється зв'язаний сигнал 202, і зведений сигнал 208, по суті, являє собою необмежений основний сигнал 201. Відзначимо, що в даному конкретному прикладі переважний сигнал також може в невеликій мірі зазнати масштабування у випадку, коли переважним сигналом є основний сигнал (рядок gainM [ch]=sclmain+scl[ch]-mainscltotal в операторі інакше). Це дозволяє алгоритму запобігати застосуванню позитивного коефіцієнта підсилення до основного сигналу, що можливо для метаданих DD+. Кінцевим результатом повинно бути те, що найгучніший канал основного сигналу обмежується 0 дБ, що приблизно узгоджується із загальним принципом, згідно з яким переважний сигнал повинен мати коефіцієнт підсилення, що дорівнює одиниці. 14 UA 105590 C2 5 10 15 20 25 30 35 40 45 50 55 60 Для застосування зазначеного псевдокоду до конкретного стандарту метаданих такі узагальнені змінні, як scl[ch], повинні заміщатися відповідними термами метаданих. Таким чином, ґрунтуючись на конкретній формі сигналів, у тому числі, на кількості каналів, типі кодування й доступних у сигналах метаданих, фахівці в даній області будуть здатні відобразити відповідні узагальнені ключі метаданих для конкретного випадку. У деяких особливих випадках не всі перераховані вище ключі метаданих можуть виявитися значущими. Наприклад, при мікшуванні двох багатоканальних сигналів 5.1 фахівці в даній області повинні мати можливість визначити, що метадані панорамування або відсутні, або повинні ігноруватися, оскільки зв'язаний сигнал уже містить ті ж канали, що й основний сигнал. У випадку, коли зв'язаний сигнал 202 є монофонічним, а основний сигнал 201 - ні, до зв'язаного сигналу 201, можливо, потрібно буде застосовувати коефіцієнти підсилення при панорамуванні. У цьому випадку, якщо зв'язаний сигнал 201 містить канал LFE, канал LFE може мікшуватися так, як це описується в наведеному вище псевдокоді, як sci[lfe]. Для мікшування DD+ з використанням метаданих мікшування рівня ES слід використовувати наступні ключі метаданих мікшування рівня ES: extpgmscl, panmean, extpgmlscl, extpgmrscl, extpgmcscl, extpgmlsscl, extpgmrsscl, extpgmlfescl, pgmscl. Як правило, усі інші метадані мікшування для мікшування не потрібні. Ключ метаданих dmxscl також може використовуватися при понижувальному мікшуванні, де знижувальне мікшування являє собою відображення сигналу у формат з іншою кількістю каналів. Ключ метаданих pgmscl, який представляє масштабний коефіцієнт для зв'язаного сигналу, також може використовуватися в ході мікшування для коректування масштабних коефіцієнтів метаданих для основного каналу. У наведеному вище псевдокоді pgmscl представлений змінною sclasso. З рядка псевдокоду "якщо (pref>mainscltotal–sclasso)» видно, що тоді змінна sclasso, яка в DD+ представляє ключ метаданих pgmscl, впливає на порівняння якщо там, де визначається переважний сигнал, оскільки sclasso віднімається із mainscltotal перед порівнянням з pref. Використання sclasso, однак, є необов'язковим, і якщо sclasso відсутнє, або використання цієї величини небажане, то pref просто порівнюється з mainscltotal. Для мікшування Dolby Pulse/HE-AAC з використанням метаданих мікшування рівня PES, наприклад, в DVB, повинні використовуватися наступні ключі метаданих мікшування рівня ES: AD_gain_byte_center, AD_gain_byte_front, AD_gain_byte_surround. Для одержання найкращих результатів максимальний результуючий коефіцієнт підсилення для кожної із сум [AD_gain_byte_center+AD_fade_byte], [AD_gain_byte_front+AD_fade_byte], [AD_gain_byte_surround+AD_fade_byte] не повинен перевищувати +12 дБ, і зазначені ефективні коефіцієнти підсилення повинні бути нормалізованими таким чином, щоб найвищий коефіцієнт підсилення не перевищував 12 дБ, і, у той же час, співвідношення між AD_gain_byte_center, AD_gain_byte_front, AD_gain_byte_surround повинні зберігатися, тобто AD_fade_byte=min(12 дБ, AD_fade_byte+max(AD_gain_byte_center, AD_gain_byte_front, AD_gain_byte_surround)). Фігура 6 показує подальший варіант здійснення мікшера 600, призначеного для мікшування багатоканального основного сигналу 5.1 610 з багатоканальним зв'язаним сигналом 5.1 620, що включають метадані 640 мікшування, наприклад, для сигналів Dolby Digital Plus (DD+ або E-AC3 (Enhanced AC-3)). Вхідні сигнали включають вхідний сигнал 601 балансу мікшування, основний сигнал 610 і зв'язаний сигнал 620 з метаданими 640 мікшування. У даному прикладі вхідний основний сигнал 610 і вихідний зведений сигнал 630 являють собою багатоканальні сигнали 5.1, що містять шість каналів: лівий, правий, центральний, лівий навколишній, правий навколишній і LFE (канал низькочастотних ефектів). Так, основний вхідний сигнал 610 включає шість каналів: лівий 611, правий 612, центральний 613, лівий навколишній 614, правий навколишній 615 і LFE (канал низькочастотних ефектів) 616. Зв'язаний сигнал 620 також включає шість каналів: лівий 621, правий 622, центральний 623, лівий навколишній 624, правий навколишній 625 і LFE (канал низькочастотних ефектів) 626. Метадані мікшування також включають первинний масштабний коефіцієнт 647 і масштабні коефіцієнти для шести каналів: лівого 641, правого 642, центрального 643, лівого навколишнього 644, правого навколишнього 645 і LFE (каналу низькочастотних ефектів) 646. У деяких випадках, метадані мікшування також можуть включати масштабний коефіцієнт для зв'язаного сигналу 648. Якщо зазначений масштабний коефіцієнт для зв'язаного сигналу відсутній, то він ігнорується або обробляється як 15 UA 105590 C2 5 10 15 20 25 30 35 40 45 50 55 60 рівний одиниці, або рівний 0 дБ. Мікшер також сконфігурований для приймання вхідного сигналу із вхідного сигналу 601 балансу мікшування. На основі метаданих 640 мікшування й вхідного сигналу 601 балансу мікшування масштабні коефіцієнти для кожного з каналів 651, 652, 653, 654, 655, 656 визначаються на основі логіки представленого вище псевдокоду, а також на основі показаної на фігурі 7А схеми послідовності операцій, що описує те, яким чином визначається масштабний коефіцієнт для кожного каналу. Кожний канал зазнає масштабування, виходячи з масштабних коефіцієнтів мікшування 651, 652, 653, 654, 655, 656, де первинне масштабування відбувається на непереважному сигналі і переважний сигнал зазнає масштабування мінімально або зовсім не зазнає масштабування. В остаточному підсумку, відповідні канали сигналів 660, 670 масштабованих каналів поєднуються у зведені канали, і тоді шість зведених каналів 631, 632, 633, 634, 635, 636 включають зведений вихідний сигнал 5.1 630. Таким чином, зведений вихідний сигнал 5.1 630 також включає шість каналів: лівий 631, правий 632, центральний 633, лівий навколишній 634, правий навколишній 635 і LFE (канал низькочастотних ефектів) 616, кожний з яких обчислюється відповідно до логіки по фігурі 7А. Фігура 7А показує схему послідовності операцій, що описує приклад мікшування багатоканального вхідного основного сигналу 5.1 610 з багатоканальним вхідним зв'язаним сигналом 5.1 620 згідно з фігурою 6, де переважний сигнал 206 також може в невеликій мірі зазнати масштабування у випадку, коли переважним сигналом 206 є основний сигнал 610. Як показано на фігурі 6, вхідні сигнали включають вхідний сигнал 601 балансу мікшування, основний сигнал 610 і зв'язаний сигнал 620 з метаданими 640 мікшування, де вхідні сигнали й зведений вихідний сигнал 630 являють собою багатоканальні сигнали 5.1. Так, сигнали 610, 620, 630 включають шість каналів, а метадані 640 мікшування включають первинний масштабний коефіцієнт 647 і масштабні коефіцієнти для шести каналів: лівого 641, правого 642, центрального 643, лівого навколишнього 644, правого навколишнього 654 і LFE (каналу низькочастотних ефектів) 646. У деяких випадках метадані 640 мікшування також можуть включати масштабний коефіцієнт для зв'язаного сигналу, sclasso 648. Якщо sclasso 648 відсутній, або його використання при мікшуванні небажане, для sclasso 648 використовується значення 0 дБ, і регулювання інших масштабних коефіцієнтів не проводиться. На етапі 701 максимальний масштабний коефіцієнт із п'яти "нормальних каналів", лівого 641, правого 642, центрального 643, лівого навколишнього 644 і правого навколишнього 645, визначається як "maxsci". Потім на етапі 702 mainscltotal обчислюється як сума sclmain 647 і maxsci, де sclmain 647 - первинний масштабний коефіцієнт із метаданих мікшування, maxsci - максимальний серед масштабних коефіцієнтів нормальних каналів 641, 642, 643, 644, 645. Етап 703, на якому визначається масштабний коефіцієнт LFE, більш докладно описано на фігурі 7а. Фігура 7В показує схему послідовності операцій, що представляє деталі етапу 703 по фігурі 7А, призначені для визначення масштабного коефіцієнта для каналу LFE відносно прикладу мікшування двох багатоканальних сигналів 5.1 по фігурі 7А. На етапі 703а метадані мікшування для каналу 646 LFE порівнюються з максимальним масштабним коефіцієнтом серед інших каналів, maxscl, обумовленим на етапі 701 по фігурі 7А. Якщо масштабний коефіцієнт 646 LFE більше або рівний maxscl, то на етапі 703y масштабний коефіцієнт для каналу LFE, gain[lfe] 656, визначається як maxscl. Інакше, у негативному випадку, на етапі 703n масштабний коефіцієнт для каналу LFE, gain[lfe] 656, визначається як з метаданих мікшування для каналу 646 LFE. Потім на етапі 703c коефіцієнт підсилення gain[Ife] 646 визначається зі значень, обчислених на етапах 703y або 703n. Коефіцієнт gain[lfe] 656, який являє собою масштабний коефіцієнт, що підлягає застосуванню до каналу LFE при мікшуванні сигналів, буде пізніше використовуватися на етапах 707n і 707y по фігурі 7А. Вертаючись до фігури 7А, потім на етапі 704 pref, який являє собою значення 601 вхідного сигналу балансу мікшування, порівнюється з mainscltotal мінус sclasso 648, де sclasso 648 масштабний коефіцієнт для зв'язаного сигналу. Відзначимо, що sclasso 648 може бути відсутнім або може ігноруватися, і в цьому випадку pref просто порівнюється з mainscltotal. Наприклад, для сигналів DD+ змінної sclasso 648 відповідає ключ метаданих pgmscl. Якщо pref 602 більше, ніж mainscltotal мінус sclasso 648, то на етапі 705y зв'язаний сигнал 620 визначається як той, що є переважним сигналом 206. Тоді на етапі 706y коефіцієнт підсилення для зв'язаного сигналу відсутній, оскільки він є переважним сигналом, і, таким чином, коефіцієнт підсилення для зв'язаного сигналу дорівнює одиниці, або нулю дБ, що вказує на те, що зв'язаний сигнал є необмеженим. Тоді на етапі 707y коефіцієнт підсилення для кожного каналу основного сигналу для всіх каналів (лівого, правого, центрального, лівого навколишнього, правого навколишнього й LFE) gainM[ch] 651, 652, 653, 654, 655 визначається як сума первинного масштабного коефіцієнта, sclmain 647, і масштабних коефіцієнтів для нормальних каналів scl[ch] 641, 642, 16 UA 105590 C2 5 10 15 20 25 30 35 40 45 50 55 643, 644, 645 мінус pref 602 мінус sclasso. Обчислення на етапі 707y повторюється для всіх шести каналів основного сигналу. Якщо розв'язок на етапі 704 є негативним, оскільки pref 602 не перевищує mainscltotal, то на етапі 705n основний сигнал визначається як той, що є переважним сигналом. Тоді на етапі 706n коефіцієнт підсилення для зв'язаного сигналу, gainA, визначається як pref 602 мінус mainscltotal плюс sclasso 648. У даному особливому випадку цього конкретного прикладу основний сигнал 610 також зазнає масштабування, хоча він визначається як той, що є переважним сигналом, і масштабні коефіцієнти 651, 652, 653, 654, 655, 656 для кожного каналу основного сигналу 620 обчислюються як sclmain 647 плюс масштабний коефіцієнт для відповідних каналів scl[ch] 641, 642, 643, 644, 645 мінус mainscltotal. Таким чином, на етапі 707n коефіцієнт підсилення для кожного каналу основного сигналу для всіх каналів (лівого, правого, центрального, лівого навколишнього, правого навколишнього й LFE), gainM[ch] 651, 652, 653, 654, 655, визначається як сума sclmain 647 і scl[ch] 641, 642, 643, 644, 645 мінус mainscltotal. Обчислення на етапі 707n повторюється для всіх шести каналів. Коефіцієнти підсилення з етапів 706y, 707y, 706n і 707n, а також вхідні сигнали 620, 610 потім подаються на етап 708, де кожний канал основного 611, 612, 613, 614, 615, 616 і зв'язаного 621, 622, 623, 624, 625, 626 сигналів масштабуються відповідно до обумовлених масштабних коефіцієнтів 651, 652, 653, 654, 655, 656. Відзначимо, що в типовому випадку масштабування зазнає тільки переважний сигнал, але в даному особливому випадку непереважний сигнал також може зазнати масштабування. Потім на етапі 709, який повторюється для кожного із шести каналів, масштабований зв'язаний 670 і основний 660 сигнали для кожного каналу мікшуються в шість зведених каналів 631, 632, 633, 634, 635, 636. В остаточному підсумку, на етапі 710 шість зведених каналів 631, 632, 633, 634, 635, 636 поєднуються в єдиний сигнал, який включає зведений вихідний сигнал 5.1 630 на етапі 711. Фігура 8 показує подальший варіант здійснення мікшера 800, призначеного для мікшування багатоканального основного сигналу 5.1 810 з 2-канальним зв'язаним сигналом 820 моно+LFE, що включають метадані 840 мікшування, наприклад, для сигналів Dolby Digital Plus (DD+ або EAC-3 (Enhanced AC-3)). Вхідний сигнал включає вхідний сигнал 801 балансу мікшування, основний сигнал 810 і зв'язаний сигнал 820 з метаданими 840 мікшування. У даному прикладі вхідний основний сигнал 810 і вихідний зведений сигнал 830 являють собою багатоканальні сигнали 5.1, що містять шість каналів: лівий, правий, центральний, лівий навколишній, правий навколишній і LFE (канал низькочастотних ефектів). Так, основний вхідний сигнал 810 включає шість каналів: лівий 811, правий 812, центральний 813, лівий навколишній 814, правий навколишній 815 і LFE (канал низькочастотних ефектів) 816. Зв'язаний сигнал 820 моно+LFE включає тільки два канали: центральний 823 і LFE (канал низькочастотних ефектів) 826. Метадані мікшування також включають метадані зі значеннями масштабування для первинного масштабного коефіцієнта 847 і шести каналів: лівого 841, правого 842, центрального 843, лівого навколишнього 844, правого навколишнього 845 і LFE (каналу низькочастотних ефектів) 846. Мікшер 800 також сконфігурований для приймання вхідного сигналу із вхідного сигналу 801 балансу мікшування. На основі метаданих 840 мікшування й вхідного сигналу 801 балансу мікшування масштабний коефіцієнт для кожного каналу 851, 852, 853, 854, 855, 856 визначається на основі логіки в наведеному вище псевдокоді, а також на показаній фігурі 7, яка являє собою схему послідовності операцій, що описує те, яким чином визначається масштаб для кожного каналу. Масштабування зазнає кожний канал непереважного вхідного сигналу 207, у той час як переважний сигнал 206, як правило, взагалі не зазнає масштабування або, в особливих випадках, зазнає масштабування лише мінімально. Для панорамування монофонічного каналу моно+LFE каналу у зв'язаному сигналі на 5.1 каналів використовується величина panmean. Panmean являє собою величину зі значеннями в інтервалі від 0 до 239, що представляють інтервал 0-358,5 градусів із кроком 1,5 градусів, де 0 градусів являє собою напрямок центрального гучномовця. Для ознайомлення з подробицями застосування panmean див. Розділ "E.4.3.5 Panning" стандарту ETSI TS 102 366 v1.2.1. В остаточному підсумку, шість пар каналів для двох масштабованих вхідних сигналів попарно для кожного каналу поєднуються в шість зведених каналів 831, 832, 833, 834, 835, 836. Шість зведених каналів 831, 832, 833, 834, 835, 836 потім становлять зведений вихідний сигнал 5.1 830. Таким чином, зведений вихідний сигнал 5.1 830 також включає шість каналів: лівий 831, правий 832, центральний 833, лівий навколишній 834, правий навколишній 835 і LFE (канал низькочастотних ефектів) 836, кожний з яких обчислюється відповідно до логіки по фігурі 7. У цілому, для досягнення найкращих результатів, тип каналів зведеного сигналу повинен бути таким же, як у декодованому основному звуковому сигналі, хоча він, зрозуміло, може змінюватися, наприклад, зазнати понижувального мікшування, на більш пізніх етапах. У 17 UA 105590 C2 5 10 15 20 25 30 35 40 45 50 55 60 більшості випадків очікується невелике значення вхідного сигналу балансу мікшування, як правило, до 10 дБ, незважаючи на те, що спосіб підтримує довільно великі (і малі) значення. У деяких випадках кількість каналів основного й зв'язаного сигналів може відрізнятися. У такому випадку, способи, описувані в даному документі, як і раніше можуть застосовуватися за умови, що деякі із вхідних каналів, можливо, потрібно буде відображати в канали зведеного сигналу, які можуть бути присутніми або відсутніми у вхідному сигналі. Для досягнення найкращих результатів зв'язаний сигнал повинен містити тільки ті положення каналів, які також присутні й в основному сигналі, якщо тільки зв'язаний сигнал не є монофонічним (acmod 1), або, інакше, канали зв'язаного сигналу можуть відповідним чином відображатися в канали основного сигналу. Аналогічно, канал низькочастотних ефектів (LFE), тільки переважно, повинен бути присутнім у зв'язаному сигналі, якщо основний сигнал також містить канал LFE. Інакше, канал LFE зв'язаного сигналу в процесі мікшування повинен ігноруватися. Аналогічно, якщо зв'язаний сигнал являє собою сигнал моно+LFE, LFE, переважно, повинен зазнати мікшування з LFE основного звукового сигналу, а монофонічний канал, переважно, повинен зазнати панорамування на основні канали основного звукового сигналу. Як правило, у процесі мікшування переважно, щоб вхідні сигнали були нормалізованими. Нормалізація може застосовуватися або перед визначенням, або після визначення переважного сигналу, оскільки результати будуть однаковими. На практиці переважно переконатися, що значення параметра dialnorm інформаційного вмісту вхідних сигналів задане правильно і, як для основного, так і для зв'язаного сигналу перед мікшуванням, перебуває на діалоговому рівні 31. Відповідно, рівень переважного сигналу, який розглядається як "сигнал у фокусі", в ідеалі повинен виходити з мікшера зі значенням dialnorm 31. Якщо вхідні сигнали не є нормалізованими, то нормалізація, як правило, повинна виконуватися перед мікшуванням, хоча способи можуть застосовуватися й без нормалізації, а нормалізації при необхідності потім зазнає зведений сигнал. При мікшуванні багатоканальних сигналів співвідношення між scl[ch] у вихідному сигналі, переважно, повинні зберігатися. Однак якщо scl[ch] має значення більше, ніж у всіх інших scl[ch] (переданих або нульових за замовчуванням), його слід модифікувати в напрямку максимального значення для інших scl[ch]. Слід зазначити, що для сигналів Dolby Pulse метадані мікшування, як правило, включаються в потік Sub Audio, як вказується в Розділі "E.2" документа ETSI TS 101 154 V1.9.1 і в ETSI TS 102 366 V1.2.1, Annex E. (см. також DVB blue book A0001 r8). Незалежно від того, яким чином метадані передаються або впаковуються в сигналі потоку, способи, описані в даному документі, як і раніше можуть застосовуватися доти, поки метадані доступні. Тому для обробки зазначеного випадку описані варіанти здійснення й приклади можуть вимагати адаптації. Наведений вище приклад зв'язаної доріжки, що містить коментарі режисера, є тільки одним із прикладів. Описані способи, однак, можуть застосовуватися для будь-якого мікшування основного й зв'язаного сигналів незалежно від інформаційного вмісту, що міститься в сигналах. Наприклад, перший сигнал може містити прямий ефір спортивної програми, де другий сигнал забезпечує коментар місцевою мовою й/або коментар іншою мовою. Існує безліч можливостей для того, яким чином можна поширювати ці сигнали. Наприклад, перший сигнал може являти собою загальну звукову доріжку без коментарів, а другий сигнал може являти собою коментар місцевою мовою. Ще один випадок використання способів, описуваних у даному документі, може відноситися до окремої доріжки для слабочуючих, де зв'язаний сигнал містить спеціальні посилення, призначені для поліпшення розуміння діалогу. Подібним чином, у допомогу слабозорим глядачам зв'язаний сигнал може містити мовне роз'яснення вмісту сцен. Однак описані в даному документі способи не обмежуються єдино діалогом, але також можуть застосовуватися до всіх типів звукових сигналів, таким як музика, оскільки способи ґрунтуються на сприйманому рівні звуку. Наприклад, відносно музики, зв'язана доріжка може містити голос або додаткову накладену інструментальну доріжку для музики; іншими словами, основна доріжка може являти собою основну інструментальну доріжку з, скажемо, фортепіано або акустичною гітарою, перша зв'язана доріжка може містити голосове накладення, друга зв'язана доріжка - рок-музику з електро- і бас-гітарами, і третя доріжка - накладення техно із твердим швидким басовим бітом. У цьому випадку, автор інформаційного вмісту має можливість задавати бажані характеристики мікшування, що визначають те, яким чином повинна мікшуватися кожна зв'язана доріжка, і описані в даному документі способи могли б дозволити слухачеві модифікувати ці установки відповідно до його вимог шляхом регулювання вхідного сигналу балансу для мікшованих сигналів. У якості іншого прикладу, зазначені способи також можуть застосовуватися до музичного сигналу, у якому різні канали містять різні музичні 18 UA 105590 C2 5 10 15 20 25 30 35 40 можливості, такі як інструменти типу струнних або ударні й вокал, де різні канали мікшуються за допомогою метаданих і вхідного сигналу балансу мікшування. Способи, описані в даному документі, покладаються на визначення переважного сигналу в мікшованому сигналі. Тому сигнал, який визначається як той, що є переважним сигналом, одержує вищий повний коефіцієнт підсилення. На додаток до підтримки постійного сприйманого рівня звуку зведеного сигналу шляхом використання пристрою керування вхідним сигналом балансу мікшування користувач може управляти балансом мікшування в усі моменти часу. Крім того, зміни коефіцієнта підсилення також є плавними у всьому діапазоні. Незважаючи на те, що способи, описані в даному документі, були проілюстровані на таких конкретних прикладах, як мікшування багатоканальних сигналів, що містять діалогові доріжки, зазначені способи не слід обмежувати цими прикладами або варіантами здійснення винаходу, оскільки зазначені способи можуть рівною мірою застосовуватися в ситуаціях, коли основний і зв'язаний сигнали мають дуже різний склад, доти, поки при визначенні переважного сигналу для зведеного сигналу можуть бути використані метадані мікшування й вхідний сигнал балансу мікшування. У даному документі описані різні способи й схеми мікшування звукових сигналів. Використовуючи ці способи й/або такі пристрої, як мікшери сигналів, можна підтримувати сумісний сприйманий рівень звуку для зведеного сигналу, при цьому допускаючи регулювання балансу між основним і зв'язаним сигналом. Способи можуть виконуватися без дискретизації або аналізу вхідних сигналів або високопотужної обробки, оскільки обчислення можуть легко виконуватися в реальному часі з використанням метаданих, що супроводжують вхідні сигнали, за допомогою відносно простих і базових електронних пристроїв. Слід зазначити, що опис і графічний матеріали ілюструють єдино принципи запропонованих способів і систем. Тому слід прийняти в увагу, що фахівці в даній області будуть здатні розробити різні схеми, які, хоча й не описуються в прямій формі в даному документі, здійснюють принципи запропонованих способів і систем і розглядаються як частина розкриття даного документа. Крім того, усі твердження в даному документі, що перераховують принципи, особливості й варіанти здійснення запропонованих способів і пристроїв, а також їх конкретні приклади, передбачаються як еквіваленти, що охоплюють їх. Крім того, усі приклади, перераховані в даному документі, переважно й у прямій формі призначаються тільки для педагогічних цілей, для того, щоб допомогти читачеві в розумінні принципів запропонованих способів і пристроїв, а також концепцій, внесених авторами винаходу з метою розвитку даної області техніки, і їх слід тлумачити як ті, що мають місце без обмеження зазначеними конкретно перерахованими прикладами й умовами. Крім того, слід враховувати, що будь-які блок-схеми в даному документі представляють концептуальні представлення ілюстративних пристроїв, що здійснюють принципи винаходу. Подібним чином, слід прийняти в увагу, що будь-які схеми послідовностей операцій, діаграми станів, псевдокоди й т.п. представляють різні процеси, які, по суті, можуть бути представлені на машинозчитуваному носієві й, таким чином, виконуватися комп'ютером або процесором незалежно від того, чи показаний зазначений комп'ютер або процесор у прямій формі. ФОРМУЛА ВИНАХОДУ 45 50 55 1. Спосіб мікшування двох вхідних звукових сигналів у єдиний зведений звуковий сигнал з підтримкою сприйманого рівня звуку зведеного звукового сигналу, при цьому спосіб включає етапи, на яких: приймають основний вхідний звуковий сигнал; приймають зв'язаний вхідний звуковий сигнал; причому зв'язаний вхідний звуковий сигнал з'єднують із основним вхідним звуковим сигналом; приймають метадані мікшування, які містять інформацію масштабування, призначену для масштабування основного вхідного звукового сигналу і які визначають яким чином повинні бути мікшовані основний вхідний звуковий сигнал і зв'язаний вхідний звуковий сигнал, для того щоб генерувати зведений звуковий сигнал на сприйманому рівні звуку; причому інформація масштабування з метаданих мікшування містить масштабний коефіцієнт метаданих для основного вхідного звукового сигналу, для масштабування основного вхідного звукового сигналу щодо зв'язаного вхідного звукового сигналу; приймають вхідний сигнал балансу мікшування, який указує регульований баланс між основним вхідним звуковим сигналом і зв'язаним вхідним звуковим сигналом, причому вхідний сигнал балансу мікшування містить інформацію масштабування, яка дозволяє відхилення від 19 UA 105590 C2 5 10 15 20 25 30 35 40 45 50 55 60 зважування основного вхідного звукового сигналу й зв'язаного вхідного звукового сигналу у зведеному звуковому сигналі, як визначено в метаданих мікшування; ідентифікують переважний сигнал або як основний вхідний звуковий сигнал, або як зв'язаний вхідний звуковий сигнал з інформації масштабування, що надається метаданими мікшування, і із вхідного сигналу балансу мікшування, де відповідний інший вхідний сигнал тоді ідентифікують як непереважний сигнал; і де переважний сигнал ідентифікують за допомогою порівняння вхідного сигналу балансу мікшування з масштабним коефіцієнтом метаданих для основного вхідного звукового сигналу; масштабують непереважний сигнал щодо переважного сигналу; і поєднують масштабований непереважний сигнал з переважним сигналом для вироблення зведеного звукового сигналу. 2. Спосіб за п. 1, який відрізняється тим, що додатково включає етап, на якому: визначають масштабний коефіцієнт, призначений для масштабування непереважного сигналу, на основі інформації масштабування з метаданих мікшування й вхідного сигналу балансу мікшування; де визначений масштабний коефіцієнт використовують для масштабування непереважного сигналу. 3. Спосіб за будь-яким з пп. 1-2, який відрізняється тим, що якщо значення вхідного сигналу балансу мікшування більше, ніж масштабний коефіцієнт метаданих для основного вхідного звукового сигналу з метаданих мікшування, то зв'язаний вхідний звуковий сигнал визначають як той, що є переважним сигналом; інакше - основний вхідний звуковий сигнал визначають як той, що є переважним сигналом. 4. Спосіб за будь-яким з пп. 1-3, який відрізняється тим, що зв'язаний вхідний звуковий сигнал ідентифікують як той, що є переважним сигналом, де спосіб додатково включає етап, на якому: обчислюють масштабний коефіцієнт для основного вхідного звукового сигналу як масштабний коефіцієнт метаданих для основного вхідного звукового сигналу з метаданих мікшування мінус значення вхідного сигналу балансу мікшування. 5. Спосіб за будь-яким з пп. 1-3, який відрізняється тим, що основний вхідний звуковий сигнал ідентифікують як той, що є переважним сигналом, де спосіб додатково включає етап, на якому: обчислюють масштабний коефіцієнт для зв'язаного вхідного звукового сигналу як значення вхідного сигналу балансу мікшування мінус масштабний коефіцієнт метаданих з метаданих мікшування для основного вхідного звукового сигналу. 6. Спосіб за будь-яким з пп. 1-5, який відрізняється тим, що метадані мікшування втримуються у зв'язаному вхідному звуковому сигналі. 7. Спосіб за будь-яким з пп. 1-6, який відрізняється тим, що основний вхідний звуковий сигнал містить кілька звукових каналів. 8. Спосіб за п. 7, який відрізняється тим, що метадані мікшування додатково включають: первинний масштабний коефіцієнт метаданих для основного вхідного звукового сигналу щодо зв'язаного вхідного звукового сигналу; та один або кілька масштабних коефіцієнтів метаданих для різних каналів основного вхідного звукового сигналу щодо зв'язаного вхідного звукового сигналу. 9. Спосіб за будь-яким з пп. 1-8, який відрізняється тим, що масштабний коефіцієнт включає значення в дБ. 10. Спосіб за будь-яким з пп. 8-9, який відрізняється тим, що переважний сигнал ідентифікують шляхом порівняння значення вхідного сигналу балансу мікшування з первинним і канальним масштабними коефіцієнтами метаданих для основного вхідного звукового сигналу, і якщо значення вхідного сигналу балансу мікшування більше, ніж сума первинного масштабного коефіцієнта метаданих для основного вхідного звукового сигналу плюс максимальний серед усіх канальних масштабних коефіцієнтів метаданих для всіх каналів основного вхідного звукового сигналу, то зв'язаний вхідний звуковий сигнал визначають як той, що є переважним сигналом; інакше - основний вхідний звуковий сигнал визначають як той, що є переважним сигналом. 11. Спосіб за п. 10, який відрізняється тим, що зв'язаний вхідний звуковий сигнал ідентифікують як той, що є переважним сигналом, при цьому спосіб додатково включає етап, на якому: обчислюють канальний масштабний коефіцієнт для кожного каналу основного вхідного звукового сигналу, причому канальний масштабний коефіцієнт для каналу є первинним масштабним коефіцієнтом метаданих для основного вхідного звукового сигналу плюс канальний масштабний коефіцієнт метаданих для відповідного каналу основного вхідного звукового сигналу мінус значення вхідного сигналу балансу мікшування. 20 UA 105590 C2 5 10 15 20 25 30 35 40 45 50 55 12. Спосіб за п. 10, який відрізняється тим, що основний вхідний звуковий сигнал ідентифікують як той, що є переважним сигналом, при цьому спосіб додатково включає етапи, на яких: визначають масштабний коефіцієнт для зв'язаного вхідного звукового сигналу, що обчислюється як значення вхідного сигналу балансу мікшування мінус сума первинного масштабного коефіцієнта метаданих для основного вхідного звукового сигналу й максимального серед усіх канальних масштабних коефіцієнтів метаданих для всіх каналів основного вхідного звукового сигналу; і визначають масштабний коефіцієнт для кожного каналу основного вхідного звукового сигналу, що обчислюється як первинний масштабний коефіцієнт для основного вхідного звукового сигналу плюс канальний масштабний коефіцієнт для відповідного каналу основного вхідного звукового сигналу мінус сума первинного масштабного коефіцієнта метаданих і максимального серед усіх канальних масштабних коефіцієнтів для каналів основного вхідного звукового сигналу. 13. Спосіб за будь-яким з пп. 10-12, який відрізняється тим, що масштабні коефіцієнти метаданих, призначені для визначення переважного сигналу, додатково включають масштабний коефіцієнт для зв'язаного вхідного звукового сигналу, який можуть використовувати як регулювання, де масштабний коефіцієнт для зв'язаного вхідного звукового сигналу віднімають від масштабного коефіцієнта метаданих для основного вхідного звукового сигналу для визначення переважного сигналу. 14. Спосіб за будь-яким з пп. 1-13, який відрізняється тим, що сприйманий рівень звуку заснований на середньозваженому рівні основного вхідного звукового сигналу й зв'язаного вхідного звукового сигналу. 15. Спосіб за будь-яким з пп. 1-13, який відрізняється тим, що сприйманий рівень звуку заснований на діалоговому рівні основного вхідного звукового сигналу й зв'язаного вхідного звукового сигналу. 16. Спосіб за п. 15, який відрізняється тим, що діалоговий рівень вимірюють як значення параметра dialnorm. 17. Спосіб за будь-яким з пп. 1-16, який відрізняється тим, що основний вхідний звуковий сигнал і зв'язаний вхідний звуковий сигнал кодують як сигнали Dolby Digital Plus "DD+" або Dolby Pulse. 18. Спосіб за будь-яким з пп. 1-16, який відрізняється тим, що основний вхідний звуковий сигнал і зв'язаний вхідний звуковий сигнал кодують як звукові сигнали Е-АС-3, MPEG-4 НЕ-ААС, aacplus, АС-3, MPEG-1 Layer 2, MPEG-4 ААС або будь-які похідні від MPEG-4. 19. Спосіб за п. 17 або п. 18, який відрізняється тим, що метадані мікшування включають метадані мікшування згідно з ETSI TS 102 366 VI.2.1 Ch. E.I.2.2 для мікшування сигналів DD+. 20. Спосіб за п 8 та п. 19, який відрізняється тим, що метадані мікшування включають масштабні коефіцієнти для ряду звукових каналів: extpgmscl, extpgmlscl, extpgmrscl, extpgmcscl, extpgmlsscl, extpgmrsscl, extpgmlfescl, що відповідають первинному масштабному коефіцієнту й масштабним коефіцієнтам для лівого каналу, правого каналу, центрального каналу, лівого навколишнього каналу, правого навколишнього каналу, каналу низькочастотних ефектів, названого "LFE"; і причому метадані мікшування, необов'язково, додатково включають величину panmean. 21. Спосіб за п. 20, який відрізняється тим, що основний вхідний звуковий сигнал додатково включає канал низькочастотних ефектів, названий "LFE", і канальний масштабний коефіцієнт для каналу LFE обчислюють як мінімальний канальний масштабний коефіцієнт для каналу LFE і максимальний масштабний коефіцієнт метаданих для інших каналів основного вхідного звукового сигналу. 22. Спосіб за п. 17 або п. 18, який відрізняється тим, що метадані мікшування включають метадані мікшування згідно з ETSI TS 101 154 VI.9.1 Annex E2 для мікшування вхідних звукових сигналів. 23. Спосіб за п. 8 та п. 22, який відрізняється тим, що метадані мікшування включають масштабні коефіцієнти для ряду звукових каналів: AD_fade_byte, AD_gain_byte_center, AD_gain_byte_front, AD_gain_byte_surround або AD_pan_byte, що відповідають первинному масштабному коефіцієнту й канальним масштабним коефіцієнтам для центрального каналу, одного або більше фронтальних каналів, одного або більше навколишніх каналів і панорамування. 24. Спосіб за п. 10, який відрізняється тим, що основний вхідний звуковий сигнал включає канал низькочастотних ефектів, названий "LFE", і причому канал LFE виключають із 21 UA 105590 C2 5 10 15 20 25 30 35 40 45 50 55 60 максимального серед усіх канальних масштабних коефіцієнтів метаданих для всіх каналів основного вхідного звукового сигналу так, що: якщо значення вхідного сигналу балансу мікшування більше, ніж сума первинного масштабного коефіцієнта метаданих для основного вхідного звукового сигналу плюс максимальний серед усіх канальних масштабних коефіцієнтів метаданих для всіх каналів основного вхідного звукового сигналу, за винятком каналу LFE, то зв'язаний вхідний звуковий сигнал визначають як той, що є переважним сигналом; інакше - основний вхідний звуковий сигнал визначають як той, що є переважним сигналом. 25. Спосіб за п. 12, який відрізняється тим, що основний вхідний звуковий сигнал включає канал низькочастотних ефектів, названий "LFE", і причому канал LFE виключають із максимального серед усіх масштабних коефіцієнтів метаданих для всіх каналів основного вхідного звукового сигналу так, що основний вхідний звуковий сигнал ідентифікують як той, що є переважним сигналом шляхом: визначення масштабного коефіцієнта для зв'язаного вхідного звукового сигналу, що обчислюється як значення вхідного сигналу балансу мікшування мінус сума первинного масштабного коефіцієнта метаданих для основного вхідного звукового сигналу й максимального серед усіх канальних масштабних коефіцієнтів метаданих для всіх каналів основного вхідного звукового сигналу за винятком каналу LFE; і визначення масштабного коефіцієнта для кожного каналу основного вхідного звукового сигналу, що обчислюється як первинний масштабний коефіцієнт для основного вхідного звукового сигналу плюс масштабний коефіцієнт для відповідного каналу основного вхідного звукового сигналу мінус сума первинного масштабного коефіцієнта метаданих і максимального серед усіх канальних масштабних коефіцієнтів для каналів основного вхідного звукового сигналу за винятком каналу низькочастотних LFE. 26. Спосіб за пп. 8-25, який відрізняється тим, що метадані мікшування для зв'язаного вхідного звукового сигналу додатково включають інформацію метаданих панорамування, зв'язаний вхідний звуковий сигнал включає монофонічний сигнал і основний вхідний звуковий сигнал включає стереофонічний або багатоканальний сигнал, де зв'язаний вхідний звуковий сигнал мікшують з каналами основного вхідного звукового сигналу відповідно до інформації метаданих панорамування. 27. Спосіб за будь-яким з пп. 1-26, який відрізняється тим, що вхідний сигнал балансу мікшування включає зовнішній вхідний сигнал від користувача, що забезпечує значення в інтервалі від негативних значень до позитивних значень. 28. Спосіб за п. 7, який відрізняється тим, що ряд каналів основного вхідного звукового сигналу й ряд каналів зв'язаного вхідного звукового сигналу включають навколишні сигнали з лівим, правим, центральним, лівим навколишнім, правим навколишнім каналами й каналом низькочастотних ефектів, названим "LFE". 29. Спосіб за п. 28, який відрізняється тим, що ряд каналів основного вхідного звукового сигналу й зв'язаного вхідного звукового сигналу включає багатоканальні сигнали 5.1, 3.1 або 13.1. 30. Спосіб за будь-яким з пп. 21-29, який відрізняється тим, що зв'язаний вхідний звуковий сигнал включає монофонічний канал і канал LFE, де канал LFE зв'язаного вхідного звукового сигналу мікшують з каналом LFE основного вхідного звукового сигналу, і монофонічний канал зв'язаного вхідного звукового сигналу панорамують на канали основного вхідного звукового сигналу відповідно до інформації метаданих панорамування. 31. Пристрій, призначений для мікшування сигналів, який застосовує кожний зі способів мікшування сигналів за пп. 1-30. 32. Декодер, який застосовує кожний зі способів мікшування сигналів за пп. 1-30 для декодування двох вхідних звукових сигналів у єдиний, зведений звуковий сигнал з підтримкою погодженого сприйманого рівня звуку. 33. Носій даних, що читається процесором, у пам'яті якого зберігаються машинозчитувані команди, призначені для виконання способу за одним із пп. 1-30. 34. Пристрій для мікшування вхідних звукових сигналів у єдиний, зведений звуковий сигнал з підтримкою сприйманого рівня звуку зведеного звукового сигналу, при цьому пристрій містить: приймач для приймання основного вхідного звукового сигналу, зв'язаного вхідного звукового сигналу й метаданих мікшування; причому зв'язаний вхідний звуковий сигнал пов'язаний з основним вхідним звуковим сигналом, причому метадані мікшування містять інформацію масштабування для масштабування основного вхідного звукового сигналу; причому інформація масштабування визначає, яким чином повинні бути мікшовані основний вхідний звуковий сигнал і зв'язаний вхідний звуковий сигнал, для генерації зведеного звукового сигналу на сприйманому 22 UA 105590 C2 5 10 15 20 25 30 рівні звуку; причому інформація масштабування з метаданих мікшування включає масштабний коефіцієнт метаданих для основного вхідного звукового сигналу, для масштабування основного вхідного звукового сигналу щодо зв'язаного вхідного звукового сигналу; вхідний сигнал балансу мікшування, який указує регульований баланс між основним і зв'язаним вхідними звуковими сигналами; причому вхідний сигнал балансу мікшування включає інформацію масштабування, яка дозволяє відхилення від зважування основного вхідного звукового сигналу й зв'язаного вхідного звукового сигналу у зведеному звуковому сигналі, як визначено в метаданих мікшування; і модуль мікшування, сконфігурований для ідентифікації переважного сигналу або як основного вхідного звукового сигналу, або як зв'язаного вхідного звукового сигналу з інформації масштабування, забезпеченої метаданими мікшування, й із вхідного сигналу балансу мікшування, причому тоді відповідний другий вхідний звуковий сигнал ідентифікований як непереважний сигнал; і причому переважний сигнал ідентифікований за допомогою порівняння вхідного сигналу балансу мікшування з масштабним коефіцієнтом метаданих для основного вхідного звукового сигналу; який відрізняється тим, що модуль мікшування додатково сконфігурований для масштабування непереважного сигналу щодо переважного сигналу і для об'єднання масштабованого непереважного сигналу з переважним сигналом для вироблення зведеного звукового сигналу. 35. Пристрій за п. 34, який відрізняється тим, що масштабний коефіцієнт для непереважного сигналу визначається, виходячи безпосередньо з інформації масштабування з метаданих мікшування й із вхідного сигналу балансу мікшування; непереважний сигнал зазнає масштабування з використанням обумовленого масштабного коефіцієнта; і масштабований непереважний сигнал поєднується з переважним сигналом у зведений сигнал. 36. Пристрій за п. 34 або п. 35, який відрізняється тим, що метадані мікшування інтегровані у зв'язаний вхідний звуковий сигнал. 37. Пристрій за будь-яким з пп. 34-36, який відрізняється тим, що вхідний сигнал балансу мікшування додатково включає зовнішній вхідний сигнал від користувача, що забезпечує значення в інтервалі від негативних значень до позитивних значень. 38. Пристрій за будь-яким з пп. 34-37, який відрізняється тим, що приймач додатково сконфігурований для приймання багатоканальних основних вхідних звукових сигналів і зв'язаних вхідних звукових сигналів, і модуль мікшування сконфігурований для мікшування багатоканальних основних вхідних звукових сигналів і зв'язаних вхідних звукових сигналів. 23 UA 105590 C2 24 UA 105590 C2 25 UA 105590 C2 26 UA 105590 C2 27 UA 105590 C2 28
ДивитисяДодаткова інформація
Назва патенту англійськоюAudio stream mixing with dialog level normalization
Автори англійськоюGroeschel, Alexander, Williams, PhillipA., Cooper, Jarret A., Schildbach, Wolfgang A.
Автори російськоюГрёшель Александер, Уильямс Филип А., Купер Джарет А., Шильдбах Вольфганг А.
МПК / Мітки
МПК: H03G 3/00
Мітки: діалогового, мікшування, рівня, аудіопотоку, нормалізацією
Код посилання
<a href="https://ua.patents.su/32-105590-mikshuvannya-audiopotoku-z-normalizaciehyu-dialogovogo-rivnya.html" target="_blank" rel="follow" title="База патентів України">Мікшування аудіопотоку з нормалізацією діалогового рівня</a>
Попередній патент: Автоматизована система керування вогнем бойової машини
Наступний патент: Спосіб виробництва пасти сиркової для дитячого харчування
Випадковий патент: Сполука 2,3-дігідро-6-нітроімідазо[2,1-b]оксазолу