Системи та способи виконання регулювання посилення

Номер патенту: 114027

Опубліковано: 10.04.2017

Автори: Атті Венкатраман Срініваса, Крішнан Венкатеш

Є ще 14 сторінок.

Дивитися все сторінки або завантажити PDF файл.

Формула / Реферат

1.     Спосіб регулювання параметрів підсилення, який містить етапи, на яких:

-         визначають (304), на основі рознесення між парами спектральних ліній (LSP), асоційованого з кадром аудіосигналу, те, що аудіосигнал включає в себе компонент, який відповідає умові формування артефактів; і

-         у відповідь на визначення того, що аудіосигнал включає в себе згаданий компонент, регулюють параметр посилення, що відповідає аудіосигналу, при цьому рознесення між LSP є найменшим з множини рознесень між LSP, що відповідають множині LSP частини смуги високих частот згаданого кадру аудіосигналу.

2.     Спосіб за п. 1, в якому аудіосигнал визначається як такий, що включає в себе згаданий компонент у відповідь на рознесення між LSP, менше першого порогового значення, або аудіосигнал визначається як такий, що включає в себе згаданий компонент у відповідь на рознесення між LSP, менше другого порогового значення, і середнє рознесення між LSP, менше третього порогового значення, при цьому середнє рознесення між LSP основане на рознесенні між LSP, асоційованому з кадром, і щонайменше одному іншому рознесенні між LSP, асоційованому щонайменше з одним іншим кадром аудіосигналу, або аудіосигнал визначається як такий, що включає в себе згаданий компонент у відповідь на:

1)    рознесення між LSP, менше другого порогового значення; і

2)    щонайменше одне з:

-         середнього рознесення між LSP, меншого третього порогового значення; або

-         активування ослаблення посилення, яке відповідає іншому кадру аудіосигналу, причому інший кадр передує кадру аудіосигналу, або умова формування артефактів відповідає шуму смуги високих частот.

3.     Спосіб за п. 1, в якому регулювання параметра посилення включає в себе етап, на якому активують згладжування посилення, щоб зменшувати більш швидкі зміни значення посилення, яке відповідає кадру аудіосигналу.

4.     Спосіб за п. 3, в якому згладжування посилення включає в себе етап, на якому визначають зважене середнє із значень посилення, що включають в себе значення посилення, асоційоване з кадром, і інше значення посилення, яке відповідає іншому кадру аудіосигналу, або згладжування посилення активується у відповідь на першу швидкість варіації пари спектральних ліній (LSP), асоційовану з кадром, меншу четвертого порогового значення, і другу швидкість LSP-варіації, асоційовану з кадром, меншу п'ятого порогового значення.

5.     Спосіб за п. 4, в якому перша швидкість LSP-варіації відповідає меншій швидкості адаптації, ніж друга швидкість LSP-варіації.

6.     Спосіб за п. 1, в якому регулювання параметра посилення включає в себе етап, на якому активують ослаблення посилення, щоб зменшувати значення посилення, яке відповідає кадру аудіосигналу.

7.     Спосіб за п. 6, в якому ослаблення посилення включає в себе етап, на якому застосовують експонентну операцію до значення посилення, або ослаблення посилення включає в себе етап, на якому застосовують лінійну операцію до значення посилення.

8.     Спосіб за п. 6, в якому ослаблення посилення включає в себе етапи, на яких:

-         у відповідь на задоволення першої умови посилення, застосовують експонентну операцію до значення посилення; і

-         у відповідь на задоволення другої умови посилення, застосовують лінійну операцію до значення посилення.

9.     Спосіб за п. 8, в якому перша умова посилення включає в себе середнє рознесення між LSP, менше шостого порогового значення, при цьому середнє рознесення між LSP основане на рознесенні між LSP, асоційованому з кадром, і щонайменше одному іншому рознесенні між LSP, асоційованому щонайменше з одним іншим кадром аудіосигналу, або друга умова посилення включає в себе активування ослаблення посилення, яке відповідає іншому кадру аудіосигналу, причому інший кадр передує кадру аудіосигналу.

10. Спосіб регулювання параметрів підсилення при кодуванні аудіо, який містить етапи, на яких:

-         порівнюють (402) рознесення між парами спектральних ліній (LSP), асоційоване з кадром аудіосигналу, зі щонайменше одним пороговим значенням; і

-         регулюють (404) параметр посилення при кодуванні аудіо, що відповідає аудіосигналу, щонайменше частково, на основі результату порівняння, при цьому рознесення між LSP є найменшим з множини рознесень між LSP, що відповідають множині LSP частини смуги високих частот кадру аудіосигналу.

11. Спосіб за п. 10, в якому регулювання параметра посилення включає в себе етап, на якому активують ослаблення посилення у відповідь на рознесення між LSP, менше першого порогового значення, або регулювання параметра посилення включає в себе етап, на якому активують ослаблення посилення у відповідь на рознесення між LSP, менше другого порогового значення, і середнє рознесення між LSP, менше третього порогового значення, при цьому середнє рознесення між LSP основане на рознесенні між LSP, асоційованому з кадром, і щонайменше одному іншому рознесенні між LSP, асоційованому щонайменше з одним іншим кадром аудіосигналу, або регулювання параметра посилення включає в себе, коли ослаблення посилення активується, етапи, на яких:

-         у відповідь на задоволення першої умови посилення, застосовують експонентну операцію до значення параметра посилення; і

-         у відповідь на задоволення другої умови посилення, застосовують лінійну операцію до значення параметра посилення, або регулювання параметра посилення включає в себе етап, на якому активують згладжування посилення, щоб зменшувати більш швидкі зміни значення посилення, яке відповідає кадру аудіосигналу.

12. Спосіб за п. 11, в якому згладжування посилення включає в себе етап, на якому визначають зважене середнє із значень посилення, що включають в себе значення посилення, асоційоване з кадром, і інше значення посилення, яке відповідає іншому кадру аудіосигналу.

13. Спосіб за п. 12, в якому згладжування посилення активується у відповідь на першу швидкість варіації пари спектральних ліній (LSP), асоційовану з кадром, меншу четвертого порогового значення, і другу швидкість LSP-варіації, асоційовану з кадром, меншу п'ятого порогового значення, при цьому перша швидкість LSP-варіації відповідає меншій швидкості адаптації, ніж друга швидкість LSP-варіації.

14. Пристрій, який містить:

засіб, виконаний з можливістю виконувати етапи способу за будь-яким з пп. 1-13.

15. Постійний машиночитаний носій, що містить інструкції, які, при виконанні за допомогою комп'ютера, спонукають комп’ютер виконувати етапи способу за будь-яким з пп. 1-13.

Текст

Реферат: Даний спосіб включає в себе визначення, на основі рознесення між парами спектральних ліній (LSP), яке відповідає аудіосигналу, того, що аудіосигнал включає в себе компонент, який відповідає умові формування артефактів. Спосіб також включає в себе, у відповідь на визначення того, що аудіосигнал включає в себе згаданий компонент, регулювання параметра посилення, що відповідає аудіосигналу. Наприклад, параметр посилення може регулюватися через ослаблення посилення і/або згладжування посилення. UA 114027 C2 (12) UA 114027 C2 UA 114027 C2 5 10 15 20 25 30 35 40 45 50 55 Перехресні посилання на споріднені заявки [0001] Дана заявка заявляє пріоритет за попередньою заявкою на патент США № 61/762,803, що знаходиться у спільній власності, поданою 8 лютого 2013 року, і непопередньою заявкою на патент США № 13/959,090, поданою 5 серпня 2013 року, зміст яких повністю міститься в даному документі за посиланням в явному вигляді. Галузь техніки, до якої належить винахід [0002] Дане розкриття суті, загалом, стосується обробки сигналів. Опис попереднього рівня техніки [0003] Технологічні удосконалення призвели до більш компактних і таких, що мають велику обчислювальну потужність обчислювальних пристроїв. Наприклад, сьогодні існує множина портативних персональних обчислювальних пристроїв, в тому числі бездротові обчислювальні пристрої, такі як портативні бездротові телефони, персональні цифрові пристрої (PDA) і пристрої для пошукових викликів, які є невеликими, легкими і зручно носяться користувачами. Більш конкретно, портативні бездротові телефони, такі як стільникові телефони і телефони за Інтернет-протоколом (IP), можуть передавати мовні пакети і пакети даних по бездротових мережах. Додатково, багато таких бездротових телефонів включають в себе інші типи пристроїв, які містяться в них. Наприклад, бездротовий телефон також може включати в себе цифровий фотоапарат, цифрову відеокамеру, цифровий записуючий пристрій і програвач аудіофайлів. [0004] У традиційних телефонних системах (наприклад, в комутованих телефонних мережах загального користування (PSTN)), смуга пропускання сигналу обмежена частотним діапазоном від 300 герц (Гц) до 3,4 кілогерц (кГц). У широкосмугових (WB) варіантах застосування, таких як стільникова телефонія і протокол "мова-за-IP" (VoIP), смуга пропускання сигналу може охоплювати частотний діапазон від 50 Гц до 7 кГц. Технології надширокосмугового (SWB) кодування підтримують смугу пропускання, яка розширяється приблизно до 16 кГц. Розширення смуги пропускання сигналу від вузькосмугової телефонії в 3,4 кГц до SWB-телефонії в 16 кГц дозволяє підвищувати якість відновлення сигналів, розбірливість і природність. [0005] Технології SWB-кодування типово містять в собі кодування і передачу частини нижніх частот сигналу (наприклад, від 50 Гц до 7 кГц, яка також називається "смугою низьких частот"). Наприклад, смуга низьких частот може бути представлена з використанням параметрів фільтрації і/або сигналу збудження в смузі низьких частот. Проте, для того щоб підвищувати ефективність кодування, частина верхніх частот сигналу (наприклад, від 7 кГц до 16 кГц, яка також називається "смугою високих частот") може не повністю кодуватися і передаватися. Замість цього, приймальний пристрій може використовувати моделювання проходження сигналів для того, щоб прогнозувати смугу високих частот. У деяких реалізаціях, дані, асоційовані зі смугою високих частот, можуть надаватися в приймальний пристрій для того, щоб допомагати в прогнозуванні. Такі дані можуть згадуватися як "допоміжна інформація" і можуть включати в себе інформацію посилення, частоти спектральних ліній (LSF, які також називаються "парами спектральних ліній (LSP)") тощо. Прогнозування в смузі високих частот з використанням моделі проходження сигналів може бути прийнятно точним, коли сигнал смуги низьких частот достатньо корельований із сигналом смуги високих частот. Проте, за наявності шуму, кореляція між смугою низьких частот і смугою високих частот може бути слабкою, і модель проходження сигналів більше не може мати можливості точно представляти смугу високих частот. Це може призводити до артефактів (наприклад, спотвореної мови) в приймальному пристрої. Суть винаходу [0006] Розкриті системи та способи виконання регулювання посилення. Описані технології включають в себе визначення того, включає чи ні аудіосигнал, який повинен кодуватися для передачі, в себе компонент (наприклад, шум), який може призводити до чутних артефактів після відновлення аудіосигналу. Наприклад, модель проходження сигналів може інтерпретувати шум як мовні дані, що може призводити до використання помилкової інформації посилення для того, щоб представляти аудіосигнал. Відповідно до описаних технологій, за наявності зашумлених умов, ослаблення посилення і/або згладжування посилення можуть виконуватися для того, щоб регулювати параметри посилення, що використовуються для того, щоб представляти сигнал, який повинен передаватися. Такі регулювання можуть призводити до більш точного відновлення сигналу в приймальному пристрої, за рахунок цього зменшуючи чутні артефакти. [0007] У конкретному варіанті здійснення, спосіб включає в себе визначення, на основі рознесення між парами спектральних ліній (LSP), що відповідає аудіосигналу, того, що аудіосигнал включає в себе компонент, який відповідає умові формування артефактів. Спосіб 1 UA 114027 C2 5 10 15 20 25 30 35 40 45 50 55 60 також включає в себе, у відповідь на визначення того, що аудіосигнал включає в себе згаданий компонент, регулювання параметра посилення, що відповідає аудіосигналу. [0008] В іншому конкретному варіанті здійснення, спосіб включає в себе порівняння рознесення між парами спектральних ліній (LSP), асоційованого з кадром аудіосигналу щонайменше з одним пороговим значенням. Спосіб також включає в себе регулювання параметра посилення при кодуванні мови, що відповідає аудіосигналу (наприклад, параметра посилення кодека для цифрового посилення, що використовується в системі кодування мови) щонайменше, частково, на основі результату порівняння. [0009] В іншому конкретному варіанті здійснення, пристрій включає в себе схему виявлення шуму, виконану з можливістю визначати, на основі рознесення між парами спектральних ліній (LSP), що відповідає аудіосигналу, те, що аудіосигнал включає в себе компонент, який відповідає умові формування артефактів. Пристрій також включає в себе схему ослаблення і згладжування посилення, чутливу до схеми виявлення шуму і виконану з можливістю, у відповідь на визначення того, що аудіосигнал включає в себе згаданий компонент, регулювати параметр посилення, що відповідає аудіосигналу. [0010] В іншому конкретному варіанті здійснення, пристрій включає в себе засіб для визначення, на основі рознесення між парами спектральних ліній (LSP), що відповідає аудіосигналу, того, що аудіосигнал включає в себе компонент, який відповідає умові формування артефактів. Пристрій також включає в себе засіб для регулювання параметра посилення, що відповідає аудіосигналу, у відповідь на визначення того, що аудіосигнал включає в себе згаданий компонент. [0011] В іншому конкретному варіанті здійснення, некороткочасний машиночитаний носій включає в себе інструкції, які, при виконанні за допомогою комп'ютера, інструктують комп'ютеру визначати, на основі рознесення між парами спектральних ліній (LSP), що відповідає аудіосигналу, те, що аудіосигнал включає в себе компонент, який відповідає умові формування артефактів. Інструкції також виконуються для того, щоб інструктувати комп'ютеру регулювати параметр посилення, що відповідає аудіосигналу, у відповідь на визначення того, що аудіосигнал включає в себе згаданий компонент. [0012] Конкретні переваги, надані за допомогою щонайменше одного з розкритих варіантів здійснення, включають в себе здатність виявляти викликаючі артефакти компоненти (наприклад, шум) і вибірково виконувати регулювання посилення (наприклад, ослаблення посилення і/або згладжування посилення) у відповідь на виявлення таких викликаючих артефакти компонентів, що може призводити до більш точного відновлення сигналів у приймальному пристрої і менших чутних артефактів. Інші аспекти, переваги та ознаки даного винаходу повинні ставати зрозумілими з прочитання всієї заявки, яка включає в себе наступні розділи: "Короткий опис креслень", "Докладний опис винаходу" і "Формула винаходу". Короткий опис креслень [0013] Фіг. 1 є схемою, яка ілюструє конкретний варіант здійснення системи, яка виконана з можливістю здійснювати регулювання посилення; [0014] Фіг. 2 є схемою, яка ілюструє приклади викликаючого артефакти компонента, відповідного відновленого сигналу, який включає в себе артефакти, і відповідного відновленого сигналу, який не включає в себе артефакти; [0015] Фіг. 3 є блок-схемою послідовності операцій способу, яка ілюструє конкретний варіант здійснення способу виконання регулювання посилення; [0016] Фіг. 4 є блок-схемою послідовності операцій способу, яка ілюструє інший конкретний варіант здійснення способу виконання регулювання посилення; [0017] Фіг. 5 є блок-схемою послідовності операцій способу, яка ілюструє інший конкретний варіант здійснення способу виконання регулювання посилення; і [0018] Фіг. 6 є блок-схемою бездротового пристрою, виконаного з можливістю здійснювати операції обробки сигналів відповідно до систем та способів фіг. 1-5. Докладний опис винаходу [0019] Посилаючись на фіг. 1, показаний конкретний варіант здійснення системи, яка виконана з можливістю здійснювати регулювання посилення і, загалом, позначається 100. У конкретному варіанті здійснення, система 100 може бути інтегрована в систему або пристрій кодування (наприклад, в бездротовому телефоні або в кодері/декодері (кодеку)). [0020] Потрібно зазначити, що в нижченаведеному описі, різні функції, які виконуються за допомогою системи 100 за фіг. 1, описуються як такі, що виконуються за допомогою визначених компонентів або модулів. Проте, це розділення компонентів і модулів служить тільки для ілюстрації. В альтернативному варіанті здійснення, функція, що виконується за допомогою конкретного компонента або модуля, замість цього може бути розділена між декількома 2 UA 114027 C2 5 10 15 20 25 30 35 40 45 50 55 60 компонентами або модулями. Крім того, в альтернативному варіанті здійснення, два або більше компонентів або модулів за фіг. 1 можуть бути інтегровані в один компонент або модуль. Кожний компонент або модуль, проілюстрований на фіг. 1, може реалізовуватися з використанням апаратних засобів (наприклад, пристрої на основі програмованої користувачем вентильної матриці (FPGA), спеціалізованої інтегральної схеми (ASIC), процесора цифрових сигналів (DSP), контролера тощо), програмного забезпечення (наприклад, інструкцій, що виконуються за допомогою процесора) або будь-якої комбінації вищезазначеного. [0021] Система 100 включає в себе гребінку 110 аналітичних фільтрів, яка виконана з можливістю приймати вхідний аудіосигнал 102. Наприклад, вхідний аудіосигнал 102 може надаватися за допомогою мікрофона або іншого пристрою введення. У конкретному варіанті здійснення, вхідний аудіосигнал 102 може включати в себе мову. Вхідний аудіосигнал може являти собою надширокосмуговий (SWB) сигнал, який включає в себе дані в частотному діапазоні приблизно від 50 герц (Гц) до 16 кілогерц (кГц). Гребінка 110 аналітичних фільтрів може фільтрувати вхідний аудіосигнал 102 в декількох частинах на основі частоти. Наприклад, гребінка 110 аналітичних фільтрів може формувати сигнал 122 смуги низьких частот і сигнал 124 смуги високих частот. Сигнал 122 смуги низьких частот і сигнал 124 смуги високих частот можуть мати рівні або нерівні смуги пропускання і можуть бути перекривними або неперекривними. В альтернативному варіанті здійснення, гребінка 110 аналітичних фільтрів може формувати більше двох виведень. [0022] У прикладі за фіг. 1, сигнал 122 смуги низьких частот і сигнал 124 смуги високих частот займають неперекривні смуги частот. Наприклад, сигнал 122 смуги низьких частот і сигнал 124 смуги високих частот можуть займати неперекривні смуги частот в 50 Гц - 7 кГц та 7 кГц - 16 кГц. В альтернативному варіанті здійснення, сигнал 122 смуги низьких частот і сигнал 124 смуги високих частот можуть займати неперекривні смуги частот в 50 Гц - 8 кГц та 8 кГц - 16 кГц. У ще одному іншому альтернативному варіанті здійснення, сигнал 122 смуги низьких частот і сигнал 124 смуги високих частот можуть перекриватися (наприклад, 50 Гц - 8 кГц та 7 кГц - 16 кГц), що може забезпечувати можливість фільтру нижніх частот і фільтру верхніх частот гребінки 110 аналітичних фільтрів мати плавний спад, що дозволяє спрощувати проектне рішення і скорочувати витрати фільтра нижніх частот і фільтра верхніх частот. Перекриття сигналу 122 смуги низьких частот і сигналу 124 смуги високих частот також дозволяє забезпечувати плавне змішування сигналів смуги низьких частот і смуги високих частот в приймальному пристрої, що може призводити до менших чутних артефактів. [0023] Потрібно зазначити, що хоча приклад за фіг. 1 ілюструє обробку SWB-сигналу, це служить тільки для ілюстрації. В альтернативному варіанті здійснення, вхідний аудіосигнал 102 може являти собою широкосмуговий (WB) сигнал, що має частотний діапазон приблизно від 50 Гц до 8 кГц. У такому варіанті здійснення, сигнал 122 смуги низьких частот може відповідати частотному діапазону приблизно від 50 Гц до 6,4 кГц, і сигнал 124 смуги високих частот може відповідати частотному діапазону приблизно від 6,4 кГц до 8 кГц. Також потрібно зазначити, що різні системи та способи в даному документі описуються як такі, що виявляють шум смуги високих частот і виконують різні операції у відповідь на шум смуги високих частот. Проте, це служить тільки для прикладу. Технології, проілюстровані з посиланням на фіг. 1-6, також можуть виконуватися в контексті шуму смуги низьких частот. [0024] Система 100 може включати в себе модуль 130 аналізу смуги низьких частот, виконаний з можливістю приймати сигнал 122 смуги низьких частот. У конкретному варіанті здійснення, модуль 130 аналізу смуги низьких частот може представляти варіант здійснення кодера на основі лінійного прогнозування із збудженням за кодом (CELP). Модуль 130 аналізу смуги низьких частот може включати в себе модуль 132 аналізу і кодування на основі лінійного прогнозування (LP), модуль 134 перетворення коефіцієнтів лінійного прогнозування (LPC) в пари спектральних ліній (LSP) і квантувач 136. LSP також можуть згадуватися як частоти спектральних ліній (LSF), і ці два терміни можуть використовуватися взаємозамінно в даному документі. Модуль 132 LP-аналізу і кодування може кодувати спектральну обвідну сигналу 122 смуги низьких частот як набір LPC. LPC можуть формуватися для кожного кадру аудіо (наприклад, 20 мілісекунд (мс) аудіо, що відповідає 320 вибіркам на частоті дискретизації 16 кГц), кожного субкадру аудіо (наприклад, 5 мс аудіо) або будь-якої комбінації вищезазначеного. Число LPC, сформованих для кожного кадру або субкадру, може визначатися за допомогою "порядку" виконуваного LP-аналізу. У конкретному варіанті здійснення, модуль 132 LP-аналізу і кодування може формувати набір з одинадцяти LPC, що відповідають LP-аналізу десятого порядку. [0025] Модуль 134 перетворення LPC в LSP може перетворювати набір LPC, сформованих за допомогою модуля 132 LP-аналізу і кодування, у відповідний набір LSP (наприклад, з 3 UA 114027 C2 5 10 15 20 25 30 35 40 45 50 55 використанням перетворення "один-до-одного"). Альтернативно, набір LPC може перетворюватися "один-до-одного" у відповідний набір ParCor-коефіцієнтів, значень логарифмічного відношення площ, пар спектральних імітансів (ISP) або частот спектральних імітансів (ISF). Перетворення між набором LPC і набором LSP може бути оборотним без помилки. [0026] Квантувач 136 може квантувати набір LSP, сформованих за допомогою модуля 134 перетворення. Наприклад, квантувач 136 може включати в себе або з'єднуватися з декількома таблицями кодування, які включають в себе декілька записів (наприклад, векторів). Щоб квантувати набір LSP, квантувач 136 може ідентифікувати записи таблиць кодування, які є "найближчими" (наприклад, на основі показника спотворення, такого як найменші квадрати або середньоквадратична помилка) до набору LSP. Квантувач 136 може виводити значення індексу або послідовність значень індексу, що відповідають місцеположенню ідентифікованих записів у таблицях кодування. Виведення квантувача 136 внаслідок цього може представляти параметри фільтрації смуги низьких частот, які включені в потік 142 бітів смуги низьких частот. [0027] Модуль 130 аналізу смуги низьких частот також може формувати сигнал 144 збудження в смузі низьких частот. Наприклад, сигнал 144 збудження в смузі низьких частот може являти собою кодований сигнал, який формується за допомогою квантування залишкового LP-сигналу, який формується під час LP-процесу, що виконується за допомогою модуля 130 аналізу смуги низьких частот. Залишковий LP-сигнал може представляти помилку прогнозування. [0028] Система 100 додатково може включати в себе модуль 150 аналізу смуги високих частот, виконаний з можливістю приймати сигнал 124 смуги високих частот з гребінки 110 аналітичних фільтрів і сигнал 144 збудження в смузі низьких частот з модуля 130 аналізу смуги низьких частот. Модуль 150 аналізу смуги високих частот може формувати допоміжну інформацію 172 смуги високих частот на основі сигналу 124 смуги високих частот і сигналу 144 збудження в смузі низьких частот. Наприклад, допоміжна інформація 172 смуги високих частот може включати в себе LSP смуги високих частот і/або інформацію посилення (наприклад, на основі щонайменше відношення енергії смуги високих частот до енергії смуги низьких частот), як детальніше описано в даному документі. [0029] Модуль 150 аналізу смуги високих частот може включати в себе формувач 160 збудження в смузі високих частот. Формувач 160 збудження в смузі високих частот може формувати сигнал збудження в смузі високих частот за допомогою розширення спектра сигналу 144 збудження в смузі низьких частот до частотного діапазону смуги високих частот (наприклад, 7 кГц - 16 кГц). Як ілюстрація, формувач 160 збудження в смузі високих частот може застосовувати перетворення до сигналу збудження в смузі низьких частот (наприклад, нелінійне перетворення, таке як операція в абсолютних значеннях або в квадраті) і може змішувати перетворений сигнал збудження в смузі низьких частот із шумовим сигналом (наприклад, білим шумом, модульованим згідно з обвідною, яка відповідає сигналу 144 збудження в смузі низьких частот) для того, щоб формувати сигнал збудження в смузі високих частот. Сигнал збудження в смузі високих частот може використовуватися для того, щоб визначати один або більше параметрів посилення смуги високих частот, які включені у допоміжну інформацію 172 смуги високих частот. [0030] Модуль 150 аналізу смуги високих частот також може включати в себе модуль 152 LP-аналізу і кодування, модуль 154 перетворення LPC в LSP і квантувач 156. Кожний з модуля 152 LP-аналізу і кодування, модуля 154 перетворення і квантувача 156 може функціонувати так, як описано вище відносно відповідних компонентів модуля 130 аналізу смуги низьких частот, але при порівняно зменшеному розрізненні (наприклад, з використанням меншого числа бітів для кожного коефіцієнта, LSP тощо). В іншому зразковому варіанті здійснення, LSP-квантувач 156 смуги високих частот може використовувати скалярне квантування, при якому піднабір LSPкоефіцієнтів квантується окремо з використанням заздалегідь заданого числа бітів. Наприклад, модуль 152 LP-аналізу і кодування, модуль 154 перетворення і квантувач 156 можуть використовувати сигнал 124 смуги високих частот для того, щоб визначати інформацію фільтрації смуги високих частот (наприклад, LSP смуги високих частот), яка включена у допоміжну інформацію 172 смуги високих частот. У конкретному варіанті здійснення, допоміжна інформація 172 смуги високих частот може включати в себе LSP смуги високих частот, а також параметри посилення смуги високих частот. За наявності визначених типів шуму параметри посилення смуги високих частот можуть формуватися як результат ослаблення посилення і/або згладжування посилення, що виконується за допомогою модуля 162 ослаблення і згладжування посилення, як детальніше описано в даному документі. 4 UA 114027 C2 5 10 15 20 25 30 35 40 45 50 55 [0031] Потік 142 бітів смуги низьких частот і допоміжна інформація 172 смуги високих частот можуть мультиплексуватися за допомогою мультиплексора (MUX) 180, щоб формувати вихідний потік 192 бітів. Вихідний потік 192 бітів може представляти кодований аудіосигнал, що відповідає вхідному аудіосигналу 102. Наприклад, вихідний потік 192 бітів може передаватися (наприклад, по дротовому, бездротовому або оптичному каналу) і/або зберігатися. У приймальному пристрої, зворотні операції можуть виконуватися за допомогою демультиплексора (DEMUX), декодера смуги низьких частот, декодера смуги високих частот і гребінки фільтрів, щоб формувати аудіосигнал (наприклад, відновлену версію вхідного аудіосигналу 102, який надається в динамік або інший пристрій виведення). Число бітів, що використовуються для того, щоб представляти потік 142 бітів смуги низьких частот, може бути більш істотно більшим за число бітів, що використовуються для того, щоб представляти допоміжну інформацію 172 смуги високих частот. Таким чином, більша частина бітів у вихідному потоку 192 бітів представляють дані смуги низьких частот. Допоміжна інформація 172 смуги високих частот може використовуватися в приймальному пристрої для того, щоб повторно формувати сигнал смуги високих частот з даних смуги низьких частот відповідно до моделі проходження сигналів. Наприклад, модель проходження сигналів може представляти очікуваний набір взаємозв'язків або кореляцій між даними смуги низьких частот (наприклад, сигналом 122 смуги низьких частот) і даними смуги високих частот (наприклад, сигналом 124 смуги високих частот). Таким чином, різні моделі проходження сигналів можуть використовуватися для різних видів аудіоданих (наприклад, мови, музики тощо), і конкретна модель проходження сигналів, яка використовується, може бути узгоджена за допомогою передавального пристрою і приймального пристрою (або задана за допомогою галузевого стандарту) до передачі кодованих аудіоданих. З використанням моделі проходження сигналів модуль 150 аналізу смуги високих частот в передавальному пристрої може мати можливість формувати допоміжну інформацію 172 смуги високих частот, так що відповідний модуль аналізу смуги високих частот в приймальному пристрої має можливість використовувати модель проходження сигналів для того, щоб відновлювати сигнал 124 смуги високих частот з вихідного потоку 192 бітів. [0032] Проте, за наявності фонового шуму синтез смуги високих частот в приймальному пристрої може призводити до помітних артефактів, оскільки недостатня кореляція між смугою низьких частот і смугою високих частот може змушувати базову модель проходження сигналів працювати субоптимально відносно надійного відновлення сигналів. Наприклад, модель проходження сигналів може некоректно інтерпретувати компоненти шуму в смузі високих частот як мову і внаслідок цього може спричиняти формування параметрів посилення, які намагаються реплікувати шум неточно в приймальному пристрої, призводячи до помітних артефактів. Приклади таких умов формування артефактів включають в себе, але не тільки, високочастотні шуми, такі як автомобільні гудки і скрипучі гальма. Як ілюстрація, перша спектрограма 210 на фіг. 2 ілюструє аудіосигнал, що має два компоненти, які відповідають умовам формування артефактів, проілюстрованим як шум смуги високих частот, що має відносно більшу енергію сигналів. Друга спектрограма 220 ілюструє результуючі артефакти у відновленому сигналі внаслідок переоцінки параметрів посилення смуги високих частот. [0033] Щоб зменшувати такі артефакти, модуль 150 аналізу смуги високих частот може виконувати керування посиленням смуги високих частот. Наприклад, модуль 150 аналізу смуги високих частот може включати в себе модуль 158 виявлення викликаючих артефакти компонентів, який виконаний з можливістю виявляти компоненти сигналу (наприклад, умови формування артефактів, показані на першій спектрограмі 210 за фіг. 2), які з великою імовірністю призводять до чутних артефактів при відтворенні. За наявності таких компонентів модуль 150 аналізу смуги високих частот може спричиняти формування кодованого сигналу, який щонайменше, частково, зменшує чутний ефект таких артефактів. Наприклад, модуль 162 ослаблення і згладжування посилення може виконувати ослаблення посилення і/або згладжування посилення, щоб модифікувати інформацію посилення або параметри, включені у допоміжну інформацію 172 смуги високих частот. [0034] Ослаблення посилення може включати в себе зменшення значення посилення через застосування експонентної або лінійної операції, що моделюється як ілюстративні приклади. Згладжування посилення може включати в себе обчислення зваженої суми модульованих посилень поточного кадру/субкадру і одного або більше попередніх кадрів/субкадрів. Модифікована інформація посилення може призводити до відновленого сигналу згідно з третьою спектрограмою 230 за фіг. 2, який є вільним (або має знижений рівень) від артефактів, показаних на другій спектрограмі 220 за фіг. 2. 5 UA 114027 C2 5 10 15 20 25 30 35 40 45 50 55 [0035] Один або більше тестів можуть виконуватися для того, щоб оцінювати те, включає чи ні аудіосигнал в себе умову формування артефактів. Наприклад, перший тест може включати в себе порівняння мінімального рознесення між LSP, яке виявляється в наборі LSP (наприклад, LSP для конкретного кадру аудіосигналу), з першим пороговим значенням. Невелике рознесення між LSP відповідає відносно сильному сигналу у відносно вузькому частотному діапазоні. У конкретному варіанті здійснення, коли визначається те, що сигнал 124 смуги високих частот призводить до кадру, що має мінімальне рознесення між LSP, яке менше першого порогового значення, визначається те, що умова формування артефактів присутня в аудіосигналі, і ослаблення посилення може активуватися для кадру. [0036] Як інший приклад, другий тест може включати в себе порівняння середнього мінімального рознесення між LSP для декількох послідовних кадрів з другим пороговим значенням. Наприклад, коли конкретний кадр аудіосигналу має мінімальне LSP-рознесення, яке перевищує перше порогове значення, але менше другого порогового значення, як і раніше може визначатися те, що умова формування артефактів присутня, якщо середнє мінімальне рознесення між LSP для декількох кадрів (наприклад, зважене середнє мінімального рознесення між LSP для чотирьох останніх кадрів, що включають в себе конкретний кадр) менше третього порогового значення. Як результат, ослаблення посилення може активуватися для конкретного кадру. [0037] Як інший приклад, третій тест може включати в себе визначення того, знаходиться чи ні конкретний кадр після кадру з ослабленим посиленням аудіосигналу. Якщо конкретний кадр знаходиться після кадру з ослабленим посиленням, ослаблення посилення може активуватися для конкретного кадру на основі мінімального рознесення між LSP конкретного кадру, меншого другого порогового значення. [0038] Три тести описуються як ілюстрація. Ослаблення посилення для кадру може активуватися у відповідь на задоволення будь-якого одного або більше тестів (або комбінацій тестів) або у відповідь на задоволення одного або більше інших тестів або умов. Наприклад, конкретний варіант здійснення може включати в себе визначення того, активувати чи ні ослаблення посилення на основі одного тесту, наприклад, першого тесту, описаного вище, без застосування другого тесту або третього тесту. Альтернативні варіанти здійснення можуть включати в себе визначення того, активувати чи ні ослаблення посилення на основі другого тесту без застосування першого тесту або третього тесту, або на основі третього тесту без застосування першого тесту або другого тесту. Як інший приклад, конкретний варіант здійснення може включати в себе визначення того, активувати чи ні ослаблення посилення на основі двох тестів, наприклад, першого тесту і другого тесту без застосування третього тесту. Альтернативні варіанти здійснення можуть включати в себе визначення того, активувати чи ні ослаблення посилення на основі першого тесту і третього тесту без застосування другого тесту, або на основі другого тесту і третього тесту без застосування першого тесту. [0039] Коли ослаблення посилення активоване для конкретного кадру, згладжування посилення також може активуватися для конкретного кадру. Наприклад, згладжування посилення може виконуватися за допомогою визначення середнього (наприклад, зваженого середнього) значення посилення для конкретного кадру і значення посилення для попереднього кадру аудіосигналу. Визначене середнє може використовуватися як значення посилення для конкретного кадру, зменшуючи величину зміни значень посилення між послідовними кадрами аудіосигналу. [0040] Згладжування посилення може активуватися для конкретного кадру у відповідь на визначення того, що LSP-значення для конкретного кадру відхиляються від оцінки "повільної" варіації LSP-значень менш ніж на четверте порогове значення і відхиляються від оцінки "швидкої" варіації LSP-значень менш ніж на п'яте порогове значення. Величина відхилення від оцінки повільної варіації може згадуватися як низька швидкість LSP-варіації. Величина відхилення від оцінки швидкої варіації може згадуватися як висока швидкість LSP-варіації і може відповідати більшій швидкості адаптації, ніж низька швидкість LSP-варіації. [0041] Низька швидкість LSP-варіації може бути основана на відхиленні від зваженого середнього LSP-значень для декількох послідовних кадрів, яке привласнює LSP-значенням одного або більше попередніх кадрів більші вагові коефіцієнти, ніж LSP-значенням поточного кадру. Низька швидкість LSP-варіації, що має відносно велике значення, вказує те, що LSPзначення змінюються на швидкості, яка не служить ознакою умови формування артефактів. Проте, низька швидкість LSP-варіації, що має відносно невелике значення (наприклад, менше четвертого порогового значення), відповідає повільному переміщенню LSP для декількох кадрів, яке може служити ознакою діючої умови формування артефактів. 6 UA 114027 C2 5 10 15 20 25 30 35 [0042] Висока швидкість LSP-варіації може бути основана на відхиленні від зваженого середнього LSP-значень для декількох послідовних кадрів, яке привласнює LSP-значенням для поточного кадру більші вагові коефіцієнти, ніж зваженому середньому для низької швидкості LSP-варіації. Висока швидкість LSP-варіації, що має відносно велике значення, може вказувати те, що LSP-значення змінюються на швидкості, яка не служить ознакою умови формування артефактів, і висока швидкість LSP-варіації, що має відносно невелике значення (наприклад, менше п'ятого порогового значення), може відповідати відносно невеликій зміні LSP для декількох кадрів, яка може служити ознакою умови формування артефактів. [0043] Хоча низька швидкість LSP-варіації може використовуватися для того, щоб вказувати, коли умова формування мультикадрових артефактів почата, низька швидкість LSP-варіації може викликати затримку у виявленні, коли умова формування мультикадрових артефактів завершена. Аналогічно, хоча висока швидкість LSP-варіації може бути менш надійною, ніж низька швидкість LSP-варіації, щоб виявляти те, коли умова формування мультикадрових артефактів почата, висока швидкість LSP-варіації може використовуватися для того, щоб більш точно виявляти те, коли умова формування мультикадрових артефактів завершена. Подія формування мультикадрових артефактів може визначатися як така, що виконується в той час, коли низька швидкість LSP-варіації менше четвертого порогового значення, і висока швидкість LSP-варіації менше п'ятого порогового значення. У результаті згладжування посилення може активуватися, щоб запобігати раптовим або помилковим збільшенням значень кадрового посилення, в той час як подія формування артефактів виконується. [0044] У конкретному варіанті здійснення, модуль 158 виявлення викликаючих артефакти компонентів може визначати чотири параметри з аудіосигналу для того, щоб визначати те, включає чи ні аудіосигнал в себе компонент, який повинен призводити до чутних артефактів: мінімальне рознесення між LSP, низька швидкість LSP-варіації, висока швидкість LSP-варіації і середнє мінімальне рознесення між LSP. Наприклад, LP-процес десятого порядку може формувати набір з одинадцяти LPC, які перетворені в десять LSP. Модуль 158 виявлення викликаючих артефакти компонентів може визначати, для конкретного кадру аудіо, мінімальне (наприклад, найменше) рознесення між будь-якими двома з десяти LSP. Типово, різкі і раптові шуми, такі як автомобільні гудки і скрипучі гальма, призводять до близькорозташованих LSP (наприклад, "сильний" компонент шуму в 13 кГц на першій спектрограмі 210 може бути близько оточений за допомогою LSP в 12,95 кГц та 13,05 кГц). Модуль 158 виявлення викликаючих артефакти компонентів також може визначати низьку швидкість LSP-варіації і високу швидкість варіації так, як показано в нижченаведеному псевдокоді в стилі С++, який може виконуватися або реалізовуватися за допомогою модуля 158 виявлення викликаючих артефакти компонентів. {/*Оцінка рознесення між LSP, тобто LSP-відстані між i-им коефіцієнтом і (i-1)-им LSPкоефіцієнтом, як зазначено нижче*/ /*Оцінка помилки в LSP від поточного кадру до попередніх кадрів*/ 40 /*Оновлення швидкостей LSP-варіації (низькі/високі інтерполяційні LSP для наступного кадру)*/ 7 UA 114027 C2 5 10 15 [0045] Модуль 158 виявлення викликаючих артефакти компонентів додатково може визначати середньозважене мінімальне рознесення між LSP відповідно до наступного псевдокоду. Наступний псевдокод також включає в себе скидання рознесення між LSP у відповідь на зміну режиму. Такі зміни режиму можуть виникати в пристроях, які підтримують декілька режимів кодування для музики і/або мови. Наприклад, пристрій може використовувати режим алгебраїчного CELP (ACELP) для мови і режим кодування аудіо, тобто загальне кодування сигналів (GSC) для сигналів музичного типу. Альтернативно, в визначених низькошвидкісних сценаріях, пристрій може визначати на основі параметрів ознак (наприклад, тональності, відходу основного тону, інтонування тощо) те, що може використовуватися режим ACELP/GSC/модифікуваного дискретного косинусного перетворення (MDCT). /*Скидання LSP-рознесення під час змін режиму, тобто коли режим кодування останнього кадру відрізняється від режиму кодування поточного кадру*/ /*Обчислення середньозваженого LSP-рознесення для поточного кадру і трьох попередніх кадрів*/ /*Оновлення буфера рознесення попередніх lsp*/ 20 25 30 35 [0046] Після визначення мінімального рознесення між LSP, швидкостей LSP-варіації і середнього мінімального рознесення між LSP, модуль 158 виявлення викликаючих артефакти компонентів може порівнювати визначені значення з одним або більше порогових значень відповідно до наступного псевдокоду, щоб визначати те, існує чи ні викликаючий артефакти шум в кадрі аудіо. Коли викликаючий артефакти шум існує, модуль 158 виявлення викликаючих артефакти компонентів може активувати виконання, модулем 162 ослаблення і згладжування посилення, ослаблення посилення і/або згладжування посилення за відповідних умов. THR1=0,008, THR2=0,0032, THR3=0,005, THR4=0,001, THR5=0,001, GainAttenuate=FALSE, GainSmooth=FALSE /*Перевірка нижченаведених умов та активування параметрів ослаблення/згладжування посилення. Якщо LSP-рознесення є дуже невеликим, то є висока достовірність того, що викликаючий артефакти шум існує.*/ /*Активування згладжування посилення залежно від швидкостей варіації*/ 8 UA 114027 C2 5 10 /*Оновлення прапора ослаблення посилення попереднього кадру, який повинен використовуватися в наступному кадрі*/ prevGainAttenuate=GainAttenuate; [0047] У конкретному варіанті здійснення, модуль 162 ослаблення і згладжування посилення може вибірково виконувати ослаблення і/або згладжування посилення відповідно до наступного псевдокоду. /*Виконання згладжування посилення, якщо задовольняються наступні умови*/ /*Виконання ослаблення посилення, якщо задовольняються наступні умови*/ /*якщо середнє LSP-рознесення менше THR6, який є дуже невеликим, кадр містить дуже значний компонент шуму, так що використання експонентного зважування*/ 15 20 25 30 35 /*Оновлення попереднього кадру посилення, який повинен використовуватися в наступному кадрі*/ [0048] Система 100 за фіг. 1 внаслідок цього може виконувати регулювання посилення (наприклад, ослаблення посилення і/або згладжування посилення) для того, щоб зменшувати або запобігати чутним артефактам внаслідок шуму у вхідному сигналі. Система 100 за фіг. 1 внаслідок цього дозволяє забезпечувати більш точне відтворення аудіосигналу (наприклад, мовного сигналу) за наявності шуму, який є неврахованим за допомогою моделей проходження сигналів кодування мови. [0049] Посилаючись на фіг. 3, показана блок-схема послідовності операцій конкретного варіанта здійснення способу виконання регулювання посилення, яка, загалом, позначається 300. В ілюстративному варіанті здійснення, спосіб 300 може здійснюватися в системі 100 за фіг. 1. [0050] Спосіб 300 може включати в себе прийом аудіосигналу, який повинен бути кодований (наприклад, через модель проходження сигналів кодування мови), на 302. У конкретному варіанті здійснення, аудіосигнал може мати смугу пропускання приблизно від 50 Гц до 16 кГц і може включати в себе мову. Наприклад, на фіг. 1, гребінка 110 аналітичних фільтрів може приймати вхідний аудіосигнал 102, який кодується для відтворення в приймальному пристрої. [0051] Спосіб 300 також може включати в себе визначення, на основі спектральної інформації (наприклад, рознесення між LSP, швидкості LSP-варіації), що відповідає аудіосигналу, те, що аудіосигнал включає в себе компонент, який відповідає умові формування артефактів, на 304. У конкретному варіанті здійснення, викликаючий артефакти компонент може являти собою шум, наприклад, високочастотний шум, показаний на першій спектрограмі 210 за фіг. 2. Наприклад, на фіг. 1, модуль 158 виявлення викликаючих артефакти компонентів може 9 UA 114027 C2 5 10 15 20 25 30 35 40 45 50 55 60 визначати на основі спектральної інформації те, що частина смуги високих частот аудіосигналу 102 включає в себе такий шум. [0052] Визначення того, що аудіосигнал включає в себе компонент, може включати в себе визначення рознесення між LSP, асоційованого з кадром аудіосигналу. Рознесення між LSP може бути найменшим з множини рознесень між LSP, що відповідають множині LSP, сформованих під час лінійного прогнозуючого кодування (LPC) частини смуги високих частот кадру аудіосигналу. Наприклад, аудіосигнал може визначатися як такий, що включає в себе згаданий компонент у відповідь на рознесення між LSP, менше першого порогового значення. Як інший приклад, аудіосигнал може визначатися як такий, що включає в себе згаданий компонент у відповідь на рознесення між LSP, менше другого порогового значення, і середнє рознесення між LSP декількох кадрів, менше третього порогового значення. Як детальніше описано відносно фіг. 5, аудіосигнал може визначатися як такий, що включає в себе згаданий компонент у відповідь на (1) рознесення між LSP, менше другого порогового значення, і (2) щонайменше одне з: середнього рознесення між LSP, меншого третього порогового значення, або активування ослаблення посилення, яке відповідає іншому кадру аудіосигналу, причому інший кадр передує кадру аудіосигналу. Хоча умови для визначення того, включає чи ні аудіосигнал в себе компонент, позначаються як (1) та (2), такі мітки служать тільки для посилання і не накладають послідовний порядок операції. Замість цього, умови (1) та (2) можуть визначатися в будь-якому порядку відносно один одного або одночасно (щонайменше з частковим перекриттям з часом). [0053] Спосіб 300 додатково може включати в себе, у відповідь на визначення того, що аудіосигнал включає в себе згаданий компонент, регулювання параметра посилення, що відповідає аудіосигналу, на 306. Наприклад, на фіг. 1, модуль 162 ослаблення і згладжування посилення може модифікувати інформацію посилення, яка повинна бути включена у допоміжну інформацію 172 смуги високих частот, що призводить до кодованого вихідного потоку 192 бітів, який відхиляється від моделі проходження сигналів. Спосіб 300 може завершуватися, на 308. [0054] Регулювання параметра посилення може включати в себе активування згладжування посилення, щоб зменшувати значення посилення, яке відповідає кадру аудіосигналу. У конкретному варіанті здійснення, згладжування посилення включає в себе визначення зваженого середнього значень посилення, що включають в себе значення посилення та інше значення посилення, яке відповідає іншому кадру аудіосигналу. Згладжування посилення може активуватися у відповідь на першу швидкість варіації пари спектральних ліній (LSP), асоційовану з кадром, меншу четвертого порогового значення, і другу швидкість LSP-варіації, асоційовану з кадром, меншу п'ятого порогового значення. Перша швидкість LSP-варіації (наприклад, "низька" швидкість LSP-варіації) може відповідати меншій швидкості адаптації, ніж друга швидкість LSP-варіації (наприклад, "висока" швидкість LSP-варіації). [0055] Регулювання параметра посилення може включати в себе активування ослаблення посилення, щоб зменшувати значення посилення, яке відповідає кадру аудіосигналу. У конкретному варіанті здійснення, ослаблення посилення включає в себе застосування експонентної операції до значення посилення або застосування лінійної операції до значення посилення. Наприклад, у відповідь на задоволення першої умови посилення (наприклад, кадр включає в себе середнє рознесення між LSP менше шостого порогового значення), експонентна операція може застосовуватися до значення посилення. У відповідь на задоволення другої умови посилення (наприклад, активування ослаблення посилення, яке відповідає іншому кадру аудіосигналу, причому інший кадр передує кадру аудіосигналу), лінійна операція може застосовуватися до значення посилення. У конкретних варіантах здійснення, спосіб 300 за фіг. 3 може реалізовуватися через апаратні засоби (наприклад, пристрій на основі програмованої користувачем вентильної матриці (FPGA), спеціалізовану інтегральну схему (ASIC) тощо) процесора, такого як центральний процесор (CPU), процесор цифрових сигналів (DSP) або контролер, через мікропрограмний пристрій або через будь-яку комбінацію вищезазначеного. Як приклад, спосіб 300 за фіг. 3 може здійснюватися за допомогою процесора, який виконує інструкції, як описано відносно фіг. 6. [0056] Посилаючись на фіг. 4, показана блок-схема послідовності операцій конкретного варіанта здійснення способу виконання регулювання посилення, яка, загалом, позначається 400. В ілюстративному варіанті здійснення, спосіб 400 може здійснюватися в системі 100 за фіг. 1. [0057] Рознесення між парами спектральних ліній (LSP), асоційоване з кадром аудіосигналу, порівнюється щонайменше з одним пороговим значенням, на 402, і параметр посилення, що відповідає аудіосигналу, регулюється щонайменше, частково, на основі результату порівняння, на 404. Хоча порівняння рознесення між LSP щонайменше з одним пороговим значенням може 10 UA 114027 C2 5 10 15 20 25 30 35 40 45 50 55 60 вказувати наявність компонента формування артефактів в аудіосигналі, порівняння не повинне обов'язково вказувати фактичну наявність компонента формування артефактів. Наприклад, одне або більше порогових значень, що використовуються при порівнянні, можуть задаватися з можливістю надавати підвищену імовірність того, що регулювання посилення виконується, коли компонент формування артефактів присутній в аудіосигналі, при одночасному наданні підвищеної імовірності того, що регулювання посилення виконується без присутності компонента формування артефактів в аудіосигналі (наприклад, "псевдопозитивної думки"). Таким чином, спосіб 400 може виконувати регулювання посилення без визначення того, присутній чи ні компонент формування артефактів в аудіосигналі. [0058] У конкретному варіанті здійснення, рознесення між LSP є найменшим з множини рознесень між LSP, що відповідають множині LSP частини смуги високих частот кадру аудіосигналу. Регулювання параметра посилення може включати в себе активування ослаблення посилення у відповідь на рознесення між LSP, менше першого порогового значення. Альтернативно або крім цього, регулювання параметра посилення включає в себе активування ослаблення посилення у відповідь на рознесення між LSP, менше другого порогового значення, і середнє рознесення між LSP, менше третього порогового значення, при цьому середнє рознесення між LSP основане на рознесенні між LSP, асоційованому з кадром, і щонайменше одному іншому рознесенні між LSP, асоційованому щонайменше з одним іншим кадром аудіосигналу. [0059] Коли ослаблення посилення активується, регулювання параметра посилення може включати в себе застосування експонентної операції до значення параметра посилення у відповідь на задоволення першої умови посилення і застосування лінійної операції до значення параметра посилення у відповідь на задоволення другої умови посилення. [0060] Регулювання параметра посилення може включати в себе активування згладжування посилення, щоб зменшувати значення посилення, яке відповідає кадру аудіосигналу. Згладжування посилення може включати в себе визначення зваженого середнього значень посилення, що включають в себе значення посилення, асоційоване з кадром, і інше значення посилення, яке відповідає іншому кадру аудіосигналу. Згладжування посилення може активуватися у відповідь на першу швидкість варіації пари спектральних ліній (LSP), асоційовану з кадром, меншу четвертого порогового значення, і другу швидкість LSP-варіації, асоційовану з кадром, меншу п'ятого порогового значення. Перша швидкість LSP-варіації відповідає меншій швидкості адаптації, ніж друга швидкість LSP-варіації. [0061] У конкретних варіантах здійснення, спосіб 400 за фіг. 4 може реалізовуватися через апаратні засоби (наприклад, пристрій на основі програмованої користувачем вентильної матриці (FPGA), спеціалізовану інтегральну схему (ASIC) тощо) процесора, такого як центральний процесор (CPU), процесор цифрових сигналів (DSP) або контролер, через мікропрограмний пристрій або через будь-яку комбінацію вищезазначеного. Як приклад, спосіб 400 за фіг. 4 може здійснюватися за допомогою процесора, який виконує інструкції, як описано відносно фіг. 6. [0062] Посилаючись на фіг. 5, показана блок-схема послідовності операцій іншого конкретного варіанта здійснення способу виконання регулювання посилення, яка, загалом, позначається 500. В ілюстративному варіанті здійснення, спосіб 500 може здійснюватися в системі 100 за фіг. 1. [0063] Спосіб 500 може включати в себе визначення рознесення між LSP, асоційованого з кадром аудіосигналу, на 502. Рознесення між LSP може бути найменшим з множини рознесень між LSP, що відповідають множині LSP, сформованих під час лінійного прогнозуючого кодування кадру. Наприклад, рознесення між LSP може визначатися так, як проілюстровано у відношенні змінної lsp_spacing в псевдокоді, що відповідає фіг. 1. [0064] Спосіб 500 також може включати в себе визначення першої (наприклад, низької) швидкості LSP-варіації, асоційованої з кадром, на 504, і визначення другої (наприклад, високої) швидкості LSP-варіації, асоційованої з кадром, на 506. Наприклад, швидкості LSP-варіації можуть визначатися так, як проілюстровано у відношенні змінних lsp_slow_evol_rate та lsp_fast_evol_rate в псевдокоді, що відповідає фіг. 1. [0065] Спосіб 500 додатково може включати в себе визначення середнього рознесення між LSP на основі рознесення між LSP, асоційованого з кадром, і щонайменше одного іншого рознесення між LSP, асоційованого щонайменше з одним іншим кадром аудіосигналу, на 508. Наприклад, середнє рознесення між LSP може визначатися так, як проілюстровано у відношенні змінної Average_lsp_shb_spacing в псевдокоді, що відповідає фіг. 1. [0066] Спосіб 500 може включати в себе визначення того, менше чи ні рознесення між LSP першого порогового значення, на 510. Наприклад, в псевдокоді за фіг. 1, перше порогове 11 UA 114027 C2 5 10 15 20 25 30 35 40 45 50 55 60 значення може становити THR2=0,0032. Коли рознесення між LSP менше першого порогового значення, спосіб 500 може включати в себе активування ослаблення посилення, на 514. [0067] Коли рознесення між LSP не менше першого порогового значення, спосіб 500 може включати в себе визначення того, менше чи ні рознесення між LSP другого порогового значення, на 512. Наприклад, в псевдокоді за фіг. 1, друге порогове значення може становити THR1=0,008. Коли рознесення між LSP не менше другого порогового значення, спосіб 500 може завершуватися, на 522. Коли рознесення між LSP менше другого порогового значення, спосіб 500 може включати в себе визначення того, менше чи ні середнє рознесення між LSP третього порогового значення, того, являє собою чи ні (або іншим чином асоційований) кадр зміни режиму, і/або того, активоване чи ні ослаблення посилення в попередньому кадрі, на 516. Наприклад, в псевдокоді за фіг. 1, третє порогове значення може становити THR3=0,005. Коли середнє рознесення між LSP менше третього порогового значення, або кадр представляє зміну режиму або якщо змінна prevGainAttenuate=TRUE, спосіб 500 може включати в себе активування ослаблення посилення, на 514. Коли середнє рознесення між LSP не менше третього порогового значення, і кадр не представляє зміну режиму і змінну prevGainAttenuate=FALSE, спосіб 500 може завершуватися, на 522. [0068] Коли ослаблення посилення активується на 514, спосіб 500 може перейти до 518 і визначати те, менше чи ні перша швидкість варіації четвертого порогового значення, менше чи ні друга швидкість варіації п'ятого порогового значення, на 518. Наприклад, в псевдокоді за фіг. 1, четверте порогове значення може становити THR4=0,001, і п'яте порогове значення може становити THR5=0,001. Коли перша швидкість варіації менше четвертого порогового значення, і друга швидкість варіації менше п'ятого порогового значення, спосіб 500 може включати в себе активування згладжування посилення, на 520, після чого спосіб 500 може завершуватися, на 522. Коли перша швидкість варіації не менше четвертого порогового значення, або друга швидкість варіації не менше п'ятого порогового значення, спосіб 500 може завершуватися, на 522. [0069] У конкретних варіантах здійснення, спосіб 500 за фіг. 5 може реалізовуватися через апаратні засоби (наприклад, пристрій на основі програмованої користувачем вентильної матриці (FPGA), спеціалізовану інтегральну схему (ASIC) тощо) процесора, такого як центральний процесор (CPU), процесор цифрових сигналів (DSP) або контролер, через мікропрограмний пристрій або через будь-яку комбінацію вищезазначеного. Як приклад, спосіб 500 за фіг. 5 може здійснюватися за допомогою процесора, який виконує інструкції, як описано відносно фіг. 6. [0070] Таким чином, фіг. 1-5 ілюструють системи та способи визначення того, потрібно чи ні виконувати регулювання посилення (наприклад, в модулі 162 ослаблення і згладжування посилення за фіг. 1) для того, щоб зменшувати артефакти внаслідок шуму. [0071] Посилаючись на фіг. 6, проілюстрована блок-схема конкретного ілюстративного варіанта здійснення пристрою бездротового зв'язку, який, загалом, позначається 600. Пристрій 600 включає в себе процесор 610 (наприклад, центральний процесор (CPU), процесор цифрових сигналів (DSP) тощо), з'єднаний із запам'ятовуючим пристроєм 632. Запам'ятовуючий пристрій 632 може включати в себе інструкції 660, що виконуються за допомогою процесора 610 і/або кодера/декодера 634 (кодека) для того, щоб здійснювати способи і процеси, розкриті в даному документі, наприклад, способи за фіг. 3-5. [0072] Кодек 634 може включати в себе систему 672 регулювання посилення. У конкретному варіанті здійснення, система 672 регулювання посилення може включати в себе один або більше компонентів системи 100 за фіг. 1. Система 672 регулювання посилення може реалізовуватися через спеціалізовані апаратні засоби (наприклад, схему), за допомогою виконання інструкцій процесора для того, щоб виконувати одну або більше задач, або через комбінацію вищезазначеного. Як приклад, запам'ятовуючий пристрій 632 або запам'ятовуючий пристрій в кодеку 634 може являти собою такий запам'ятовуючий пристрій, як оперативний запам'ятовуючий пристрій (RAM), магніторезистивний оперативний запам'ятовуючий пристрій (MRAM), MRAM з передачею спінового крутного моменту (STT-MRAM), флеш-пам'ять, постійний запам'ятовуючий пристрій (ROM), програмований постійний запам'ятовуючий пристрій (PROM), стираний програмований постійний запам'ятовуючий пристрій (EPROM), електрично стираний програмований постійний запам'ятовуючий пристрій (EEPROM), регістри, жорсткий диск, знімний диск або постійний запам'ятовуючий пристрій на компакт-дисках (CD-ROM). Запам'ятовуючий пристрій може включати в себе інструкції (наприклад, інструкції 660), які, при виконанні за допомогою комп'ютера (наприклад, процесора в кодеку 634 і/або процесорі 610), можуть інструктувати комп'ютеру визначати, на основі спектральної інформації, яка відповідає аудіосигналу, те, що аудіосигнал включає в себе компонент, який відповідає умові формування 12 UA 114027 C2 5 10 15 20 25 30 35 40 45 50 55 60 артефактів, і регулювати параметр посилення, який відповідає аудіосигналу, у відповідь на визначення того, що аудіосигнал включає в себе згаданий компонент. Як приклад, запам'ятовуючий пристрій 632 або запам'ятовуючий пристрій в кодеку 634 може являти собою некороткочасний машиночитаний носій, який включає в себе інструкції (наприклад, інструкції 660), які, при виконанні за допомогою комп'ютера (наприклад, процесора в кодеку 634 і/або процесорі 610), можуть інструктувати комп'ютеру порівнювати рознесення між парами спектральних ліній (LSP), асоційоване з кадром аудіосигналу щонайменше з одним пороговим значенням і регулювати параметр посилення при кодуванні аудіо, що відповідає аудіосигналу щонайменше, частково, на основі результату порівняння. [0073] Фіг. 6 також показує контролер 626 відображення, який з'єднується з процесором 610 і з дисплеєм 628. Кодек 634 може з'єднуватися з процесором 610, як показано. Динамік 636 і мікрофон 638 можуть з'єднуватися з кодеком 634. Наприклад, мікрофон 638 може формувати вхідний аудіосигнал 102 за фіг. 1, і кодек 634 може формувати вихідний потік 192 бітів для передачі в приймальний пристрій на основі вхідного аудіосигналу 102. Як інший приклад, динамік 636 може використовуватися для того, щоб виводити сигнал, відновлений за допомогою кодека 634 з вихідного потоку 192 бітів за фіг. 1, при цьому вихідний потік 192 бітів приймається з передавального пристрою. Фіг. 6 також вказує те, що бездротовий контролер 640 може з'єднуватися з процесором 610 і з бездротовою антеною 642. [0074] У конкретному варіанті здійснення, процесор 610, контролер 626 відображення, запам'ятовуючий пристрій 632, кодек 634, бездротовий контролер 640 і приймальнопередавальний пристрій 644 включаються в пристрій 622 на основі системи в одному корпусі або внутрішньокристальної системи. У конкретному варіанті здійснення, пристрій 630 введення і джерело 622 живлення з'єднуються з пристроєм 628 на основі внутрішньокристальної системи. Крім того, в конкретному варіанті здійснення, як проілюстровано на фіг. 6, пристрій 630 відображення, пристрій 636 введення, динамік 638, мікрофон 642, антена 644 і джерело 622 живлення є зовнішніми для пристрою 628 на основі внутрішньокристальної системи. Проте, кожний з пристрою 630 відображення, пристрою 636 введення, динаміка 638, мікрофона 642, антени 644 і джерела 1844 живлення може з'єднуватися з компонентом пристрою 622 на основі внутрішньокристальної системи, таким як інтерфейс або контролер. [0075] У поєднанні з описаними варіантами здійснення розкритий пристрій, який включає в себе засіб для визначення, на основі спектральної інформації, яка відповідає аудіосигналу, того, що аудіосигнал включає в себе компонент, який відповідає умові формування артефактів. Наприклад, засіб для визначення може включати в себе модуль 158 виявлення викликаючих артефакти компонентів за фіг. 1, систему 672 регулювання посилення за фіг. 6 або її компонент, один або більше пристроїв, виконаних з можливістю визначати те, що аудіосигнал включає в себе такий компонент (наприклад, процесор, що виконує інструкції в некороткочасному машиночитаному носії зберігання даних), або будь-яку комбінацію вищезазначеного. [0076] Пристрій також може включати в себе засіб для регулювання параметра посилення, що відповідає аудіосигналу, у відповідь на визначення того, що аудіосигнал включає в себе згаданий компонент. Наприклад, засіб для регулювання може включати в себе модуль 162 ослаблення і згладжування посилення за фіг. 1, систему 672 регулювання посилення за фіг. 6 або її компонент, один або більше пристроїв, виконаних з можливістю формувати кодований сигнал (наприклад, процесор, що виконує інструкції в некороткочасному машиночитаному носії зберігання даних), або будь-яку комбінацію вищезазначеного. [0077] Фахівці в даній галузі техніки додатково повинні брати до уваги, що різні ілюстративні логічні блоки, конфігурації, модулі, схеми та етапи алгоритму, описані в зв'язку з варіантами здійснення, розкритими в даному документі, можуть бути реалізовані як електронні апаратні засоби, комп'ютерне програмне забезпечення, що виконується за допомогою пристрою обробки, такого як апаратний процесор, або як комбінації вищезазначеного. Різні ілюстративні компоненти, блоки, конфігурації, модулі, схеми та етапи описані вище, загалом, з точки зору їх функціональності. Те, реалізована ця функціональність як апаратні засоби або виконуване програмне забезпечення, залежить від конкретного варіанта застосування і проектних обмежень, що накладаються на систему в цілому. Фахівці в даній галузі техніки можуть реалізовувати описану функціональність різними способами для кожного конкретного варіанта застосування, але такі рішення з реалізації не повинні бути інтерпретовані як відступ від обсягу даного розкриття суті. [0078] Етапи способу або алгоритму, описані у зв'язку з розкритими в даному документі варіантами здійснення, можуть бути реалізовані безпосередньо в апаратних засобах, в програмному модулі, що приводиться у виконання за допомогою процесора, або в їх комбінації. Програмний модуль може постійно розміщуватися в запам'ятовуючому пристрої, такому як 13 UA 114027 C2 5 10 15 20 оперативний запам'ятовуючий пристрій (RAM), магніторезистивний оперативний запам'ятовуючий пристрій (MRAM), MRAM з передачею спінового крутного моменту (STTMRAM), флеш-пам'ять, постійний запам'ятовуючий пристрій (ROM), програмований постійний запам'ятовуючий пристрій (PROM), стираний програмований постійний запам'ятовуючий пристрій (EPROM), електрично стираний програмований постійний запам'ятовуючий пристрій (EEPROM), регістри, жорсткий диск, знімний диск або постійний запам'ятовуючий пристрій на компакт-дисках (CD-ROM). Зразковий запам'ятовуючий пристрій з'єднується з процесором, так що процесор може зчитувати інформацію і записувати інформацію в запам'ятовуючий пристрій. В альтернативному варіанті, запам'ятовуючий пристрій може бути вбудований в процесор. Процесор і носій зберігання даних можуть постійно розміщуватися в спеціалізованій інтегральній схемі (ASIC). ASIC може постійно розміщуватися в обчислювальному пристрої або користувацькому терміналі. В альтернативному варіанті, процесор і носій зберігання даних можуть постійно розміщуватися як дискретні компоненти в обчислювальному пристрої або користувацькому терміналі. [0079] Попередній опис розкритих варіантів здійснення наданий для того, щоб давати можливість фахівцям в даній галузі техніки створювати або використовувати розкриті варіанти здійснення. Різні модифікації в цих варіантах здійснення повинні бути очевидними для фахівців у даній галузі техніки, а описані в даному документі принципи можуть бути застосовані до інших варіантів здійснення без відступу від обсягу розкриття суті. Таким чином, дане розкриття суті не має намір бути обмеженим, показаними в даному документі варіантами здійснення, а повинне задовольняти найширшому можливому обсягу, узгодженому з принципами та новими ознаками, що задаються за допомогою прикладеної формули винаходу. ФОРМУЛА ВИНАХОДУ 25 30 35 40 45 50 55 60 1. Спосіб регулювання параметрів підсилення, який містить етапи, на яких: - визначають (304), на основі рознесення між парами спектральних ліній (LSP), асоційованого з кадром аудіосигналу, те, що аудіосигнал включає в себе компонент, який відповідає умові формування артефактів; і - у відповідь на визначення того, що аудіосигнал включає в себе згаданий компонент, регулюють параметр посилення, що відповідає аудіосигналу, при цьому рознесення між LSP є найменшим з множини рознесень між LSP, що відповідають множині LSP частини смуги високих частот згаданого кадру аудіосигналу. 2. Спосіб за п. 1, в якому аудіосигнал визначається як такий, що включає в себе згаданий компонент у відповідь на рознесення між LSP, менше першого порогового значення, або аудіосигнал визначається як такий, що включає в себе згаданий компонент у відповідь на рознесення між LSP, менше другого порогового значення, і середнє рознесення між LSP, менше третього порогового значення, при цьому середнє рознесення між LSP основане на рознесенні між LSP, асоційованому з кадром, і щонайменше одному іншому рознесенні між LSP, асоційованому щонайменше з одним іншим кадром аудіосигналу, або аудіосигнал визначається як такий, що включає в себе згаданий компонент у відповідь на: 1) рознесення між LSP, менше другого порогового значення; і 2) щонайменше одне з: - середнього рознесення між LSP, меншого третього порогового значення; або - активування ослаблення посилення, яке відповідає іншому кадру аудіосигналу, причому інший кадр передує кадру аудіосигналу, або умова формування артефактів відповідає шуму смуги високих частот. 3. Спосіб за п. 1, в якому регулювання параметра посилення включає в себе етап, на якому активують згладжування посилення, щоб зменшувати більш швидкі зміни значення посилення, яке відповідає кадру аудіосигналу. 4. Спосіб за п. 3, в якому згладжування посилення включає в себе етап, на якому визначають зважене середнє із значень посилення, що включають в себе значення посилення, асоційоване з кадром, і інше значення посилення, яке відповідає іншому кадру аудіосигналу, або згладжування посилення активується у відповідь на першу швидкість варіації пари спектральних ліній (LSP), асоційовану з кадром, меншу четвертого порогового значення, і другу швидкість LSP-варіації, асоційовану з кадром, меншу п'ятого порогового значення. 5. Спосіб за п. 4, в якому перша швидкість LSP-варіації відповідає меншій швидкості адаптації, ніж друга швидкість LSP-варіації. 6. Спосіб за п. 1, в якому регулювання параметра посилення включає в себе етап, на якому активують ослаблення посилення, щоб зменшувати значення посилення, яке відповідає кадру 14 UA 114027 C2 5 10 15 20 25 30 35 40 45 аудіосигналу. 7. Спосіб за п. 6, в якому ослаблення посилення включає в себе етап, на якому застосовують експонентну операцію до значення посилення, або ослаблення посилення включає в себе етап, на якому застосовують лінійну операцію до значення посилення. 8. Спосіб за п. 6, в якому ослаблення посилення включає в себе етапи, на яких: - у відповідь на задоволення першої умови посилення, застосовують експонентну операцію до значення посилення; і - у відповідь на задоволення другої умови посилення, застосовують лінійну операцію до значення посилення. 9. Спосіб за п. 8, в якому перша умова посилення включає в себе середнє рознесення між LSP, менше шостого порогового значення, при цьому середнє рознесення між LSP основане на рознесенні між LSP, асоційованому з кадром, і щонайменше одному іншому рознесенні між LSP, асоційованому щонайменше з одним іншим кадром аудіосигналу, або друга умова посилення включає в себе активування ослаблення посилення, яке відповідає іншому кадру аудіосигналу, причому інший кадр передує кадру аудіосигналу. 10. Спосіб регулювання параметрів підсилення при кодуванні аудіо, який містить етапи, на яких: - порівнюють (402) рознесення між парами спектральних ліній (LSP), асоційоване з кадром аудіосигналу, зі щонайменше одним пороговим значенням; і - регулюють (404) параметр посилення при кодуванні аудіо, що відповідає аудіосигналу, щонайменше частково, на основі результату порівняння, при цьому рознесення між LSP є найменшим з множини рознесень між LSP, що відповідають множині LSP частини смуги високих частот кадру аудіосигналу. 11. Спосіб за п. 10, в якому регулювання параметра посилення включає в себе етап, на якому активують ослаблення посилення у відповідь на рознесення між LSP, менше першого порогового значення, або регулювання параметра посилення включає в себе етап, на якому активують ослаблення посилення у відповідь на рознесення між LSP, менше другого порогового значення, і середнє рознесення між LSP, менше третього порогового значення, при цьому середнє рознесення між LSP основане на рознесенні між LSP, асоційованому з кадром, і щонайменше одному іншому рознесенні між LSP, асоційованому щонайменше з одним іншим кадром аудіосигналу, або регулювання параметра посилення включає в себе, коли ослаблення посилення активується, етапи, на яких: - у відповідь на задоволення першої умови посилення, застосовують експонентну операцію до значення параметра посилення; і - у відповідь на задоволення другої умови посилення, застосовують лінійну операцію до значення параметра посилення, або регулювання параметра посилення включає в себе етап, на якому активують згладжування посилення, щоб зменшувати більш швидкі зміни значення посилення, яке відповідає кадру аудіосигналу. 12. Спосіб за п. 11, в якому згладжування посилення включає в себе етап, на якому визначають зважене середнє із значень посилення, що включають в себе значення посилення, асоційоване з кадром, і інше значення посилення, яке відповідає іншому кадру аудіосигналу. 13. Спосіб за п. 12, в якому згладжування посилення активується у відповідь на першу швидкість варіації пари спектральних ліній (LSP), асоційовану з кадром, меншу четвертого порогового значення, і другу швидкість LSP-варіації, асоційовану з кадром, меншу п'ятого порогового значення, при цьому перша швидкість LSP-варіації відповідає меншій швидкості адаптації, ніж друга швидкість LSP-варіації. 14. Пристрій, який містить: засіб, виконаний з можливістю виконувати етапи способу за будь-яким з пп. 1-13. 15. Постійний машиночитаний носій, що містить інструкції, які, при виконанні за допомогою комп'ютера, спонукають комп’ютер виконувати етапи способу за будь-яким з пп. 1-13. 15 UA 114027 C2 16 UA 114027 C2 17 UA 114027 C2 18 UA 114027 C2 19 UA 114027 C2 Комп’ютерна верстка Л. Ціхановська Державна служба інтелектуальної власності України, вул. Василя Липківського, 45, м. Київ, МСП, 03680, Україна ДП “Український інститут інтелектуальної власності”, вул. Глазунова, 1, м. Київ – 42, 01601 20

Дивитися

Додаткова інформація

Назва патенту англійською

Systems and methods of performing gain control

Автори англійською

Atti, Venkatraman Srinivasa, Krishnan, Venkatesh

Автори російською

Атти Венкатраман Сриниваса, Кришнан Венкатэш

МПК / Мітки

МПК: G10L 21/0264, G10L 21/038

Мітки: виконання, способи, регулювання, посилення, системі

Код посилання

<a href="https://ua.patents.su/22-114027-sistemi-ta-sposobi-vikonannya-regulyuvannya-posilennya.html" target="_blank" rel="follow" title="База патентів України">Системи та способи виконання регулювання посилення</a>

Подібні патенти