Спосіб спектральної ідентифікації мовного сигналу

Завантажити PDF файл.

Формула / Реферат

Спосіб спектральної ідентифікації мовного сигналу в заданій послідовності взаємозв'язаних операцій перетворення мовного сигналу, за яким проводять низькочастотну фільтрацію мовного сигналу в смузі частот 3...10 кГц; розділяють мовний сигнал на сегменти аналізу однакової тривалості 10...30 мс; проводять стандартне 9...12-бітове аналого-цифрове перетворення сигналу з частотою дискретизації 6...20 кГц на кожному сегменті аналізу, який відрізняється тим, що формують на кожному сегменті аналізу дискретні відліки поточної речовинної спектральної щільності Хартлі шляхом застосування стандартного дискретного перетворення Хартлі до речовинних відліків мовного сигналу на сегментах аналізу; виділяють абсолютні значення дискретних речовинних відліків поточних спектрів Хартлі мовного сигналу на сегментах аналізу; для кожної частоти дискретного спектра Хартлі сегмента аналізу мовного сигналу формують варіаційні ряди по сегментах виділених абсолютних значень дискретних речовинних відліків поточних спектрів Хартлі; для кожного варіаційного ряду абсолютних значень відліків виділяють квантилі; формують залежності виділених квантилів від дискретних значень частоти спектра мовного сигналу; порівнюють отримані залежності квантилів від дискретних значень частоти спектра мовного сигналу за відомими критеріями узгодженості, наприклад, Колмогорова, з відповідними залежностями квантилів від цих же значень частоти спектрів Хартлі еталонних або зразкових, або типових мовних реалізацій бази даних.

Текст

Спосіб спектральної ідентифікації мовного сигналу в заданій послідовності взаємозв'язаних операцій перетворення мовного сигналу, за яким проводять низькочастотну фільтрацію мовного сигналу в смузі частот 3...10 кГц; розділяють мовний сигнал на сегменти аналізу однакової тривалості 10...30 мс; проводять стандартне 9...12бітове аналого-цифрове перетворення сигналу з частотою дискретизації 6...20 кГц на кожному C2 2 (19) 1 3 80587 низькочастотну фільтрацію мовного сигналу в смузі частот 3...10кГц; розділяють мовний сигнал на сегменти аналізу однакової тривалості 10...30мс; проводять стандартне 9...12-бітове аналого-цифрове перетворення мовного сигналу з частотою дискретизації 6...20кГц на кожному сегменті аналізу; формують на кожному сегменті аналізу дискретні відліки поточної комплексної спектральної щільності мовного сигналу шляхом застосування стандартного дискретного перетворення Фур'є до відліків мовного сигналу на сегментах; виділяють модульні значення дискретних відліків поточних комплексних спектрів сигналів сегментів аналізу; визначають статистичні характеристики (гістограми функцій розподілу або щільності розподілу імовірностей, оцінки середніх і дисперсій) модульних значень спектру по всіх сегментах аналізу для кожної частоти дискретного спектру мовного сигналу; порівнюють отримані статистичні характеристики (гістограми функцій розподілу або щільності розподілу імовірностей, оцінки середніх і дисперсій) мовного сигналу по відомим критеріям узгодженості, наприклад Колмогорова, з відповідними статистичними характеристиками (гістограмами функцій розподілу або щільності розподілів імовірностей, оцінками середніх і дисперсій) еталонних (зразкових, типових) мовних реалізацій бази даних [1, 2]. Основною причиною зниження ефективності відомих систем, що реалізовують способи спектральної ідентифікації мовного сигнал), є те, що мовний сигнал є випадковим нестаціонарним процесом зі змінною дисперсією і складною формою поточної спектральної щільності потужності (амплітудного спектру). В результаті цього багатовимірні функції щільності розподілу імовірностей миттєви х модульних значень дискретних комплексних відліків поточних спектрів Фур'є си гналу на сегментах аналізу є негаусовськими та багатомодальними, що істотно ускладнює застосування відомих статистичних критеріїв узгодження і знижує імовірності травильної ідентифікації. В основу винаходу «Спосіб спектральної ідентифікації мовного сигналу» поставлена задача підвищення ефективності відомих систем спектральної ідентифікації мовного сигналу шляхом порівняння залежностей від спектральної частоти мовного сигналу квантилів (квартилів, децилів, процентілів) варіаційних рядів по всіх сегментах аналізу абсолютних значень поточних речовинних спектрів Хартлі мовного сигналу на сегментах з відповідними залежностями квантилів (квартилів, децилів, процентілів) абсолютних значень речовинних спектрів Хартлі еталонних (зразкових, типових) мовних реалізацій бази даних на основі відомих критеріїв узгодження. Рішення поставленої задачі досягається тим, що в заданій способом-прототипом послідовності взаємозв'язаних операцій перетворення мовного сигналу: проводять низькочастотну фільтрацію мовного сигналу в смузі частот 3...10кГц; розділяють мовний сигнал на сегменти аналізу однакової тривалості 10...30мс; проводять 4 стандартне 9...12бітове аналого-цифрове перетворення сигналу з частотою дискретизації 6...20кГц на кожному сегменті аналізу, додатково формують на кожному сегменті аналізу дискретні відліки поточної речовинної спектральної щільності Хартлі шляхом застосування стандартного дискретного перетворення Хартлі до речовинних відліків мовного сигналу на сегментах аналізу; виділяють абсолютні значення дискретних речовинних відліків поточних спектрів Хартлі мовного сигналу на сегментах аналізу; для кожне ї частоти дискретного спектру Хартлі мовного сигналу формують варіаційні ряди по сегментах виділених абсолютних значень дискретних речовинні їх відліків поточних спектрів Хартлі; для кожного варіаційного ряду абсолютних значень відліків виділяють квантилі (квартилі, децилі, процентілі); формують залежності виділених квантилів (квартилів, децилів, процентілів) від дискретних значень частоти спектру мовного сигналу; порівнюють отримані залежності квантилів (квартилів, децилів, процентілів) від дискретних значень частоти спектру мовного сигналу по відомим критеріям узгодженості, наприклад Колмогорова, з відповідними залежностями квантилів (квартилів, децилів, процентілів) від цих же значень частоти спектрів еталонних (зразкових, типових) мовних реалізацій бази даних. На Фіг.1 наведена структурна схема пристрою спектральної ідентифікації мовного сигналу шляхом порівняння залежностей від дискретних значень частоти спектру мовного сигналу квантилів (квартилів, децилів, процентілів) варіаційних рядів абсолютних значень відліків поточних речовинних спектрів Хартлі мовного сигналу для кожної частоти дискретного спектру по сегментах аналізу з аналогічними залежностями квантилів (квартилів, децилів, процентілів) від частоти еталонних зразків мови бази даних, який реалізує об'єкт, що заявляється спосіб спектральної ідентифікації мовного сигналу, де позначено: 1 - блок фільтру нижніх частот фільтрації мовного сигналу в см узі частот 3...10кГц; 2 - блок сегментації мовного сигналу на сегменти аналізу однакової тривалості 10...30мс; 3 - блок аналого-цифрового перетворення мовного сигналу з частотою дискретизації 6...20кГц і стандартним 9...12-бітовим квантуванням на кожному сегменті аналізу; 4 - блок дискретного перетворення Хартлі речовинних відліків мовного сигналу на сегментах аналізу; 5 - блок виділення абсолютних значень дискретних речовинних відліків поточних спектрів Хартлі сигналів на сегментах аналізу; 6 - блок формування варіаційних рядів виділених абсолютних значень по сегментах аналізу для кожної частоти дискретного спектру мовного сигналу; 7 - блок виділення квантилів (квартилів, децилів, пзоцентілів) варіаційних рядів абсолютних значень дискретних відліків поточних спектрів Хартлі по сегментах; 5 80587 8 - блок формування залежностей квантилів (квартилів, децилів, процентілів) від дискретних значень частоти спектру мовного сигналу; 9 - блок порівняння залежностей квантилів (квартилів, децилів, процентілів) від дискретних значень частоти спектру Хартлі мовного сигналу і відповідних залежностей квантилів (квартилів, децилів, процентілів) спектрів Хартлі еталонних (зразкових, типових) мовних реалізацій бази даних; 10 - блок еталонних залежностей квантилів (квартилів, децилів, процентілів) від дискретних значень частоти спектру еталонних (зразкових, типових) мовних реалізацій бази даних; 11 - блок ідентифікації мовного сигналу за наслідками статистичного порівняння залежностей квантилів (квартилів, децилів, процентілів) від дискретних значень частоти спектру мовного сигналу і еталонних (зразкових, типових) мовних реалізацій бази даних на основі відомого критерію узгодженості Колмогорова. Вихід блоку фільтру нижніх частот 1 фільтрації мовного сигналу в смузі частот 3...10кГц, вхід якого є входом пристрою, через послідовно з'єднанні блок сегментації 2 мовних сигналів на сегменти аналізу однакової тривалості 10...30мс, блок аналого-цифрового перетворення 3 мовних сигналів з частотою дискретизації 6...20кГц і стандартним 9...12-бітовим квантуванням на кожному сегменті аналізу, блок дискретного перетворення Хартлі 4 речовинних відліків мовного сигналу на сегментах аналізу, блок виділення абсолютних значень 5 дискретних речовинних відліків поточних спектрів Хартлі мовного сигналу на сегментах аналізу, блок формування варіаційні χ рядів 6 виділених абсолютних значень по сегментах аналізу для кожної частоти дискретного спектру мовного сигналу, блок виділення квантилів 7 (квартилів, децилів, процентілів) варіаційних рядів абсолютних значень дискретних відліків поточних спектрів Хартлі по сегментах аналізу, блок формування залежностей квантилів 8 (квартилів, децилів, процентілів) від дискретних значень частоти спектру мовного сигналу підключений до першого входу блоку порівняння залежності квантилів 9 (квартилів, децилів, процентілів) від дискретних значень частоти спектру Хартлі мовного сигналу і відповідних залежностей квантилів (квартилів, децилів, процентілів) спектрів Хартлі еталонних (зразкових, типових) мовних реалізацій бази даних, до др угого входу якого підключений вихід блок еталонних залежностей квантилів 10 (квартилів, децилів, процентілів) від дискретних значень частот спектру Хартлі еталонних (зразкових, типових) мовних реалізацій бази даних, а ви хід підключений до входу блоку ідентифікації мовного сигналу 11 за наслідками статистичного порівняння різниць відповідних залежностей на основі критерію узгодженості Колмогорова, вихід якого є ви ходом пристрою. З ви ходу блоку фільтру нижніх часто т 1 фільтрації мовного сигналу в смузі частот 3...10кГц мовний сигнал проступає на вхід блоку сегментації 6 2 мовного сигналу на сегменти аналізу однакової тривалості 10...30мс, а з його виходу подається на блок аналого-цифрового перетворення 3 з частотою дискретизації 6...20кГц і стандартним 9...12-бітовим квантуванням мовного сигналу на кожному сегменті аналізу. Мовний сигнал в цифровому вигляді з виходу блоку 3 подається на вхід блоку 4 стандартного дискретного перетворення Хартлі речовинних відліків мовного сигналу на сегментах аналізу, при цьому речовинні дискретні значення спектральної щільності Хартлі мовного сигналу кожного сегменту з виходу блоку 4 поступають на вхід блоку 5 виділення абсолютних значень дискретних речовинних відліків поточних спектрів Хартлі сигналів на сегментах аналізу шля хом відкидання знакового біта цифрового дискретного відліку спектру. З виходу блоку виділення абсолютних значень 5 дискретні абсолютні значення спектрів подаються на вхід блоку 6 формування варіаційних рядів виділених абсолютних значень по сегментах аналізу для кожної частоти дискретного спектру мовного сигналу шляхом розміщення виділених абсолютних значень за збільшенням таким чином, що на першому сегменті розміщуються мінімальні величини абсолютних значень, а на останньому відповідно максимальні величини. Впорядковані таким чином за збільшенням величини виділених абсолютних значень з виходу блоку 6 подаються на вхід блоку 7 виділення квантилів (квартилів, децилів, процентілів) сформованих варіаційних рядів абсолютних значень дискретних відліків поточних спектрів Хартлі по сегментах як порядкових статистик вибіркового розподілу імовірностей абсолютних значень дискретних відліків поточних спектрів Хартлі для кожне ї частоти дискретного спектру мовного сигналу. Виділені квантилі (квартилі, децилі, процентілі) з виходу блоку 7 поступають на вхід блоку 8 формування залежності квантилів (квартилів, децилів, процентілів) від дискретних значень частоти спектру мовного сигналу, які подаються на перший вхід блоку 9 порівняння залежності квантилів (квартилів, децилів, процентілів) від дискретних значень частоти спектру мовного сигналу і відповідних залежностей квантилів (квартилів децилів, процентілів) еталонних (зразкових, типових) мовних реалізацій бази даних, що поступають на його другий вхід з виходу блоку 10 еталонних залежностей квантилів (квартилів, децилів, процентілів) від дискретних значень частоти спектру еталонних (зразкових, типових) мовних реалізацій бази даних. Вихідний сигнал блоку 9 у вигляді різниць залежностей квантилів (квартилів, децилів, процентілів) спектру Хартлі мовного сигналу і відповідних залежностей квантилів (квартилів, децилів, процентілів) спектрів Хартлі еталонних (зразкових, типових) мовних реалізацій бази даних подається на вхід блоку 11 ідентифікації мовного сигналу за наслідками статистичного аналізу різниць залежностей квантилів (квартилів, децилів, процентілів) спектрів Хартлі від дискретних значень частоти поточного спектру мовного сигналу і еталонних (зразкових, типових) спектрів 7 80587 Хартлі мовних реалізацій бази даних на основі відомого критерію узгодженості Колмогорова. Вихід блоку 11 є виходом пристрою спектральної ідентифікації мовного сигналу в цілому. На Фіг.2 наведена залежність квартилів спектру Хартлі еталонного мовного сигналу диктора №1, а на Фіг.3 наведена залежність квартилів спектру Хартлі еталонного мовного сигналу диктора №2 бази даних. На Фіг.4 наведена відповідна експериментальна залежність квартилів спектру Хартлі поточного спектру мовного сигналу диктора, що ідентифікується. Зіставлення різниць наведених залежностей квартилів спектрів Хартлі від дискретних значень частоти поточного спектру мовного сигналу і еталонних (зразкових, типових) спектрів Хартлі мовних реалізацій бази вказує на належність мовного сигналу, що ідентифікується, диктору №2. Використання більш інформативних залежносте й децилів та процентілів дозволяє підвищити вірогідність правильної ідентифікації. У зв'язку з тим, що квантилі (квартилі, децилі, процентілі) варіаційних рядів абсолютних значень дискретних відліків поточних спектрів Хартлі по сегментах як порядкові статистики вибіркового розподілу імовірностей абсолютних значень дискретних відліків поточних спектрів Хартлі для кожної частоти дискретного спектру мовного сигналу розподіляються по нормальному закону незалежно від негаусовського характеру багатовимірних функцій розподілу вибіркових значень спектру мовного сигналу, істотно підвищується ефективність критерію узгодженості Колмогорова, орієнтованого на статистичну ідентифікацію нормально розподілених випадкових величин, що використовується, що, зрештою, підвищує вірогідність правильної ідентифікації мовного сигналу. Разом з тим мета способу-прототипу спектральна ідентифікація мовного сигналу - в об'єкті, що заявляється, реалізуєтеся більш ефективно внаслідок того, що обчислювальні (часові) витрати на отримання речовинної спектральної щільності Хартлі мовного сигналу на сегменті менше ніж витрати на отримання комплексної спектральної щільності Фур'є. Крім того, отримання абсолютних значень дискретних відліків поточних спектрів Хартлі реалізується шляхом простого відкидання знакового біта цифрового дискретного відліку спектру, тоді як отримання модулів комплексних амплітуд спектральних компонент Фур'є вимагає реалізації нелінійної операції вилучення квадратного кореня з суми квадратів реальної і уявної частин відліку спектральної густини Фур'є [3]. У свою чергу, спектральна щільність Хартлі мовного сигналу, на відміну від спектральної щільності потужності або амплітудного спектру Фур'є, несиметрична щодо нульової частоти поточного спектру мовного сигналу, оскільки у часовій області реалізації мовних сигналів не є парними функціями. Ця обставина дозволяє використовува ти для підвищення якості ідентифікації мовного сигналу додаткову 8 інформаційну ознаку - ступінь несиметричності реалізації мовного сигналу на сегменті аналізу [3]. Комплексне використання перерахованих відмітних особливостей і пов'язаних з ними позитивних ефектів дозволяють забезпечити підвищення ефективності спектральної ідентифікації мовного сигналу шляхом порівняння залежності від спектральної частоти мовного сигналу квантилів (квартилів, децилів, процентілів) варіаційних рядів по всіх сегментах аналізу абсолютних значень поточних речовинних спектрів Хартлі мовного сигналу на сегментах з відповідними залежностями квантилів (квартилів, децилів, процентілів) абсолютних значень речовинних спектрів Хартлі еталонних (зразкових, типових) мовних реалізацій бази даних на основі відомих критеріїв узгодженості. джерела інформації: 1. Сапожков М.А. Речевой сигнал в кибернетике и связи (Преобразование речи применительно к задачам техники связи и кибернетики). - М: Гос. изд-во л-ры по вопр. связи и радио, 1963.-С.368-377. 2. Шелухин О.И. Лукьянцев Н.Ф. Цифровая обработка и передача речи. / Под ред. О.И.Шелухина.- М.: Радио и связь, 2000.- 456 :ил. С.98-106. 3. Денисенко А.Н. Сигналы. Теоретическая радиотехника. Справочное пособие. - М.: Горячая линия - Телеком, 2005,- 704с: ил. - С.99-105. 9 80587 10

Дивитися

Додаткова інформація

Назва патенту англійською

Method of spectral identification of a voice signal

Автори англійською

Kuznetsov Maksym Volodymyrovych, Seletkov Viktor Leonidovych

Назва патенту російською

Способ спектральной идентификации речевого сигнала

Автори російською

Кузнецов Максим Владимирович, Селетков Виктор Леонидович

МПК / Мітки

МПК: G10L 17/00, G10L 15/00

Мітки: мовного, сигналу, спектральної, ідентифікації, спосіб

Код посилання

<a href="https://ua.patents.su/5-80587-sposib-spektralno-identifikaci-movnogo-signalu.html" target="_blank" rel="follow" title="База патентів України">Спосіб спектральної ідентифікації мовного сигналу</a>

Подібні патенти