Спосіб спектральної ідентифікації мовного сигналу

Формула / Реферат | Подібні патенти | МПК / Мітки | Додаткова інформація | Код посилання

Номер патенту: 80587

Опубліковано: 10.10.2007

Автори: Селетков Віктор Леонідович, Кузнецов Максим Володимирович

Завантажити PDF файл.

Формула / Реферат

Текст

Спосіб спектральної ідентифікації мовного сигналу в заданій послідовності взаємозв'язаних операцій перетворення мовного сигналу, за яким проводять низькочастотну фільтрацію мовного сигналу в смузі частот 3...10 кГц; розділяють мовний сигнал на сегменти аналізу однакової тривалості 10...30 мс; проводять стандартне 9...12бітове аналого-цифрове перетворення сигналу з частотою дискретизації 6...20 кГц на кожному C2 2 (19) 1 3 80587 низькочастотну фільтрацію мовного сигналу в смузі частот 3...10кГц; розділяють мовний сигнал на сегменти аналізу однакової тривалості 10...30мс; проводять стандартне 9...12-бітове аналого-цифрове перетворення мовного сигналу з частотою дискретизації 6...20кГц на кожному сегменті аналізу; формують на кожному сегменті аналізу дискретні відліки поточної комплексної спектральної щільності мовного сигналу шляхом застосування стандартного дискретного перетворення Фур'є до відліків мовного сигналу на сегментах; виділяють модульні значення дискретних відліків поточних комплексних спектрів сигналів сегментів аналізу; визначають статистичні характеристики (гістограми функцій розподілу або щільності розподілу імовірностей, оцінки середніх і дисперсій) модульних значень спектру по всіх сегментах аналізу для кожної частоти дискретного спектру мовного сигналу; порівнюють отримані статистичні характеристики (гістограми функцій розподілу або щільності розподілу імовірностей, оцінки середніх і дисперсій) мовного сигналу по відомим критеріям узгодженості, наприклад Колмогорова, з відповідними статистичними характеристиками (гістограмами функцій розподілу або щільності розподілів імовірностей, оцінками середніх і дисперсій) еталонних (зразкових, типових) мовних реалізацій бази даних [1, 2]. Основною причиною зниження ефективності відомих систем, що реалізовують способи спектральної ідентифікації мовного сигнал), є те, що мовний сигнал є випадковим нестаціонарним процесом зі змінною дисперсією і складною формою поточної спектральної щільності потужності (амплітудного спектру). В результаті цього багатовимірні функції щільності розподілу імовірностей миттєви х модульних значень дискретних комплексних відліків поточних спектрів Фур'є си гналу на сегментах аналізу є негаусовськими та багатомодальними, що істотно ускладнює застосування відомих статистичних критеріїв узгодження і знижує імовірності травильної ідентифікації. В основу винаходу «Спосіб спектральної ідентифікації мовного сигналу» поставлена задача підвищення ефективності відомих систем спектральної ідентифікації мовного сигналу шляхом порівняння залежностей від спектральної частоти мовного сигналу квантилів (квартилів, децилів, процентілів) варіаційних рядів по всіх сегментах аналізу абсолютних значень поточних речовинних спектрів Хартлі мовного сигналу на сегментах з відповідними залежностями квантилів (квартилів, децилів, процентілів) абсолютних значень речовинних спектрів Хартлі еталонних (зразкових, типових) мовних реалізацій бази даних на основі відомих критеріїв узгодження. Рішення поставленої задачі досягається тим, що в заданій способом-прототипом послідовності взаємозв'язаних операцій перетворення мовного сигналу: проводять низькочастотну фільтрацію мовного сигналу в смузі частот 3...10кГц; розділяють мовний сигнал на сегменти аналізу однакової тривалості 10...30мс; проводять 4 стандартне 9...12бітове аналого-цифрове перетворення сигналу з частотою дискретизації 6...20кГц на кожному сегменті аналізу, додатково формують на кожному сегменті аналізу дискретні відліки поточної речовинної спектральної щільності Хартлі шляхом застосування стандартного дискретного перетворення Хартлі до речовинних відліків мовного сигналу на сегментах аналізу; виділяють абсолютні значення дискретних речовинних відліків поточних спектрів Хартлі мовного сигналу на сегментах аналізу; для кожне ї частоти дискретного спектру Хартлі мовного сигналу формують варіаційні ряди по сегментах виділених абсолютних значень дискретних речовинні їх відліків поточних спектрів Хартлі; для кожного варіаційного ряду абсолютних значень відліків виділяють квантилі (квартилі, децилі, процентілі); формують залежності виділених квантилів (квартилів, децилів, процентілів) від дискретних значень частоти спектру мовного сигналу; порівнюють отримані залежності квантилів (квартилів, децилів, процентілів) від дискретних значень частоти спектру мовного сигналу по відомим критеріям узгодженості, наприклад Колмогорова, з відповідними залежностями квантилів (квартилів, децилів, процентілів) від цих же значень частоти спектрів еталонних (зразкових, типових) мовних реалізацій бази даних. На Фіг.1 наведена структурна схема пристрою спектральної ідентифікації мовного сигналу шляхом порівняння залежностей від дискретних значень частоти спектру мовного сигналу квантилів (квартилів, децилів, процентілів) варіаційних рядів абсолютних значень відліків поточних речовинних спектрів Хартлі мовного сигналу для кожної частоти дискретного спектру по сегментах аналізу з аналогічними залежностями квантилів (квартилів, децилів, процентілів) від частоти еталонних зразків мови бази даних, який реалізує об'єкт, що заявляється спосіб спектральної ідентифікації мовного сигналу, де позначено: 1 - блок фільтру нижніх частот фільтрації мовного сигналу в см узі частот 3...10кГц; 2 - блок сегментації мовного сигналу на сегменти аналізу однакової тривалості 10...30мс; 3 - блок аналого-цифрового перетворення мовного сигналу з частотою дискретизації 6...20кГц і стандартним 9...12-бітовим квантуванням на кожному сегменті аналізу; 4 - блок дискретного перетворення Хартлі речовинних відліків мовного сигналу на сегментах аналізу; 5 - блок виділення абсолютних значень дискретних речовинних відліків поточних спектрів Хартлі сигналів на сегментах аналізу; 6 - блок формування варіаційних рядів виділених абсолютних значень по сегментах аналізу для кожної частоти дискретного спектру мовного сигналу; 7 - блок виділення квантилів (квартилів, децилів, пзоцентілів) варіаційних рядів абсолютних значень дискретних відліків поточних спектрів Хартлі по сегментах; 5 80587 8 - блок формування залежностей квантилів (квартилів, децилів, процентілів) від дискретних значень частоти спектру мовного сигналу; 9 - блок порівняння залежностей квантилів (квартилів, децилів, процентілів) від дискретних значень частоти спектру Хартлі мовного сигналу і відповідних залежностей квантилів (квартилів, децилів, процентілів) спектрів Хартлі еталонних (зразкових, типових) мовних реалізацій бази даних; 10 - блок еталонних залежностей квантилів (квартилів, децилів, процентілів) від дискретних значень частоти спектру еталонних (зразкових, типових) мовних реалізацій бази даних; 11 - блок ідентифікації мовного сигналу за наслідками статистичного порівняння залежностей квантилів (квартилів, децилів, процентілів) від дискретних значень частоти спектру мовного сигналу і еталонних (зразкових, типових) мовних реалізацій бази даних на основі відомого критерію узгодженості Колмогорова. Вихід блоку фільтру нижніх частот 1 фільтрації мовного сигналу в смузі частот 3...10кГц, вхід якого є входом пристрою, через послідовно з'єднанні блок сегментації 2 мовних сигналів на сегменти аналізу однакової тривалості 10...30мс, блок аналого-цифрового перетворення 3 мовних сигналів з частотою дискретизації 6...20кГц і стандартним 9...12-бітовим квантуванням на кожному сегменті аналізу, блок дискретного перетворення Хартлі 4 речовинних відліків мовного сигналу на сегментах аналізу, блок виділення абсолютних значень 5 дискретних речовинних відліків поточних спектрів Хартлі мовного сигналу на сегментах аналізу, блок формування варіаційні χ рядів 6 виділених абсолютних значень по сегментах аналізу для кожної частоти дискретного спектру мовного сигналу, блок виділення квантилів 7 (квартилів, децилів, процентілів) варіаційних рядів абсолютних значень дискретних відліків поточних спектрів Хартлі по сегментах аналізу, блок формування залежностей квантилів 8 (квартилів, децилів, процентілів) від дискретних значень частоти спектру мовного сигналу підключений до першого входу блоку порівняння залежності квантилів 9 (квартилів, децилів, процентілів) від дискретних значень частоти спектру Хартлі мовного сигналу і відповідних залежностей квантилів (квартилів, децилів, процентілів) спектрів Хартлі еталонних (зразкових, типових) мовних реалізацій бази даних, до др угого входу якого підключений вихід блок еталонних залежностей квантилів 10 (квартилів, децилів, процентілів) від дискретних значень частот спектру Хартлі еталонних (зразкових, типових) мовних реалізацій бази даних, а ви хід підключений до входу блоку ідентифікації мовного сигналу 11 за наслідками статистичного порівняння різниць відповідних залежностей на основі критерію узгодженості Колмогорова, вихід якого є ви ходом пристрою. З ви ходу блоку фільтру нижніх часто т 1 фільтрації мовного сигналу в смузі частот 3...10кГц мовний сигнал проступає на вхід блоку сегментації 6 2 мовного сигналу на сегменти аналізу однакової тривалості 10...30мс, а з його виходу подається на блок аналого-цифрового перетворення 3 з частотою дискретизації 6...20кГц і стандартним 9...12-бітовим квантуванням мовного сигналу на кожному сегменті аналізу. Мовний сигнал в цифровому вигляді з виходу блоку 3 подається на вхід блоку 4 стандартного дискретного перетворення Хартлі речовинних відліків мовного сигналу на сегментах аналізу, при цьому речовинні дискретні значення спектральної щільності Хартлі мовного сигналу кожного сегменту з виходу блоку 4 поступають на вхід блоку 5 виділення абсолютних значень дискретних речовинних відліків поточних спектрів Хартлі сигналів на сегментах аналізу шля хом відкидання знакового біта цифрового дискретного відліку спектру. З виходу блоку виділення абсолютних значень 5 дискретні абсолютні значення спектрів подаються на вхід блоку 6 формування варіаційних рядів виділених абсолютних значень по сегментах аналізу для кожної частоти дискретного спектру мовного сигналу шляхом розміщення виділених абсолютних значень за збільшенням таким чином, що на першому сегменті розміщуються мінімальні величини абсолютних значень, а на останньому відповідно максимальні величини. Впорядковані таким чином за збільшенням величини виділених абсолютних значень з виходу блоку 6 подаються на вхід блоку 7 виділення квантилів (квартилів, децилів, процентілів) сформованих варіаційних рядів абсолютних значень дискретних відліків поточних спектрів Хартлі по сегментах як порядкових статистик вибіркового розподілу імовірностей абсолютних значень дискретних відліків поточних спектрів Хартлі для кожне ї частоти дискретного спектру мовного сигналу. Виділені квантилі (квартилі, децилі, процентілі) з виходу блоку 7 поступають на вхід блоку 8 формування залежності квантилів (квартилів, децилів, процентілів) від дискретних значень частоти спектру мовного сигналу, які подаються на перший вхід блоку 9 порівняння залежності квантилів (квартилів, децилів, процентілів) від дискретних значень частоти спектру мовного сигналу і відповідних залежностей квантилів (квартилів децилів, процентілів) еталонних (зразкових, типових) мовних реалізацій бази даних, що поступають на його другий вхід з виходу блоку 10 еталонних залежностей квантилів (квартилів, децилів, процентілів) від дискретних значень частоти спектру еталонних (зразкових, типових) мовних реалізацій бази даних. Вихідний сигнал блоку 9 у вигляді різниць залежностей квантилів (квартилів, децилів, процентілів) спектру Хартлі мовного сигналу і відповідних залежностей квантилів (квартилів, децилів, процентілів) спектрів Хартлі еталонних (зразкових, типових) мовних реалізацій бази даних подається на вхід блоку 11 ідентифікації мовного сигналу за наслідками статистичного аналізу різниць залежностей квантилів (квартилів, децилів, процентілів) спектрів Хартлі від дискретних значень частоти поточного спектру мовного сигналу і еталонних (зразкових, типових) спектрів 7 80587 Хартлі мовних реалізацій бази даних на основі відомого критерію узгодженості Колмогорова. Вихід блоку 11 є виходом пристрою спектральної ідентифікації мовного сигналу в цілому. На Фіг.2 наведена залежність квартилів спектру Хартлі еталонного мовного сигналу диктора №1, а на Фіг.3 наведена залежність квартилів спектру Хартлі еталонного мовного сигналу диктора №2 бази даних. На Фіг.4 наведена відповідна експериментальна залежність квартилів спектру Хартлі поточного спектру мовного сигналу диктора, що ідентифікується. Зіставлення різниць наведених залежностей квартилів спектрів Хартлі від дискретних значень частоти поточного спектру мовного сигналу і еталонних (зразкових, типових) спектрів Хартлі мовних реалізацій бази вказує на належність мовного сигналу, що ідентифікується, диктору №2. Використання більш інформативних залежносте й децилів та процентілів дозволяє підвищити вірогідність правильної ідентифікації. У зв'язку з тим, що квантилі (квартилі, децилі, процентілі) варіаційних рядів абсолютних значень дискретних відліків поточних спектрів Хартлі по сегментах як порядкові статистики вибіркового розподілу імовірностей абсолютних значень дискретних відліків поточних спектрів Хартлі для кожної частоти дискретного спектру мовного сигналу розподіляються по нормальному закону незалежно від негаусовського характеру багатовимірних функцій розподілу вибіркових значень спектру мовного сигналу, істотно підвищується ефективність критерію узгодженості Колмогорова, орієнтованого на статистичну ідентифікацію нормально розподілених випадкових величин, що використовується, що, зрештою, підвищує вірогідність правильної ідентифікації мовного сигналу. Разом з тим мета способу-прототипу спектральна ідентифікація мовного сигналу - в об'єкті, що заявляється, реалізуєтеся більш ефективно внаслідок того, що обчислювальні (часові) витрати на отримання речовинної спектральної щільності Хартлі мовного сигналу на сегменті менше ніж витрати на отримання комплексної спектральної щільності Фур'є. Крім того, отримання абсолютних значень дискретних відліків поточних спектрів Хартлі реалізується шляхом простого відкидання знакового біта цифрового дискретного відліку спектру, тоді як отримання модулів комплексних амплітуд спектральних компонент Фур'є вимагає реалізації нелінійної операції вилучення квадратного кореня з суми квадратів реальної і уявної частин відліку спектральної густини Фур'є [3]. У свою чергу, спектральна щільність Хартлі мовного сигналу, на відміну від спектральної щільності потужності або амплітудного спектру Фур'є, несиметрична щодо нульової частоти поточного спектру мовного сигналу, оскільки у часовій області реалізації мовних сигналів не є парними функціями. Ця обставина дозволяє використовува ти для підвищення якості ідентифікації мовного сигналу додаткову 8 інформаційну ознаку - ступінь несиметричності реалізації мовного сигналу на сегменті аналізу [3]. Комплексне використання перерахованих відмітних особливостей і пов'язаних з ними позитивних ефектів дозволяють забезпечити підвищення ефективності спектральної ідентифікації мовного сигналу шляхом порівняння залежності від спектральної частоти мовного сигналу квантилів (квартилів, децилів, процентілів) варіаційних рядів по всіх сегментах аналізу абсолютних значень поточних речовинних спектрів Хартлі мовного сигналу на сегментах з відповідними залежностями квантилів (квартилів, децилів, процентілів) абсолютних значень речовинних спектрів Хартлі еталонних (зразкових, типових) мовних реалізацій бази даних на основі відомих критеріїв узгодженості. джерела інформації: 1. Сапожков М.А. Речевой сигнал в кибернетике и связи (Преобразование речи применительно к задачам техники связи и кибернетики). - М: Гос. изд-во л-ры по вопр. связи и радио, 1963.-С.368-377. 2. Шелухин О.И. Лукьянцев Н.Ф. Цифровая обработка и передача речи. / Под ред. О.И.Шелухина.- М.: Радио и связь, 2000.- 456 :ил. С.98-106. 3. Денисенко А.Н. Сигналы. Теоретическая радиотехника. Справочное пособие. - М.: Горячая линия - Телеком, 2005,- 704с: ил. - С.99-105. 9 80587 10

Дивитися

Додаткова інформація

Назва патенту англійською

Method of spectral identification of a voice signal

Автори англійською

Kuznetsov Maksym Volodymyrovych, Seletkov Viktor Leonidovych

Назва патенту російською

Способ спектральной идентификации речевого сигнала

Автори російською

Кузнецов Максим Владимирович, Селетков Виктор Леонидович

МПК / Мітки

МПК: G10L 17/00, G10L 15/00

Мітки: мовного, сигналу, спектральної, ідентифікації, спосіб

Код посилання

<a href="https://ua.patents.su/5-80587-sposib-spektralno-identifikaci-movnogo-signalu.html" target="_blank" rel="follow" title="База патентів України">Спосіб спектральної ідентифікації мовного сигналу</a>

Подібні патенти

Спосіб спектральної ідентифікації гідроакустичного сигналу

Номер патенту: 79564

Опубліковано: 25.06.2007

Автори: Кузнецов Максим Володимирович, Селетков Віктор Леонідович

МПК: G01S 7/523

Мітки: ідентифікації, сигналу, спосіб, спектральної, гідроакустичного

Формула / Реферат:

Спосіб спектральної ідентифікації гідроакустичного сигналу в заданій послідовності взаємозв'язаних операцій перетворення гідроакустичного сигналу, що включає проведення низькочастотної фільтрації гідроакустичного сигналу в смузі частот 5-20 кГц, розділення гідроакустичного сигналу на сегменти аналізу однакової тривалості 10-50 мс, проведення стандартного 12-16-бітового аналого-цифрового перетворення сигналу з частотою дискретизації 10-40 кГц...

Спосіб стиснення мовного сигналу шляхом кодування зі змінною швидкістю, схема та пристрій для стиснення акустичного сигналу

Номер патенту: 43311

Опубліковано: 17.12.2001

Автори: Уільям Р. Гарднер, Чонг Ю. Лі, Клайн С. Гілхаузен, Мінг-Чанг Цай, Пол Є. Джейкобс, Кетрін С. Лем

МПК: G10L 19/00, G10L 21/00

Мітки: акустичного, стиснення, кодування, сигналу, шляхом, схема, пристрій, змінною, швидкістю, спосіб, мовного

Формула / Реферат:

1. Способ сжатия речевого сигнала путем кодирования с переменной скоростью кадров оцифрованных выборок речевого сигнала, отличающийся тем, что включает операции определения уровня сигнала речевой активности для кадра оцифрованных выборок речевого сигнала, выбора для указанного кадра скорости кодирования из группы скоростей в зависимости от указанного определенного уровня сигнала речевой активности, кодирования указанного кадра в соответствии...

Спосіб обробки мовного сигналу та пристрій для його реалізації

Номер патенту: 23830

Опубліковано: 16.06.1998

Автори: Прошутя Андрій Григорович, Приходько Володимир Мусійович

МПК: G10L 21/00

Мітки: пристрій, сигналу, реалізації, мовного, обробки, спосіб

Формула / Реферат:

1. Способ обработки речевого сигнала, включающий формирование сегментов речевого сигнала, функциональное преобразование сегментов, вычисление спектральных коэффициентов сегмента в различных системах базисных функций, определение минимальной величины среднеквадратичной погрешности его аппроксимации и синтез речевого сигнала с учетом вычисленных оптимальных спектральных коэффициентов сегмента, отличающийся тем, что входной речевой сигнал...

Спосіб ідентифікації особи за параметрами усного мовлення

Номер патенту: 26107

Опубліковано: 30.04.1999

Автори: Жаріков Юрій Федорович, Новосельський Олександр Феліксович, Орлов Юрій Юрійович

МПК: G10L 13/00, G10L 11/00

Мітки: мовлення, особи, усного, ідентифікації, спосіб, параметрами

Формула / Реферат:

1. Спосіб ідентифікації особи за параметрами усного мовлення, заснований на порівнянні вилученого з мовного сигналу комплексу параметрів, який відрізняється тим, що при порівнянні векторів параметрів, вилучених з мовного сигналу, використовують евклідову відстань із зваженням параметрів за допомогою F-відношення.2. Спосіб за п.1, який відрізняється тим, що з мовного сигналу вилучають і застосовують як ідентифікаційну ознаку усереднені...

Спосіб перетворення природно-мовного представлення інформації до машинного коду

Номер патенту: 24586

Опубліковано: 10.07.2007

Автор: Дмитренко Олександра Юріївна

МПК: G06F 17/28

Мітки: природно-мовного, машинного, спосіб, представлення, інформації, коду, перетворення

Формула / Реферат:

Спосіб перетворення природно-мовного представлення інформації до машинного коду, що включає введення текстової інформації природною мовою з подальшим виконанням синтаксичного та семантичного аналізу і перетворенням вихідної команди до машинного коду, який відрізняється тим, що текстовий фрагмент інформації послідовно аналізують за синтаксичними та семантичними правилами з подальшим розбиттям його на частини, кількість і розмір яких визначають...

Попередній патент: Пристрій для введення піни та спосіб заповнення порожнин

Наступний патент: Сальникове ущільнення

Випадковий патент: С-модуль синергетичного очищення води elion-u-synergy.163-c

В верх сторінки

Спосіб спектральної ідентифікації мовного сигналу

Формула / Реферат

Текст

Додаткова інформація

МПК / Мітки

Код посилання

Про сайт

Архіви

Контакти