Аналізатор мовлення
Номер патенту: 7728
Опубліковано: 15.07.2005
Автори: Краковський Володимир Якович, Мартинова Оксана Петрівна, Жуков Ігор Анатолійович
Формула / Реферат
Аналізатор мовлення, який містить мікрофон з мікрофонним підсилювачем, вихід якого підключений до входу першого фільтра низької частоти, аналого-цифровий перетворювач, вхід керування якого підключений до першого виходу генератора тактових імпульсів, блок пам'яті кодів фонем, підключений до першого входу блока розпізнавання кодів фонем, вихід якого підключений до вихідного інтерфейсу, який відрізняється тим, що в нього введені дискретно-аналогова лінія затримки, другий фільтр низької частоти, цифровий аналізатор миттєвого спектра, пристрій визначення квазістаціонарних ділянок, аналоговий запам'ятовуючий пристрій, пристрій визначення миттєвого періоду основного тону, подільник частоти слідування імпульсів, причому дискретно-аналогова лінія затримки, другий фільтр низької частоти, цифровий аналізатор миттєвого спектра та пристрій визначення квазістаціонарних ділянок послідовно з'єднані, вихід мікрофонного підсилювача підключений до інформаційного входу дискретно-аналогової лінії затримки, вихід пристрою визначення квазістаціонарних ділянок підключений до другого входу блока розпізнавання кодів фонем, вихід першого фільтра низької частоти підключений до інформаційного входу аналогового запам'ятовуючого пристрою, вихід якого підключений до інформаційного входу аналого-цифрового перетворювача, вихід якого підключений до інформаційного входу пристрою визначення миттєвого періоду основного тону, вихід якого підключений до керуючого входу подільника частоти слідування імпульсів, вихід якого підключений до керуючих входів цифрового аналізатора миттєвого спектра та пристрою визначення квазістаціонарних ділянок, перший вихід генератора тактових імпульсів підключений до керуючих входів аналогового запам'ятовуючого пристрою та пристрою визначення миттєвого періоду основного тону, другий вихід генератора тактових імпульсів підключений до керуючого входу дискретно-аналогової лінії затримки, третій вихід генератора тактових імпульсів підключений до інформаційного входу подільника частоти слідування імпульсів.
Текст
Аналізатор мовлення, який містить мікрофон з мікрофонним підсилювачем, вихід якого підключений до входу першого фільтра низької частоти, аналого-цифровий перетворювач, вхід керування якого підключений до першого виходу генератора тактових імпульсів, блок пам'яті кодів фонем, підключений до першого входу блока розпізнавання кодів фонем, вихід якого підключений до вихідного інтерфейсу, який відрізняється тим, що в нього введені дискретно-аналогова ЛІНІЯ затримки, другий фільтр низької частоти, цифровий аналізатор миттєвого спектра, пристрій визначення квазістацюнарних ділянок, аналоговий запам ятовуючий пристрій, пристрій визначення миттєвого періоду основного тону, подільник частоти слідування імпульсів, причому дискретно-аналогова ЛІНІЯ затримки, другий фільтр низької частоти, цифровий аналізатор миттєвого спектра та пристрій визначення квазістацюнарних ділянок послідовно з'єд нані, вихід мікрофонного підсилювача підключений до інформаційного входу дискретно-аналогової лінії затримки, вихід пристрою визначення квазістацюнарних ділянок підключений до другого входу блока розпізнавання кодів фонем, вихід першого фільтра низької частоти підключений до інформаційного входу аналогового запам'ятовуючого пристрою, вихід якого підключений до інформаційного входу аналого-цифрового перетворювача, вихід якого підключений до інформаційного входу пристрою визначення миттєвого періоду основного тону, вихід якого підключений до керуючого входу подільника частоти слідування імпульсів, вихід якого підключений до керуючих входів цифрового аналізатора миттєвого спектра та пристрою визначення квазістацюнарних ділянок, перший вихід генератора тактових імпульсів підключений до керуючих входів аналогового запам'ятовуючого пристрою та пристрою визначення миттєвого періоду основного тону, другий вихід генератора тактових імпульсів підключений до керуючого входу дискретно-аналогової ЛІНІ і затримки, третій вихід генератора тактових імпульсів підключений до інформаційного входу подільника частоти слідування імпульсів 00 CM Корисна модель належить до галузі інформатики і може бути використана в інформаційних засобах різного призначення, зокрема, у пристроях розпізнавання мовлення В [1, с ЗО] функції аналізатора мовлення означені як пристрій, котрий зовсім не звертається до розуміння мовного повідомлення, але здатен перетворювати акустичний мовний потік в систему знаків, адекватно сполучену з фонетичною системою даного мовлення На базі такого аналізатора мовлення можна буде порівняльне просто створювати різні пристрої розпізнавання мовлення як дискретного, так і злитого, котрі не потребують настроювання на конкретного диктора ВІДОМІ аналізатори мовлення [2], які використовуються у пристроях розпізнавання мовлення і містять мікрофон з мікрофонним підсилювачем, аналого-цифровий перетворювач (АЦП), блок пам'яті кодів фонем, блок розпізнавання кодів фонем та вихідний інтерфейс Аналіз мовлення такими аналізаторами не узгоджується з періодами основного тону мовного сигналу, що призводить до зниження точності розпізнавання З відомих аналізаторів мовлення найбільш близьким за технічною суттю корисної моделі є аналізатор [3], який має мікрофон з мікрофонним підсилювачем, вихід якого підключений до входу фільтра низької частоти, АЦП, вхід керування яко о> 7728 го підключений до виходу генератора тактових імпульсів, блок пам'яті кодів фонем, підключений до блоку розпізнавання кодів фонем, вихід якого підключений до вихідного інтерфейсу. Недоліком прототипу є те, що аналіз мовлення не узгоджується з періодами основного тону мовного сигналу, що призводить до зниження точності розпізнавання. Крім того, спектральний аналіз відліків мовного сигналу виконується процесором швидкого перетворення Фур'є (ШПФ), реалізуючи так зване „стрибаюче ШПФ" з величиною стрибка рівної чверті вікна аналізу (приблизно 5мс), що не дозволяє локалізувати межі фонем у часі з більш високою точністю. Наявність вказаних недоліків знижує точність розпізнавання фонем. Задачею корисної моделі є підвищення точності розпізнавання фонем. Поставлена задача вирішується тим, що в аналізатор мовлення, який містить мікрофон з мікрофонним підсилювачем, вихід якого підключений до входу першого фільтра низької частоти, АЦП, вхід керування якого підключений до першого виходу генератора тактових імпульсів, блок пам'яті кодів фонем, підключений до першого входу блока розпізнавання кодів фонем, вихід якого підключений до вихідного інтерфейсу, згідно з корисною моделлю, уведені дискретно-аналогова лінія затримки, другий фільтр низької частоти, цифровий аналізатор миттєвого спектру, пристрій визначення квазістаціонарних ділянок, аналоговий запам'ятовуючий пристрій, пристрій визначення миттєвого періоду основного тону, дільник частоти слідування імпульсів, причому, дискретно-аналогова лінія затримки, другий фільтр низької частоти, цифровий аналізатор миттєвого спектру та пристрій визначення квазістаціонарних ділянок послідовно з'єднані, вихід мікрофонного підсилювача підключений до інформаційного входу дискретноаналогової лінії затримки, вихід пристрою визначення квазістаціонарних ділянок підключений до другого входу блока розпізнавання кодів фонем, вихід першого фільтра низької частоти підключений до інформаційного входу аналогового запам'ятовуючого пристрою, вихід якого підключений до інформаційного входу АЦП, вихід якого підключений до інформаційного входу пристрою визначення миттєвого періоду основного тону, вихід якого підключений до керуючого входу дільника частоти слідування імпульсів, вихід якого підключений до керуючих входів цифрового аналізатора миттєвого спектру та пристрою визначення квазістаціонарних ділянок, перший вихід генератора тактових імпульсів підключений до керуючих входів аналогового запам'ятовуючого пристрою та пристрою визначення миттєвого періоду основного тону, другий вихід генератора тактових імпульсів підключений до керуючого входу дискретно-аналогової лінії затримки, третій вихід генератора тактових імпульсів підключений до інформаційного входу дільника частоти слідування імпульсів. Введення в пристрій дискретно-аналогової лінії затримки, другого фільтра низької частоти, цифрового аналізатора миттєвого спектру, пристрою визначення квазістаціонарних ділянок, аналогового запам'ятовуючого пристрою, пристрою визна чення миттєвого періоду основного тону, та дільника частоти слідування імпульсів вигідно відрізняє запропонований аналізатор мовлення від прототипу, оскільки дозволяє узгоджувати аналіз мовлення з періодами основного тону мовного сигналу, а також взамін стрибаючого ШПФ виконувати ковзний аналіз спектру. В результаті зменшується похибка розпізнавання фонем. На фіг. 1 зображена блок-схема аналізатора мовлення. Аналізатор мовлення (Фіг. 1) містить мікрофон 1, мікрофонний підсилювач 2, перший фільтр З низької частоти, дискретно-аналогову лінію 4 затримки, другий фільтр 5 низької частоти, цифровий аналізатор 6 миттєвого спектру, пристрій 7 визначення квазістаціонарних ділянок, аналоговий запам'ятовуючий пристрій (АЗП) 8, АЦП 9, пристрій 10 визначення миттєвого періоду основного тону, генератор 11 тактових імпульсів, дільник 12 частоти слідування імпульсів, блок 13 розпізнавання кодів фонем, блок 14 пам'яті кодів фонем, вихідний інтерфейс 15. Вихід інтерфейсу є виходом пристрою. Аналізатор мовлення працює таким чином. Вхідний сигнал мовлення, наприклад з мікрофона 1, через мікрофонний підсилювач 2 подається на вхід дискретно-аналогової лінії 4 затримки і одночасно через фільтр 3 низької частоти - на вхід АЗП 8. Призначення фільтру 3 - забезпечити проходження на вхід пристрою 10 визначення миттєвого періоду основного тону той частини спектру мовного сигналу, яка містить коливання основного тону, тобто, смуга проходження тракту 1-2-3 повинна бути 70-450Гц [4]. На керуючий вхід АЗП 8 з першого виходу генератора 11 тактових імпульсів подається серія стробувальних імпульсів 0 1 , період слідування яких повинен дорівнювати допустимої похибки визначення періоду основного тону мовного сигналу. Зафіксовані на виході АЗП 8 аналогові значення відліків мовного сигналу подаються на інформаційний вхід АЦП 9, на керуючий вхід якого подається та сама серія стробувальних імпульсів 0 1 , що і на керуючий вхід АЗП 8. АЦП 9 перетворює аналогові значення відліків мовного сигналу в цифрові і подає їх на вхід пристрою 10 визначення миттєвого періоду основного тону, на керуючий вхід якого подається та сама серія стробувальних імпульсів 0 1 . Цифрові значення миттєвого періоду основного тону використовуються для оперативного перенастроєння дільника 12 частоти слідування імпульсів 0 3 з третього виходу генератора 11 тактових імпульсів на керуючі входи цифрового аналізатора 6 миттєвого спектру та пристрою 7 визначення квазістаціонарних ділянок. На керуючий вхід дискретно-аналогової лінії 4 затримки з другого виходу генератора 11 тактових імпульсів подається серія стробувальних імпульсів 0 2 с частотою дискретизації не менш ніж 12,5кГц. Попередні експерименти показали, що при меншій частоті дискретизації суттєво спотворюється високочастотна частина спектру мовних сигналів, наприклад, після дискретизації звукосполучення "ЦЕ" с частотою дискретизації, рівної 8кГц, це звукосполучення звучить як "ФЕ". Лінія 4 затримки при 7728 значена для затримки мовного сигналу на час визначення миттєвого періоду основного тону в пристрої 10. Вихід з лінії 4 затримки через другий фільтр 5 низької частоти, необхідний для згладжування дискретно-аналогового сигналу, подається на вхід цифрового аналізатора 6 миттєвого спектру. На керуючий вхід аналізатора 6 з виходу дільника 12 частоти слідування імпульсів поступають тактові імпульси, період слідування котрих визначається миттєвим періодом основного тону тої частини мовного сигналу, котра подається в цей час на інформаційний вхід аналізатора 6. По суті справи аналізатор 6 аналізує аналоговий сигнал, нормалізований по періоду основного тону. Тим самим вирішуються дві задачі: перша - виключення інтонаційної варіативності мовного сигналу (залежної від емоційного стану людини [5)) і друга - забезпечення можливості ковзного аналізу спектра з інтервалом аналізу, рівним цілому числу періодів основного тону, зокрема, одному періоду. Для цього період слідування імпульсів 0 3 генератора 11 вибирається таким, щоб при мінімально можливім миттєвім періоді основного тону забезпечувалась би можливість для аналізатора 6 визначення однієї спектральної компоненти мовного сигналу. Цифровий аналізатор 6 миттєвого спектру здійснює у ковзному режимі з вікном аналізу, рівним цілому числу періодів основного тону, аналіз спектру нормалізованого мовного сигналу і відліки спектру подає на пристрій 7 визначення квазістаціонарних ділянок, котрий визначає присутність таких ділянок у мовному сигналі, кодує ці ділянки і подає їх коди, в свою чергу, на блок 13 розпізнавання кодів фонем. Другий вхід блоку 13 зв'язаний з виходом блока 14 пам'яті кодів фонем. Блок 13 здійснює пофонемне кодування мовлення і через вихідний інтерфейс 15 по перериванню по мірі готовності коду наступної фонеми передає цей код (один байт) в ЕОМ. Частота переривань не більш ніж 20Гц, зумовлена швидкістю появи наступної фонеми після попередньої. Людина за одну секунду не може вимовити більше 20 звуків. ЕОМ, за допомогою відповідного програмного забезпечення, виконує лінгвістичний аналіз відповідних кортежів кодів фонем, виділяє з них слова та речення, здійснюючи смислову інтерпретацію мовлення людини. Лінгвістичний аналіз передбачає використання відповідної бази знань, котра настроюється на той чи інший словник мовних повідомлень людини у залежності від предметної області застосування. При цьому в базу знань заносяться не тільки основні варіанти мовлення, але і всі можливі, які використовуються наступними операторами, котрим потрібно бути робити з цим пристроєм вводу мовлення, чим компенсується певний аграматизм усного мовлення [1]. Більшість використаних блоків являються типовими блоками обчислювальної техніки і добре відомі спеціалістам. Так, наприклад, АЗП 8 можливо виконати так, як вказано в [6], забезпечив підвищення точності і швидкодії, АЦП 9 можливо виконати так, як вказано в [7] забезпечив також підвищення точності. В якості дільника 12 частоти слідування імпульсів можливо використання пристрою [8], а в якості дискретно-аналогової лінії 4 затримки можливо використання лінії затримки на основі приладів з зарядовим зв'язком [9]. Щодо цифрового аналізатора миттєвого спектру, то в якості його, в залежності від необхідної швидкодії, можливо вибрати один з пристроїв, вказаних у [10]. Джерела інформації: 1. Галунов В.И., Родионов В.Д. Моделирование процессов передачи информации в звуковом диапазоне/АН СССР. - Л . : Внешторгиздат, 1988. 160 с. 2. Патент США №4624010, МПК4 G10L5/00, 1986 3. Патентная заявка Великобританії №2118343А, МПК3 G10L1/00, 1983 4. Михайлов В.Г., Златоустова Л.В. Измерение параметров речи / Под ред. М. А. Сапожкова. - М.: Радио и связь, 1987. - 168 с. 5. Королева И.В., Нушикян Э.А., Ягунова Н.Н. Эмоции и автоматическое распознавание и синтез речи: проблемы и перспективы // Тез. докл. Всесоюзн. сем. АРСО-15. - Таллинн, Ин-т кибернетики АН ЭССР, 1989.-С. 62-65. 6. А. с. 1185398 А СССР, МКИ G11C27/00. Аналоговое запоминающее устройство / В. Я. Краковский. - Опубл. 15.10.1985, Бюл. N38. 7. А. с. 1401608 А2 СССР, МКИ Н03М1/38. Аналого-цифровой преобразователь / В. И. Чайковский, В. Я. Краковский, В. Ф. Коваль. - Опубл. 7.06.1988, Бюл. N 2 1 . 8. А. с. 1525911 А2 СССР, МКИ Н03К23/66, 23/40. Делитель частоты следования импульсов / Е. С. Папушин, В. Я. Краковский. -Опубл. 30.11.1989, Бюл. N44. 9. Ерофеев А.А., Ковалев B.C., Ульянов И.С. Сигнальные процессоры. - М.: Знание, 1991. - 64 с. - (Новое в жизни, науке, технике. Сер. "Радиоэлектроника и связь"; N 9). 10. Краковский В.Я. Обобщенное представление и реализация алгоритмов повышения быстродействия цифровых анализаторов мгновенного спектра. // Кибернетика и системный анализ, 1996, N4, с. 155-161. 7728 Ц ДАЛЗН ФНЧ2 БЖФ 114 Фіг. 1 Комп'ютерна верстка А. Крижанівський Підписне Тираж 28 прим. Міністерство освіти і науки України Державний департамент інтелектуальної власності, вул. Урицького, 45, м. Київ, МСП, 03680, Україна ДП "Український інститут промислової власності", вул. Глазунова, 1, м. Київ - 4 2 , 01601
ДивитисяДодаткова інформація
Назва патенту англійськоюSpeech analyzer
Автори англійськоюZhukov Ihor Anatoliiovych, Martynova Oksana Petrivna
Назва патенту російськоюАнализатор речи
Автори російськоюЖуков Игорь Анатольевич, Мартынова Оксана Петровна
МПК / Мітки
МПК: G10L 11/00
Мітки: мовлення, аналізатор
Код посилання
<a href="https://ua.patents.su/4-7728-analizator-movlennya.html" target="_blank" rel="follow" title="База патентів України">Аналізатор мовлення</a>
Попередній патент: Обчислювальний пристрій
Наступний патент: Спосіб функціонування електронної інформаційної системи укладання контрактів
Випадковий патент: Спосіб визначення втрат нагрівного газового середовища у гарячому рекуператорі