Пристрій для описування та розпізнавання мовленнєвих сигналів
Номер патенту: 50037
Опубліковано: 25.05.2010
Формула / Реферат
Пристрій для описування та розпізнавання мовленнєвих сигналів, що містить спектральний аналізатор, блоки пам'яті еталонних мовленнєвих образів та мовленнєвого сигналу, що розпізнається, обчислювач елементарних мір схожостей та контролер, перший та другий входи якого під'єднані до перших виходів блоків пам'яті розпізнаваного та еталонного мовленнєвих образів, відповідно другі виходи яких під'єднані до першого та другого входів обчислювача елементарних мір схожостей, а адресні входи блоків пам'яті розпізнаваного та еталонного мовленнєвих образів під'єднані до першого та другого виходів контролера відповідно, який відрізняється тим, що в нього введені: аналізатор форми поточного амплітудного спектра, перший, другий та третій блоки пам'яті інтегральної міри схожості, обчислювач інтегральної міри схожості та регістр, інформаційний вхід якого під'єднаний до виходу обчислювача елементарної міри схожості та до першого інформаційного входу обчислювача інтегральної міри схожості, а керуючий вхід - до третього виходу контролера, першого керуючого входу обчислювача інтегральної міри схожості, входів запису першого, другого та третього блоків пам'яті інтегральної міри схожості, при цьому інформаційний вихід регістра під'єднаний до другого інформаційного входу обчислювача інтегральної міри схожості, вихід котрого є виходом пристрою, а другий та третій керуючі входи під'єднані до першого виходу блоку пам'яті еталонного мовленнєвого образу та четвертого виходу контролера відповідно, третій вхід якого є входом пристрою, а другий вихід під'єднаний до адресних входів першого та другого блоків пам'яті інтегральної міри схожості, інформаційні виходи яких під'єднані до третього та четвертого інформаційних входів обчислювача інтегральної міри схожості відповідно, перший та другий інформаційні виходи якого під'єднані до інформаційних входів першого та другого блоків пам'яті інтегральної міри схожості відповідно.
Текст
Пристрій для описування та розпізнавання мовленнєвих сигналів, що містить спектральний аналізатор, блоки пам'яті еталонних мовленнєвих образів та мовленнєвого сигналу, що розпізнається, обчислювач елементарних мір схожостей та контролер, перший та другий входи якого під'єднані до перших виходів блоків пам'яті розпізнаваного та еталонного мовленнєвих образів, відповідно другі виходи яких під'єднані до першого та другого входів обчислювача елементарних мір схожостей, а адресні входи блоків пам'яті розпізнаваного та еталонного мовленнєвих образів під'єднані до першого та другого виходів контролера відповідно, який відрізняється тим, що в нього введені: аналізатор форми поточного амплітудного спектра, перший, другий та третій блоки U 2 (19) 1 3 50037 лонного мовленнєвих образів, відповідно другі виходи яких під'єднані до першого та другого входів обчислювача елементарних мір схожостей, а адресні входи блоків пам'яті розпізнаваного та еталонного мовленнєвих образів під'єднані до першого та другого виходів контролера відповідно, при цьому він містить аналізатор форми поточного амплітудного спектру, перший, другий та третій блоки пам'яті інтегральної міри схожості, обчислювач інтегральної міри схожості та регістр, інформаційний вхід якого під'єднаний до виходу обчислювача елементарної міри схожості та до першого інформаційного входу обчислювача інтегральної міри схожості, а керуючий вхід - до третього виходу контролера, першого керуючого входу обчислювача інтегральної міри схожості, входів запису першого, другого та третього блоків пам'яті інтегральної міри схожості, при цьому інформаційний вихід регістра під'єднаний до другого інформаційного входу обчислювача інтегральної міри схожості, вихід котрого є виходом пристрою, а другий та третій керуючі входи під'єднані до першого виходу блоку пам'яті еталонного мовленнєвого образа та четвертого виходу контролера відповідно, третій вхід якого є входом пристрою, а другий вихід під'єднаний до адресних входів першого та другого блоків пам'яті інтегральної міри схожості, інформаційні виходи яких під'єднані до третього та четвертого інформаційних входів обчислювача інтегральної міри схожості відповідно, перший та другий інформаційні виходи якого під'єднані до інформаційних входів першого та другого блоків пам'яті інтегральної міри схожості відповідно. На фіг. 1 представлена структурна схема пристрою, на фіг. 2-4 - схеми окремих блоків; фіг. 5 пояснює принцип роботи пристрою. Пристрій містить блок 1 пам'яті мовленнєвого образу, що поданий для аналізу та розпізнавання, блок 2 пам'яті еталонного образа, обчислювач 3 елементарної міри схожості, регістр 4, обчислювач 5 інтегральної міри схожості, блоки 6,7 та 7а пам'яті, контролер 8, аналізатор 9-10 мовленнєвого сигналу. В аналізаторі 9 мовленнєвий сигнал, що подається з мікрофона, піддається поточному спектральному аналізові в n спектральних каналах. Отже, кожний поточний спектральний елемент уi, що спостерігається в дискретному рівномірному часі i T з кроком T , наприклад T = 10 мс, є елементом-вектором: уi = (yi1, уi2, yim,…, yin). В аналізаторі 10 форми спектру кожен спостережуваний елемент уi описується векторомматрицею хi з двійковими компонентами x iu 1 якщо ((y iu y i ) 0) & ( y iu , 0 в інших випадках , u) u; u, 1 : n. Двійковий опис-елемент х містить 1 m n(n 1) 2 компонент та несе інформацію про форму спектру, визначає відносні амплітуди спектральних компонентів та не залежить від гучності промовляння. u , u 1 : n вибираються Як правило, пороги так, щоб в стаціонарних умовах, коли на вхід мік 4 рофона надходять лише акустичні завади приміщення, формувались тільки нульові елементикоди. У випадку, коли = u -1, двійковий код х має n1 компонент, він стає дискретним аналогом знаку похідної спектру за частотою. В блоці пам'яті 1 розпізнаваного мовленнєвого образу зберігається послідовність поточних бінарних елементів-векторів: Х0l = (х1, х2,..., хi,..., хl), де l - довжина мовленнєвого образу. В блоці 2 пам'яті еталонного образу зберігається еталонний образ слова, представлений аналогічною послідовністю бінарних еталонних елементів-кодів: Е0q = (е1, е2,..., еs,...,еq), причому вона відповідає самому швидкому та все ще чіткому промовлянню слова; q - довжина початкового еталона слова. При автоматичному порівнянні та розпізнаванні початковий еталон Е0q слова піддається нелінійним перетворенням в часі шляхом повторення кожного еталонного елемента початкового еталона нуль (нема повторення), один або два рази, причому так, щоб зберігався порядок слідування еталонних елементів, визначений початковим еталоном, й так, щоб в результаті у перетвореному еталоні слова було всього l еталонних елементів. Перетворені еталонні послідовності довжини l порівнюються з мовленнєвим сигналом Х0l, що розпізнається, та обчислюються інтегральні міри G схожості сигналу Х0l на перетворені еталонні образи слова як суми відповідних значень елементарних мір схожості g(x,e): l G( X 0l,E 0l g( x i , e s(i) ), i 1 де функція s(i): s(1) = 1,s(l) = q, - встановлює відповідність номерів еталонних та спостережуваних елементів. Найбільше значення інтегральної міри схожості, що досягається на множині {s(i):s(1)=1, s(l)=q} допустимих відповідностей визначає схожість мовленнєвого образу Х0l, що розпізнається, на еталонний мовленнєвий образ Е0q. Елементи хi зберігаються в блоці пам'яті 1 за адресами 0...(l -1), що задаються сигналом з першого виходу контролера 8. Адресі О відповідає елемент x1, адресі (l-1) - елемент хi. За адресою l зберігається ознака (l+1) - "Кінець образу, що розпізнається", формально відповідний елементові хl+1. Ця ознака зчитується з першого виходу блоку 1 та подається на перший вхід контролера 8. Елементи еs зберігаються в блоці пам'яті 2 за адресами 0...(q-1), що задаються сигналом з другого виходу контролера 8. Адресі 0 відповідає елемент eі, адресі (q-1) - елемент еq. За адресою q зберігається ознака (q+1)- "Кінець еталонного образу". Ця ознака організована аналогічно ознаці (l+1), вона зчитується з першого виходу блоку 2 й подається на другий та третій входи контролера 8 та через другий та третій входи обчислювача 5 інтегральної міри схожості - на входи установок регістрів 12, 12а і 13. За адресами 0...q зберігаються також проміжні значення інтегральної міри схожості в блоках пам'яті 6, ба та 7. 5 За адресою 0 в блоках пам'яті 6, 6а та 7 записуються відповідно початкові значення G(0,1)=0, G(0,2)=0 та G(0,3)=0, а за адресами 1,2,..., s,...(q-1) цих же блоків запишемо відповідно початкові значення G(s,l) = G(s,2) = G(s,3) = -М, де М - велике ціле додатне число. Перед початком порівняння та розпізнавання всі регістри, а також лічильник 21 обнуляються. В регістр 11 записується число -М. Імпульсом "Старт" запускається генератор 20 контролера 8. Лічильник 21 контролера 8 формує адреси блоку пам'яті 1 та блоку пам'яті 2. Ці адреси надалі будуть позначатись як і та s відповідно. Окрім того, адреса s використовується в трьох блоках пам'яті 6, 6а та 7. В регістр 11 записується число - М. За адресою і=0 на виході блоку пам'яті 1 з'являється елемент xі у вигляді m-розрядного двійкового коду. який подається на перший вхід обчислювача елементарної міри схожості 3. Одночасно за адресою s=0 на виході блоку пам'яті 2 з'являється еталонний елемент еi, також у вигляді mрозрядного двійкового коду, який подається на другий вхід обчислювача елементарної міри схожості 3. Останній обчислює значення елементарної міри схожості g(x1,e1) - хемінгову відстань між кодами x1 та е1. За адресою s = 0 одночасно з блоків пам'яті 6, 6а та 7 зчитуються значення інтегральної міри схожості G(0,1), G(0,2) і G(0,3) та записуються у регістри 12, 12а та 13, відповідно. Затим зміст регістра 11 переписується в блок пам'яті 7 як G(0,1). Змісти регістрів 12, 12а та 13 порівнюються в компараторі 15, і менше з-посеред них через мультиплексор 16 подається на перший вхід суматора 17, на другий вхід якого надходить g(x1, e1) з обчислювача 3. Значення G(0,1) з виходу регістра 12 надходить також на перший вхід суматора 18, на другий вхід якого передається зміст регістра 4. Рівно ж значення G(0,2) з виходу регістра 12а надходить також на перший вхід суматора 18а, на другий вхід якого передається зміст регістра 4а. 50037 6 Обчислені значення G(1,1) з виходу суматора 17, G(0,2) з виходу суматора 18 та G(0,3) з виходу суматора 18а записуються відповідно в регістр 11 та блоки пам'яті 6 і 6а. Далі для тієї ж самої адреси і = 0 описаний процес повторюється для j=1. При цьому на виході блоку пам'яті 1 зберігається елемент х1, а на виході блоку пам'яті 2 - з'являється еталонний елемент e2. Обчислювач 3 елементарної міри схожості визначає значення g(x1,e2) та зберігає його у регістрах 4 та 4а. З блоків пам'яті 6, 6а та 7 зчитуються значення інтегральної міри схожості G(1,1), G(1,2) і G(1,3) та записуються у регістри 12, 12а та 13 обчислювача 5, відповідно. Затим зміст регістра 11 переписується в блок пам'яті 7 як G(1,1). Найменше із значень з виходів регістрів 12, 12а та 13, що визначається компаратором 15, через мультиплексор 16 подається на перший вхід суматора 17, на другий вхід якого надходить g(x1,e2} з виходу обчислювача 3. Значення G(1,1) з виходу регістра 12 надходить також на перший вхід суматора 18, на другий вхід якого передається зміст регістра 4. Рівно ж значення G(1,2) з виходу регістра 12а надходить також на перший вхід суматора 18а, на другий вхід якого передається зміст регістра 4а. Обчислені значення G(2,1) з виходу суматора 17, G(1,2) з виходу суматора 18 та G(1,3) з виходу суматора 18а записуються відповідно в регістр 11 та блоки пам'яті 6 і 6а. Процес повторюється для s=2,3,...,(q-1). При s=q виробляється ознака s=(q+1), яка блокує встановлювальні входи старших розрядів регістра 12. Далі обчислення повторюються для i=1 та всіх s=0,1,2,3,...,(q-1). Знову починаємо з того, що в регістр 11 записується число -М. Далі процеси повторюються для всіх i = 2,3,4,..., (l-1) та всіх s = 0,1,2,3,...,(q - 1). При досягненні і = 1 та s = q виробляється ознака (7 +1), яка зупиняє генератор 20. Результат порівняння знаходиться в регістрі 11 та блоці пам'яті 6 ЯК G(q,1). 7 Комп’ютерна верстка І.Скворцова 50037 8 Підписне Тираж 26 прим. Міністерство освіти і науки України Державний департамент інтелектуальної власності, вул. Урицького, 45, м. Київ, МСП, 03680, Україна ДП “Український інститут промислової власності”, вул. Глазунова, 1, м. Київ – 42, 01601
ДивитисяДодаткова інформація
Назва патенту англійськоюDevice for description and speech signal voice recognition
Автори англійськоюVintsiuk Taras Klymovych, Hrytsenko Volodymyr Illich
Назва патенту російськоюУстройство для описания и распознавания речевых сигналов
Автори російськоюВинцюк Тарас Климович, Гриценко Владимир Ильич
МПК / Мітки
МПК: G10L 15/00
Мітки: розпізнавання, описування, мовленнєвих, пристрій, сигналів
Код посилання
<a href="https://ua.patents.su/4-50037-pristrijj-dlya-opisuvannya-ta-rozpiznavannya-movlennehvikh-signaliv.html" target="_blank" rel="follow" title="База патентів України">Пристрій для описування та розпізнавання мовленнєвих сигналів</a>
Попередній патент: Спосіб описування та розпізнавання мовленнєвих сигналів
Наступний патент: Спосіб пофонемного розпізнавання усних команд та усталених словосполучень
Випадковий патент: Спосіб виготовлення пластини пластинчасто-трубного теплообмінника