Голосовий електронний довідник

Формула / Реферат | Подібні патенти | МПК / Мітки | Додаткова інформація | Код посилання

Номер патенту: 48220

Опубліковано: 10.03.2010

Автори: Тертичний Григорій Миколайович, Вінцюк Тарас Климович, Стасевич Петро Анатолійович, Гриценко Володимир Ілліч, Павлов Олег Ігоревич

Завантажити PDF файл.

Формула / Реферат

Голосовий електронний довідник, що містить мікрофон, з'єднаний з аналого-цифровим перетворювачем, цифро-аналоговий перетворювач, з'єднаний з динаміком, мікроконтролер, входи якого підключені до кнопки керування пошуком та кнопки керування іншими функціями, до входів і виходів якого також підключена своїми виходами і входами енергонезалежна пам'ять, акумулятор, порт приєднання персонального комп'ютера, який відрізняється тим, що він містить процесор цифрової обробки сигналів для розпізнавання та пошуку мовленнєвого фрагмента, одним із входів підключений до аналого-цифрового перетворювача, другим входом - до мікроконтролера, одним із виходів підключений до цифро-аналогового перетворювача, а другим виходом підключений до одного із входів мікроконтролера.

Текст

Голосовий електронний довідник, що містить мікрофон, з'єднаний з аналого-цифровим перетворювачем, цифро-аналоговий перетворювач, 3 або словосполучення що є у звуковому фрагменті, який шукається, і відтворення автоматично розпочнеться з фрагмента, який містить сказане слово або словосполучення. Спосіб автоматичного пошуку мовленнєвого фрагмента в суцільному масиві звукозапису базується на представленні сказаного ключового слова або словосполучення у вигляді послідовності наборів параметрів обраної моделі мовотворення, кожен з яких розглядається як багатомірний вектор параметрів, здійсненні процедури самосегментації отриманої послідовності векторів параметрів за допомогою процедури динамічного програмування, стискання початкової послідовності векторів параметрів шляхом апроксимації кожного з отриманих сегментів (які містять певну кількість початкових векторів, мінімальне і максимальне значення якої визначається обраним правилом самосегментації) за допомогою одного для всього сегменту апроксимуючого вектору параметрів, порівнянні з використанням процедури динамічного викривлення часу отриманої стиснутої послідовності апроксимуючих векторів параметрів ключового слова або словосполучення з кожним можливим початком подібної часткової послідовності в не стиснутій послідовності векторів параметрів, яка утворюється під час подібного перетворення суцільного масиву звукозапису з метою розпізнавання ключового слова або словосполучення, підрахунку інтегральної міри відстані для кожного з таких порівнянь, перевірки перевищення інтегральною мірою відстані встановленого порогу відмови від розпізнавання і, вразі його не перевищення фіксації інтегральної міри відстані разом з індексом початку такої часткової послідовності векторів параметрів суцільного масиву звукозапису. В залежності від режиму роботи після знаходження часткової послідовності, інтегральна міра відстані для якої від стиснутої послідовності апроксимуючих векторів параметрів ключового слова або словосполучення є нижчою за встановлений поріг відмови від розпізнавання може відбуватися озвучення суцільного масиву запису з відповідного місця, або продовження пошуку решти входжень стиснутої послідовності апроксимуючих векторів параметрів в не стиснутій послідовності векторів параметрів суцільного масиву звукозапису, після чого відбувається озвучення найкращого за інтегральною мірою відстані (тобто з найменшим її значенням) фрагменту фонограми. Якщо після озвучення фрагменту фонограми користувач натискає відповідну кнопку і подає команду продовжити пошук, то в залежності від режиму або відбувається пошук наступного за часом фрагменту в описаний вище спосіб, або озвучується той зі всіх знайдених фрагментів, який має найближчу вищу за значенням інтегральну міру відстані. Після того, як всі фрагменти озвучені, або якщо жодного фрагменту не знайдено користувач отримує відповідне повідомлення. Пошук закінчується за певної кількості спроб, або якщо користувач вирішує переформулювати запит. 48220 4 На фіг. 1 зображено послідовність дій по пошуку звукового фрагменту в суцільних масивах аудіозаписів. Звуковий сигнал ключового слова або словосполучення поступає на так званий аналізатор, в якому сигнал перетворюється на стиснуту послідовність апроксимуючих векторів параметрів. В блоці розпізнавання стиснуту послідовність апроксимуючих векторів параметрів порівнюється зі всіма можливими початками подібної послідовності в не стиснутих послідовностях векторів параметрів суцільних масивів аудіозаписів, які зберігаються разом з самими аудіозаписами в енергонезалежній пам'яті довідника. Створення таких не стиснутих послідовностей векторів параметрів відбувається в аналізаторі під час першого пошуку будь-якого ключового слова або словосполучення. Знайдений в результаті пошуку фрагмент озвучується з відповідного місця аудіозапису і до його кінця, або може бути перерваним, якщо результат пошуку не є задовільним. Користувач може продовжити пошук або продовжити прослуховування наступного знайденого фрагменту. На фіг.2 зображена структурна схема голосового електронного довідника з голосовим пошуком. Довідник складається з наступних частин: 1 - мікрофона; 2 - аналого-цифрового перетворювача; 3 - мікроконтролера; 4 - процесора цифрової обробки сигналів; 5 - енергонезалежної пам'яті; 6 - цифро-аналогового перетворювача; 7 - кнопки керування пошуком; 8 - інших засобів керування та індикації; 9 - динаміка (або головних телефонів); 10 - виходу для з'єднання диктофона з комп'ютером; 11 - акумулятора. Мікрофон 1 приєднують до аналого-цифрового перетворювача 2. Аналого-цифровий перетворювач 2 підключають до процесора цифрової обробки сигналу 4. До процесора цифрової обробки сигналу 4 приєднують мікроконтролер 3 та цифроаналоговий перетворювач 6, який має вихід на динамік або головні телефони 9. Мікроконтролер 3, окрім процесора, з'єднують з клавіатурою 7, засобами індикації 8 та зовнішньою пам'яттю 5. Живлення пристрою виконують від вбудованого акумулятора 11. Зв'язок з комп'ютером виконують через USB порт 10. Звуковий сигнал надходить на вбудований мікрофон, потім поступає на аналого-цифровий перетворювач. Оцифрований звуковий сигнал надходить до процесора цифрової обробки сигналу й, в залежності від поточного режиму, або розпочинається пошук, або звуковий сигнал записується до зовнішньої пам'яті голосового довідника. Результат пошуку озвучуються за допомогою динаміка або надходить до аудіо-виходу головних телефонів. Для активації пошуку користувач має натиснути клавішу керування пошуком, сказати ключове слово або словосполучення та відпустити клавішу. Знайдений фрагмент буде озвучений. 5 Комп’ютерна верстка Д. Шеверун 48220 6 Підписне Тираж 26 прим. Міністерство освіти і науки України Державний департамент інтелектуальної власності, вул. Урицького, 45, м. Київ, МСП, 03680, Україна ДП “Український інститут промислової власності”, вул. Глазунова, 1, м. Київ – 42, 01601

Дивитися

Додаткова інформація

Назва патенту англійською

Voice electronic reference book

Автори англійською

Vintsiuk Taras Klymovych, Hrytsenko Volodymyr Illich, Pavlov Oleh Ihorovych, Stasevych Petro Anatoliiovych, Tertychnyi Hryhorii Mykolaiovych

Назва патенту російською

Голосовой электронный справочник

Автори російською

Винцюк Тарас Климович, Гриценко Владимир Ильич, Павлов Олег Игоревич, Стасевич Петр Анатольевич, Тертичный Григорий Николаевич

МПК / Мітки

МПК: G10L 15/00

Мітки: довідник, голосовий, електронний

Код посилання

<a href="https://ua.patents.su/3-48220-golosovijj-elektronnijj-dovidnik.html" target="_blank" rel="follow" title="База патентів України">Голосовий електронний довідник</a>

Подібні патенти