Спосіб автоматичного пошуку мовленнєвого фрагмента в суцільному масиві звукозапису та голосовий електронний довідник на його основі

Завантажити PDF файл.

Формула / Реферат

1. Спосіб автоматичного пошуку мовленнєвого фрагмента в суцільному масиві звукозапису, який базується на виборі фрагмента, найбільш подібного до фрагмента, що шукається, який відрізняється тим, що введений для пошуку звуковий сигнал, перетворюють до цифрової форми, виділяють параметри розпізнавання, далі за алгоритмом автоматичного пошуку ключового слова порівнюють зі всіма фрагментами в масиві аудіозапису і в результаті порівняння отримують найбільш подібний фрагмент з масиву, що відповідає введеному мовному фрагменту.

2. Голосовий електронний довідник для здійснення способу за п. 1, що містить мікрофон, з'єднаний з аналого-цифровим перетворювачем, цифро-аналоговий перетворювач, з'єднаний з динаміком, мікроконтролер, на входи якого підключені кнопки керування пошуком, та кнопка інших засобів керування, а виходи з'єднані з енергонезалежною пам'яттю, вихід якої підключений до одного із входів мікроконтролера, акумулятор, порт приєднання персонального комп'ютера, який відрізняється тим, що він містить процесор для розпізнавання голосових команд, одним із входів підключений до аналого-цифрового перетворювача, другим входом - до мікроконтролера, одним із виходів підключений до цифро-аналогового перетворювача, а другим виходом підключений до одного із входів мікроконтролера.

Текст

Винахід відноситься до галузі розпізнавання мовленнєвих сигналів і призначений для автоматичного пошуку інформації в масивах аудіозаписів за ключовими словами або словосполученнями. До аналогів винаходу належать способи пошуку інформації в аудіофайлах за індексними позначками. На відміну від текстових файлів, пошук в звукових файлах значно складніший і вимагає відтворення запису аж поки бажаний фрагмент не буде знайдений. Відомі способи пошуку на основі індексних позначок, за якими пошук всередині звукозапису виконується за попередньо визначеними індексами (адресами). Але, незважаючи на значне прискорення пошуку, в цьому способі залишаються ряд недоліків. По-перше, пошук обмежений кількістю позначок в середині аудіозапису, тому завжди залишаються не позначені фрагменти; по-друге, при великій кількості позначок зростає й час на вибір потрібної позначки; по-третє, метод індексних позначок вимагає певного часу на попередню розмітку запису. За прототип винаходу обраний спосіб пошуку звукової інформації, реалізований в диктофоні OLYMPUS DS-330 (www.olympus.com). OLYMPUS DS-330 дозволяє записувати звукові фрагменти у вигляді файлів та встановлювати до 16 індексних позначок (index marks) в середині файлів. Недоліками прототипу є: обмеження пошуку лише позначеними звуковими фрагментами; обмежена кількість індексних позначок; необхідність попередньої розмітки аудіозапису. В основу винаходу покладено задачу вдосконалення процесу пошуку мовленнєвого фрагмента в масиві аудіозапису, шляхом реалізації технології автоматичного пошуку та розпізнавання ключового слова або словосполучення, що дозволяє значно спростити та пришвидшити пошук потрібного фрагмента запису. Винахід пропонує принципово новий, відсутній в прототипі, спосіб пошуку звукового фрагмента. Так, спосіб пошуку певного звукового фрагменту в пам'яті диктофона OLYMPUS DS-330 залежить, чи позначений даний звуковий фрагмент. Якщо фрагмент має індексну позначку користувачеві достатньо вибрати її з переліку позначок. Якщо ж фрагмент не позначений, користувач має уважно прослухати звукозапис, аж поки потрібний фрагмент не буде відтворений. Натомість, у способі, який пропонується винаходом, користувач має промовити будь-яке слово або словосполучення що є у звуковому фрагменті, який шукається, і відтворення автоматично розпочнеться з фрагмента, який містить сказане слово або словосполучення. Спосіб автоматичного пошуку мовленнєвого фрагмента в суцільному масиві звукозапису містить в основі алгоритм автоматичного пошуку ключового слова або словосполучення, за яким зі всіх можливих фрагментів аудіозапису обирається той, який є найбільш близьким до сказаного ключового слова або словосполучення, тобто до фрагмента, що шукається. Запропонований спосіб полягає у порівнянні всіх фрагментів аудіозапису із сказаним та відтворенні запису, починаючи від початку знайденого фрагмента. Якщо знайдений фрагмент не відповідає шуканому, пошук починається знову, але при цьому раніше вибраний фрагмент виключається з пошуку. Пошук закінчується за певної кількості спроб, або якщо користувач вирішує переформулювати запит. На фіг. 1 зображено послідовність дій по пошуку звукового фрагменту в масиві аудіозаписів. Звуковий сигнал поступає на аналізатор, в якому сигнал перетворюється до форми, прийнятної для розпізнавання. В блоці розпізнавання перетворений сигнал порівнюється зі всіма фрагментами аудіозапису, що зберігаються в енергонезалежній пам'яті довідника. В результаті пошуку озвучується знайдений фрагмент. Якщо результат пошуку не є задовільним користувач може продовжити пошук, що означає нову ітерацію пошуку звукового фрагменту за виключенням фрагментів, знайдених до його початку. На фіг.2 зображена структурна схема електронного довідника з голосовим пошуком. Довідник складається з наступних частин: 1 - мікрофона; 2 - аналого-цифрового перетворювача; 3 - мікроконтролера; 4 - процесора цифрової обробки сигналів; 5 - енергонезалежної пам'яті; 6 - цифро-аналогового перетворювача; 7 - кнопки керування пошуком; 8 - інших засобів керування та індикації; 9 - динаміка (або головні телефони); 10 - виходу для з'єднання довідника з комп'ютером; 11 - акумулятора. Мікрофон 1 приєднують до аналого-цифрового перетворювача 2. Аналого-цифровий перетворювач 2 підключають до процесора цифрової обробки сигналу 4. До процесора цифрової обробки сигналу 4 приєднують мікроконтролер 3 та цифро-аналоговий перетворювач 6, який має вихід на динамік або головні телефони 9. Мікроконтролер 3, окрім процесора, з'єднують з клавіатурою 7, засобами індикації 8 та зовнішньою пам'яттю 5. Живлення пристрою виконують від вбудованого акумулятора 11. Зв'язок з комп'ютером виконують через USB порт 10. Звуковий сигнал надходить на вбудований мікрофон, потім поступає на аналого-цифровий перетворювач. Оцифрований звуковий сигнал надходить до процесора цифрової обробки сигналу й, в залежності від поточного режиму, або розпочинається пошук або звуковий сигнал записується до зовнішньої пам'яті голосового довідника. Результат пошуку озвучуються за допомогою динаміка або надходить до аудіо-виходу головних телефонів. Для активації пошуку користувач має натиснути клавішу керування пошуком, сказати ключове слово або словосполучення та відпустити клавішу. Знайдений фрагмент буде озвучений.

Дивитися

Додаткова інформація

Назва патенту англійською

Method for automatically detecting the specified voice signal element when recording voice signals, and the electronic reference dictionary based on the method

Автори англійською

Vintsiuk Taras Klymovych, Fedoryn Yaroslav Volodymyrovych, Pavlov Oleh Ihorovych

Назва патенту російською

Способ автоматического поиска заданного элемента речевого сигнала при записи речевых сигналов и автоматический словарь-справочник, в котором используется способ

Автори російською

Винцюк Тарас Климович, Федорин Ярослав Владимирович, Павлов Олег Игоревич

МПК / Мітки

МПК: G10L 15/00

Мітки: звукозапису, довідник, основі, голосовий, мовленнєвого, масиві, електронний, пошуку, фрагмента, суцільному, автоматичного, спосіб

Код посилання

<a href="https://ua.patents.su/2-67699-sposib-avtomatichnogo-poshuku-movlennehvogo-fragmenta-v-sucilnomu-masivi-zvukozapisu-ta-golosovijj-elektronnijj-dovidnik-na-jjogo-osnovi.html" target="_blank" rel="follow" title="База патентів України">Спосіб автоматичного пошуку мовленнєвого фрагмента в суцільному масиві звукозапису та голосовий електронний довідник на його основі</a>

Подібні патенти