Спосіб голосового управління цифровим диктофоном та цифровий диктофон на його основі
Номер патенту: 69361
Опубліковано: 16.08.2004
Автори: Вінцюк Тарас Климович, Мова Віктор Іванович, Федорин Ярослав Володимирович, Куптель Олег Григорович, Ілюшин Сергій Аркадійович, Ситніков Даніїл Анатолійович, Гриценко Володимир Ільїч, Павлов Олег Ігоревич
Формула / Реферат
1. Спосіб голосового управління цифровим диктофоном, який базується на генерації сигналів керування функціями запису, відтворення, пошуку, перейменування, перемотування, повтору та видалення звукових файлів, який відрізняється тим, що мовленнєвий сигнал перетворюють в цифрову форму, виділяють параметри розпізнавання, порівнюють з еталонними сигналами команд керування, виділяють найбільш близький за мірою схожості еталонний сигнал та за результатом порівняння генерують сигнал керування функціями диктофона.
2. Цифровий диктофон з голосовим управлінням для здійснення способу по п.1, що містить мікрофон, під'єднаний до аналого-цифрового перетворювача, цифро-аналоговий перетворювач, під'єднаний до динаміка, мікроконтролер, на входи якого підключені кнопки запису/живлення та кнопка введення голосової команди, а виходи з'єднані з світловими індикаторами та енергонезалежною пам'яттю, вихід якої підключений до одного із входів мікроконтролера, акумулятор, порт приєднання персонального комп'ютера, який відрізняється тим, що він містить процесор для розпізнавання голосових команд, одним із входів підключений до аналого-цифрового перетворювача, другим входом - до мікроконтролера, одним із виходів підключений до цифро-аналогового перетворювача, а другим виходом підключений до одного із входів мікроконтролера.
Текст
Винахід відноситься до галузі розпізнавання мовленнєвих сигналів і призначений для створення портативного цифрового диктофона, що керується голосом. До аналогів винаходу належать способи управління цифровим диктофоном, що ґрунтуються на використанні кнопок та екрану. Недоліком такого способу керування є складна структура активації функцій диктофона, що є результатом обмеженості засобів керування в портативних пристроях. Іншим недоліком є ускладненість пошуку потрібного аудіозапису в пам'яті диктофона. Також стандартні способи керування обмежують можливості використання диктофонів для людей з вадами зору. Відомо багато видів цифрових диктофонів, але диктофонів із голосовим способом керування функціями не має. Тому за прототип обраний спосіб керування цифровим диктофоном OLYMPUS DS-330 (www.olympus.com), що керується за допомогою одинадцяти кнопок керування та жидко-кристалічного екрану. Управління диктофоном відбувається за допомогою меню, яке в OLYMPUS DS-330 налічує тринадцять пунктів. Відповідно, в кожному з пунктів меню змінюються функції кнопок керування й призначення спеціальних позначок на екрані. Недоліком прототипу є багаторівневий процес керування функціями диктофона. Зважаючи на значну кількість пунктів меню, станів екрану й різні функції кнопок за різних пунктів меню, керування диктофоном вимагає неабиякої початкової підготовки. Іншим недоліком є ускладненість пошуку файлів, адже ж OLYMPUS DS-330 здатен зберігати у пам'яті до 995 файлів. Причиною цих недоліків є стала технологія екранного, візуального керування, натомість даний винахід пропонує інше, голосове керування функціями диктофона. В основу винаходу покладено задачу вдосконалення процесу керування функціями диктофона шляхом реалізації технології розпізнавання голосових команд, що дозволяє керувати функціями диктофона природною мовою та організувати файлову систему диктофона на основі мовленнєвих імен файлів. Винахід пропонує принципово новий, відсутній в прототипі, спосіб керування функціями диктофона. Так, для відтворення запису в OLYMPUS DS-330, користувач за допомогою кнопок та екрану має обрати певний файл й натиснути кнопку відтворення. У винаході, для програвання файлу користувач називає голосову команду та ім'я файлу. Для іменування файлу в OLYMPUS DS-330, користувач має знайти відповідний пункт меню та за допомогою кнопок ввести бажане ім'я (коментар). У винаході ж ім'я файлу промовляється голосом. Загалом, у винаході за голосовими командами виконуються функції запису, відтворення, пошуку, перейменування, перемотування, повтору та видалення звукових файлів. Найважливішою новацією винаходу є спосіб іменування та зчитування файлів за допомогою голосових імен. Такий спосіб ідентифікації файлів гарантує зручність, швидкість та простоту при пошуку потрібного звукового фрагмента. Керування функціями диктофона відбувається за допомогою голосових команд. Для цього користувач має назвати команду та/або ім'я файлу. Результат дії команди, підказка або виявлені помилки озвучуються у вигляді голосових повідомлень. Іменування файлу робиться користувачем під час або після виконання запису. Для цього користувачеві достатньо вимовити ім'я файлу. За цим ім'ям файл зберігається в файловій системі, за цим же ім'ям відбуваються й всі інші звернення до файлу. Наприклад, відтворення файлу виглядає так: користувач вимовляє команду "ПРОЧИТАТИ" та ім'я файлу. Для видалення файлу користувач вимовляє "СТЕРТИ ФАЙЛ", диктофон запитує ім'я файлу, користувач називає ім'я. Стирання вимагає підтвердження, тому диктофон запитує: "Ви дійсно бажаєте стерти цей файл?". Якщо користувач відповідає позитивно, тобто "ТАК", файл видаляється, в іншому разі не видаляється. Інший приклад, після промовляння команд "ПРОЧИТАТИ", "ЗАПИСАТИ", "СТЕРТИ ФАЙЛ" диктофон підказує голосом "Назвіть ім'я файлу для прочитання", "Назвіть ім'я файлу для запису" або інформує: "Файл стерто". На фіг.1 зображено послідовність дії команди голосового управління. Звуковий сигнал поступає на аналізатор, в якому сигнал перетворюється до форми, прийнятної для розпізнавання. В блоці розпізнавання перетворений сигнал порівнюється з еталонами команд, що зберігаються в енергонезалежній пам'яті диктофона, в результаті чого або генерується сигнал керування функціями диктофона або відбувається відмова від розпізнавання. У випадку, коли голосова команда потребує подальшого уточнення або підтвердження дії, відбувається діалог між пристроєм та людиною. Спосіб голосового управління функціями диктофона, реалізований у винаході, дозволив значно переробити зовнішній вигляд цифрового диктофона, зменшити кількість кнопок керування до двох та навіть відмовитись від екрану, замінивши екранні повідомлення звуковими. На фіг.2 зображено структурну схему ци фрового диктофона з голосовим управлінням. Диктофон складається з наступних частин: 1 - два мікрофони (для голосового керування та запису); 2 - аналого-цифрового перетворювача; 3 - мікроконтролера; 4 - процесора цифрової обробки сигналів; 5 - енергонезалежної пам'яті; 6 - цифро-аналогового перетворювача; 7 - кнопки запису/живлення; 8 - кнопки введення голосової команди; 9 - двох світлови х індикаторів; 10 - динаміка або аудіо-виходу головних телефонів; 11 - виходу для з'єднання диктофона з комп'ютером (USB-порт); 12 - акумулятора. Мікрофони 1 приєднують до аналого-цифрового перетворювача 2, при цьому один з мікрофонів активують в режимі запису, а інший в режимі розпізнавання голосових команд. Аналого-цифровий перетворювач 2 підключають до процесора цифрової обробки сигналу 4. До процесора цифрової обробки сигналу 4 приєднують мікроконтролер 3 та цифро-аналоговий перетворювач 6, який має вихід на динамік або головні телефони 10. Мікроконтролер 3, окрім процесора, з'єднують з клавіатурою 7, 8, світловими індикаторами 9 та зовнішньою пам'яттю 5. Живлення пристрою виконують від вбудованого акумулятора 12. Зв'язок з комп'ютером виконується через USB порт 11. Звуковий сигнал надходить на вбудований мікрофон, потім поступає на аналого-цифровий перетворювач. Оцифрований звуковий сигнал надходить до процесора цифрової обробки сигналу 4 й, в залежності від поточного режиму, або розпізнається як голосова команда або записується до зовнішньої пам'яті диктофона. Записи та голосові повідомлення озвучуються за допомогою динаміка або надходять до аудіо-виходу головних телефонів. Засоби керування диктофоном складаються з двох кнопок керування та світлових індикаторів. Початок або припинення роботи пристрою активується довгим натисненням кнопки живлення. Коротке натискання цієї кнопки активізує або припиняє режим запису. Друга кнопка призначена для вводу голосової команди. Світлові індикатори показують поточний режим. Можливі різні модифікації винаходу, зокрема збільшення кількості голосових команд або поєднання стандартних способів керування з елементами голосового управління. Це виглядає доцільним в складних системах з великим набором функцій.
ДивитисяДодаткова інформація
Назва патенту англійськоюMethod for controlling a digital dictaphone and a digital dictaphone for the realization of the method
Автори англійськоюVintsiuk Taras Klymovych, Fedoryn Yaroslav Volodymyrovych, Pavlov Oleh Ihorovych
Назва патенту російськоюСпособ речевого управления цифровым диктофоном и цифровой диктофон для осуществления способа
Автори російськоюВинцюк Тарас Климович, Федорин Ярослав Владимирович, Павлов Олег Игоревич
МПК / Мітки
МПК: G10L 15/00
Мітки: управління, диктофоном, основі, диктофон, голосового, спосіб, цифровий, цифровим
Код посилання
<a href="https://ua.patents.su/2-69361-sposib-golosovogo-upravlinnya-cifrovim-diktofonom-ta-cifrovijj-diktofon-na-jjogo-osnovi.html" target="_blank" rel="follow" title="База патентів України">Спосіб голосового управління цифровим диктофоном та цифровий диктофон на його основі</a>
Попередній патент: Спосіб голосового управління відеотелефоном радіомережі та пристрій для його здійснення
Наступний патент: Пристрій для виконання перфорації деталей з м’якого еластичного матеріалу
Випадковий патент: Спосіб виготовлення клеєної заготовки з кінцевими прямими прямокутними коробковими шипами