Завантажити PDF файл.

Формула / Реферат

1. Спосіб голосового управління відеотелефоном радіомережі, який базується на генеруванні сигналів керування функціями відеотелефону, а саме набором телефонного номера, вибором абонента, відповіддю на телефонний виклик, прийомом-передачею відеозображень, відсилкою-прийомом текстових та візуальних повідомлень (SMS та MMS) та настроюванням сервісних функцій, який відрізняється тим, що сигнали керування генерують у відповідь на звуковий сигнал голосової команди, який перетворюють до цифрової форми, порівнюють з еталонними сигналами команд, обирають найбільш подібний еталонний сигнал та залежно від результату порівняння генерують сигнал керування відеотелефоном.

2. Пристрій для здійснення способу по п. 1, що містить процесор обробки сигналів, дисплей, матрицю, здатну до світлосприйняття, перетворювач інтерфейсу дисплея, перетворювач інтерфейсу матриці, блок аналого-цифрового та цифро-аналогового перетворення, мікрофонний підсилювач, підсилювач звукового спектра, мікрофон, звуковий випромінювач та перетворювач інтерфейсу телефонного радіозв’язку стандарту GSM, при цьому вхід дисплея під’єднаний до виходу перетворювача інтерфейсу дисплея, вхід якого під’єднаний до одного з виходів центрального процесора обробки сигналів, вихід матриці під’єднаний до входу перетворювача інтерфейсу матриці, вихід якого під’єднаний до одного з входів процесора, процесор також під’єднаний до перетворювача інтерфейсу телефонного радіозв’язку стандарту GSM, вихід мікрофона під’єднаний до входу мікрофонного підсилювача, вихід якого під’єднаний до входу блока аналого-цифрового та цифро-аналогового перетворення, вхід звукового випромінювача під’єднаний до виходу підсилювача звукового спектра, вхід якого під’єданний до виходу блока аналого-цифрового та цифро-аналогового перетворення, який також під’єднаний до перетворювача інтерфейсу телефонного радіозв’язку стандарту GSM, який відрізняється тим, що містить керований модуль розпізнавання з енергонезалежною пам’яттю, до якого під’єднані центральний процесор обробки сигналів, цифрові вхід та вихід блока аналого-цифрового та цифро-аналогового перетворення.

Текст

Винахід відноситься до галузі розпізнавання мовленнєвих сигналів і призначений для створення пристрою „відеотелефон радіомережі", що керується голосом. До аналогів винаходу належать способи управління пристроєм „відеотелефон радіомережі", що базуються на використанні кнопок та екрану. Недоліком такого способу керування є складна структура активації функцій відеотелефона радіомережі, що є результатом обмеженості засобів керування в портативних пристроях. Іншим недоліком є необхідність запам'ятовування номера телефону необхідного абонента чи ускладнена процедура його пошуку в звичайному телефонному електронному довіднику. Відомо декілька видів відеотелефонів радіомережі, але відеотелефонів радіомережі із голосовим способом керування функціями та з'єднаннями немає. Тому за прототип обраний спосіб керування відеотелефоном радіомережі NOKIA-7650 (www.nokia.com), що керується за допомогою двадцяти п'яти кнопок керування та рідкокристалічного екрану і працює в радіостандарті GSM. Управління пристроєм відбувається за допомогою меню. Відповідно, в кожному з пунктів меню змінюються функції кнопок керування й призначення спеціальних позначок на рідкокристалічному екрані. Недоліком прототипу є багаторівневий процес керування функціями. Зважаючи на значну кількість пунктів меню, станів рідкокристалічного екрану й різні функції кнопок за різних пунктів меню, керування пристроєм вимагає неабиякої початкової підготовки. Іншим недоліком є ускладненість пошуку записів телефонного електронного довідника. Причиною цих недоліків є стала технологія екранного, візуального та тактильного керування, натомість даний винахід пропонує інше, голосове керування функціями відеотелефона радіомережі. В основу винаходу покладено задачу вдосконалення процесу керування функціями відеотелефона радіомережі шляхом реалізації технології розпізнавання голосових команд, що дозволяє керувати функціями відеотелефона радіомережі природною мовою та організувати телефонний електронний довідник з включенням голосових ідентифікаторів. Винахід пропонує принципово новий, відсутній в прототипі, спосіб керування функціями відеотелефона радіомережі. Так, для реалізації функції фотографування на відсилання знімку абонента в NOKIA-7650, за допомогою кнопок та екрану фіксують певний кадр, потім за допомогою кнопок обирають функцію пересилки зображення. У винаході, для фіксації певного кадру та його відправки можна назвати певну голосову команду. Для здійснення телефонного з'єднання в NOKIA-7650 або вводять телефонний номер на екрані за допомогою клавіш, або знаходять потрібний номер в телефонному електронному довідникові також за допомогою клавіш, якщо ж надходить виклик від абонента, тоді для встановлення з'єднання також натискають клавішу. У винаході ж для здійснення з'єднання промовляють голосовий ідентифікатор абонента чи промовляють команду у випадку надходження виклику від абонента, якщо увімкнуто режим голосового розпізнавання. Також передбачено традиційний спосіб встановлення з'єднання за допомогою клавіш. Загалом, у винаході за голосовими командами можуть виконуватися функції встановлення з'єднання, фіксації та передачі зображення, всі функції роботи з телефонним електронним довідником та цифровим автовідповідачем, що не реалізовано в прототипі. Найважливішою новацією винаходу є спосіб реалізації управління функціями відеотелефону радіомережі за допомогою голосових команд користувача. Такий спосіб управління гарантує зручність, швидкість та простоту при управлінні пристроєм. Пристрій використовується в телефонній радіомережі та дозволяє поряд із голосовим телефонним зв'язком виконувати фіксацію та передачу по цій телефонній радіомережі сигналу відеозображення з можливістю використання для цієї мети голосових команд користувача, а також реалізовувати приймання відеозображення з відображенням його на дисплеї пристрою. На відміну від прототипу, керування функціями відеотелефону радіомережі можуть здійснювати за допомогою голосових команд. Для цього називають команду та/або голосовий ідентифікатор абонента, виклик якого потрібно здійснити. Результат дії команди, підказки або виявлені помилки можуть озвучуватися у вигляді голосових повідомлень поряд із екранним відображенням. Іменують абонента під час формування телефонного електронного довідника. Для цього вимовляють ім'я абонента. Запис, що містить телефонний номер абонента, його текстовий ідентифікатор та може містити голосовий ідентифікатор або іншу інформацію, зберігається в телефонному електронному довідникові. Якщо запис містить голосовий ідентифікатор, то виклик цього абонента чи редагування запису телефонного електронного довідника можуть здійснювати шляхом промовляння голосового ідентифікатора. Також виклик будь-якого абонента можуть здійснювати шляхом промовляння цифрового номеру абонента в телефонній мережі. Якщо увімкнуто режим розпізнавання мови користувача, то фіксацію та відправлення зображення можуть здійснювати після промовляння команд, наприклад, "СФОТОГРАФУВАТИ" та "ВІДПРАВИТИ". Після цього пристрій потребує інформацію про абонента, і якщо відповідний абоненту запис телефонного довідника містить голосовий ідентифікатор, то його також можуть назвати, наприклад, "АБОНЕНТ ПЕРШИЙ". Після цього пристрій встановлює зв'язок та виконує необхідну передачу даних. На фіг.1 зображено послідовність дії команди голосового управління. Звуковий сигнал поступає на аналізатор, в якому сигнал перетворюється до форми, прийнятної для розпізнавання. В блоці розпізнавання перетворений сигнал порівнюється з еталонами команд, що зберігаються в енергонезалежній пам'яті відеотелефона-приставки, в результаті чого або генерується сигнал керування функціями відеотелефонаприставки або відбувається відмова від розпізнавання. У випадку, коли голосова команда потребує подальшого уточнення або підтвердження дії, може відбуватися діалог між пристроєм та людиною. Спосіб голосового управління функціями відеотелефона радіомережі, реалізований у винаході, дозволив зменшити кількість кнопок керування до двадцяти та реалізувати інтуїтивно зрозумілий для людини інтерфейс спілкування при здійсненні фіксації та пересилання відеосигналу через радіомережу. На фіг.2 зображена структурна схема відеотелефона радіомережі з голосовим управлінням. Пристрій складається з наступних блоків: 1 - кольоровий дисплей 2 - матриця, здатна до світлосприйняття 3 - перетворювач інтерфейсу дисплея 4 - перетворювач інтерфейсу матриці, що здатна до світлосприйняття 5 - центральний процесор обробки сигналів 6 - керуємий модуль розпізнавання 7 - блок аналого-цифрового та цифро-аналогового перетворення 8 - мікрофонний підсилювач 9 - підсилювач звукового спектру 10 - мікрофон 11 - звуковий випромінювач 12 - перетворювач інтерфейсу телефонного радіозв'язку стандарту GSM Вхід дисплея 1 під'єднаний до виходу перетворювача 3 інтерфейсу дисплея, вхід якого під'єднаний до одного з виходів центрального процесора 5 обробки сигналів. Вихід матриці 2 під'єднаний до входу перетворювача 4 інтерфейсу матриці, вихід якого під'єднаний до одного з входів процесора 5. Процесор 5 також під'єднаний до керуємого модуля 6 розпізнавання та до перетворювача 12 інтерфейсу телефонного радіозв'язку стандарту GSM для двостороннього обміну з ними даними. Модуль 6 також під'єднаний до блока 7 аналого-цифрового та цифро-аналогового перетворення для двостороннього обміну даними. Вихід мікрофона 10 під'єднаний до входу мікрофонного підсилювача 8, вихід якого під'єднаний до входу блока 7 аналого-цифрового та цифро-аналогового перетворення. Вхід звукового випромінювача 11 під'єднаний до виходу підсилювача 9 звукового спектру, вхід якого під'єднаний до виходу блока 7 аналого-цифрового та цифро-аналогового перетворення, який також під'єднаний до перетворювача 12 інтерфейсу телефонного радіозв'язку стандарту GSM для двостороннього обміну даними. Після включення пристрою він переходить до початкового режиму, в якому відбувається очікування можливих натискань клавіш користувачем. При цьому, якщо акумулятор, що забезпечує живлення пристрою, має достатній рівень заряду, у пристрої міститься картка ідентифікації абонента з дозволом на використання послуг бездротового зв'язку стандарту GSM, видана компанією-власником мережі радіо-прийомо-передавачів, пристрій знаходиться в зоні стійкого прийому радіосигналу компанії-власника мережі радіо-прийомо-передавачів, і процедура реєстрації картки ідентифікації абонента цими прийомо-передавачами завершилася, то пристрій переходить у черговий режим. У черговому режимі пристрій очікує від користувача натискання клавіш, що повідомляють йому про той чи інший режим а також може приймати виклики, що надходять. По натисканню відповідної клавіші пристрій переводять у режим навчання голосовим командам, при якому користувачеві пропонується назвати голосові команди керування. Крім того, у черговому режимі можуть створювати, змінювати, видаляти записи телефонного електронного довідника, кожний з який може містити голосову мітку. У такому випадку при промовлянні голосового ідентифікатора та включеному режимі розпізнавання мови відбувається автоматичне телефонне з'єднання з потрібним абонентом. З включеним розпізнаванням мови пристрій працює в такий спосіб. Для реалізації телефонного зв'язку процесор 5 може або сам ініціювати телефонний виклик через перетворювач 12, або одержати від нього сигнал про виклик, що надійшов. У випадку виклику, що надійшов, процесор 5 може здійснити операцію встановлення зв'язку відповідною командою перетворювача 12. У випадку ініціювання виклику від пристрою зв'язок встановлюється після операції встановлення зв'язку віддаленим терміналом. Команду для ініціювання телефонного виклику чи для встановлення зв'язку при вхідному телефонному виклику процесор 5 одержує або від натискання зовнішніх клавіш, або від модуля 6 при включеному розпізнаванні мови. При встановленому телефонному зв'язку голосовий сигнал передачі проходить від мікрофону 10 через підсилювач 8, перетворюється з аналогового вигляду в цифровий у блоці 7 і надходить у перетворювач 12, що здійснює його стискання у відповідності зі стандартом бездротової цифрової передачі мови і здійснює його передачу в радіоефір. Телефонний сигнал прийому надходить з радіоефіру в перетворювач 12. Перетворювач 12 здійснює його розпакування зі стиснутого вигляду у відповідності зі стандартом бездротової цифрової передачі мови, далі передає в блок 7, що перетворює мовний сигнал з цифрового вигляду в аналоговий. Після блоку 7 мовний сигнал проходить через підсилювач 9 звукового спектру у мікрофон 11. Для реалізації зняття і передачі зображення віддаленому користувачеві процесор 5 здійснює фіксування кадру відповідною командою матриці 2 і перетворювачеві 4, одержує зображення в нестиснутому цифровому потоці, далі процесор 5 робить стискання зображення, ініціює виклик віддаленого терміналу і переводить перетворювач 12 у режим передачі даних у відповідності зі стандартом бездротової цифрової передачі даних, передавши йому відповідну команду. Перетворювач 12 передає цю команду віддаленому терміналу, у такий спосіб також переводить його в режим даних. Стиснуте зображення надходить у перетворювач 12 і передається з нього в радіоефір віддаленому терміналу по стандартному протоколу цифрової бездротової передачі даних. Команда про зняття кадру зображення надходить у процесор 5 або від зовнішніх кнопок, які натискають, або від модуля 6 при включеному режимі розпізнавання мови. При цьому голосова команда надходить у процесор 5 від мікрофона 10 через підсилювач 8 та перетворюється в цифрову форму в блоці 7. Одержуване зображення надходить у перетворювач 12 з радіоефіру від віддаленого терміналу у відповідності зі стандартом цифрової бездротової передачі даних у стиснутому вигляді. Причому дані надходять відразу в пам'ять процесора 5. Перетворювач 12 спочатку сповіщає про це процесору 5 командою про прийняті дані. Процесор 5 здійснює розпакування отриманого стиснутого зображення у відповідності зі стандартом стискання графічних даних і направляє розпакований цифровий потік через перетворювач 3 інтерфейсу дисплея на дисплей 1 для відображення. Також, крім названих режимів прийому-передачі, пристрій реалізує стандартні для прототипу сервіси прийому-передачі: повідомлення SMS, службові повідомлення мережі всіх рівнів, передачу даних по всіх технологіях у рамках стандарту. При цьому всі ці функції реалізуються в звичному для мобільних телефонів вигляді, але з можливістю використання для їхньої активації і настроювання результатів розпізнавання голосових команд користувача в модулі 6. Можливі різні модифікації винаходу, зокрема в поєднанні операцій розпізнавання мови, розпаковки, запаковки відеосигналу в одному модулі, проте це доречно лише при значному збільшенні швидкості обчислювальної здатності цього модуля.

Дивитися

Додаткова інформація

Назва патенту англійською

Method for controlling a video telephone in a radio communication network by voice signals

Автори англійською

Vintsiuk Taras Klymovych, Fedoryn Yaroslav Volodymyrovych, Riabov Oleksii Petrovych, Воsеnко Rostyslav Volodymyrovych

Назва патенту російською

Способ речевого управления видеотелефоном в сети радиосвязи и устройство для осуществления способа

Автори російською

Винцюк Тарас Климович, Федорин Ярослав Владимирович, Рябов Алексей Петрович, Босенко Ростислав Владимирович

МПК / Мітки

МПК: G10L 15/00

Мітки: радіомережі, спосіб, пристрій, відеотелефоном, голосового, управління, здійснення

Код посилання

<a href="https://ua.patents.su/3-69360-sposib-golosovogo-upravlinnya-videotelefonom-radiomerezhi-ta-pristrijj-dlya-jjogo-zdijjsnennya.html" target="_blank" rel="follow" title="База патентів України">Спосіб голосового управління відеотелефоном радіомережі та пристрій для його здійснення</a>

Подібні патенти