Спосіб автоматичного пошуку мовленнєвого фрагмента в суцільному масиві звукозапису
Номер патенту: 48219
Опубліковано: 10.03.2010
Автори: Вінцюк Тарас Климович, Стасевич Петро Анатолійович, Гриценко Володимир Ілліч, Тертичний Григорій Миколайович, Павлов Олег Ігоревич
Формула / Реферат
Спосіб автоматичного пошуку мовленнєвого фрагмента в суцільному масиві звукозапису, який базується на виборі зі всіх можливих фрагментів таких фрагментів, для яких інтегральна міра відмінності отриманих з них послідовностей наборів параметрів вибраної моделі мовотворення від аналогічної послідовності, отриманої з мовленнєвого фрагмента, який шукається, не перевищує встановлений поріг при використанні динамічного програмування в процесі їх порівняння, який відрізняється тим, що введений для пошуку звуковий сигнал ключового слова або словосполучення перетворюють до цифрової форми, обчислюють за ним параметри вибраної моделі мовотворення, стискають отриману послідовність наборів параметрів з дозволеними заданими наперед втратами за допомогою процедури динамічного програмування, використовують отриману стиснену послідовність для розпізнавання фрагмента звукозапису, який при такому самому перетворенні дає послідовність, що містить схожі за вибраною мірою відмінності набори параметрів, виконують пошук можливих початків таких схожих послідовностей, після чого озвучують звукозапис з відповідного місця.
Текст
Спосіб автоматичного пошуку мовленнєвого фрагмента в суцільному масиві звукозапису, який базується на виборі зі всіх можливих фрагментів таких фрагментів, для яких інтегральна міра відмінності отриманих з них послідовностей наборів параметрів вибраної моделі мовотворення від аналогічної послідовності, отриманої з мовленнє 3 певного звукового фрагменту в пам'яті диктофона OLYMPUS DS-330 залежить, чи позначений даний звуковий фрагмент. Якщо фрагмент має індексну позначку користувачеві достатньо вибрати її з переліку позначок. Якщо ж фрагмент не позначений, користувач має уважно прослухати звукозапис, аж поки потрібний фрагмент не буде відтворений. Натомість, у способі, який пропонується винаходом, користувач має промовити будь-яке слово або словосполучення що є у звуковому фрагменті, який шукається, і відтворення автоматично розпочнеться з фрагмента, який містить сказане слово або словосполучення. Спосіб автоматичного пошуку мовленнєвого фрагмента в суцільному масиві звукозапису базується на представленні сказаного ключового слова або словосполучення у вигляді послідовності наборів параметрів обраної моделі мовотворення, кожен з яких розглядається як багатомірний вектор параметрів, здійсненні процедури самосегментації отриманої послідовності векторів параметрів за допомогою процедури динамічного програмування, стискання початкової послідовності векторів параметрів шляхом апроксимації кожного з отриманих сегментів (які містять певну кількість початкових векторів, мінімальне і максимальне значення якої визначається обраним правилом самосегментації) за допомогою одного для всього сегменту апроксимуючого вектору параметрів, порівнянні з використанням процедури динамічного викривлення часу отриманої стиснутої послідовності апроксимуючих векторів параметрів ключового слова або словосполучення з кожним можливим початком подібної часткової послідовності в не стиснутій послідовності векторів параметрів, яка утворюється під час подібного перетворення суцільного масиву звукозапису з метою розпізнавання ключового слова або словосполучення, підрахунку інтегральної міри відстані для кожного з таких порівнянь, перевірки перевищення інтегральною мірою відстані встановленого порогу відмови від розпізнавання і, в разі його не перевищення фіксації інтегральної міри відстані разом з індексом початку такої часткової послідовності векторів параметрів суцільного масиву звукозапису. В залежності від режиму роботи після знаходження часткової послідовності, інтегральна міра відстані для якої від стиснутої послідовності апроксимуючих векторів параметрів ключового слова або словосполучення є нижчою за встановлений поріг відмови від розпізнавання може відбуватися озвучення суцільного масиву запису з відповідного місця, або продовження пошуку решти входжень стиснутої послідовності апроксимуючих векторів параметрів в не стиснутій послідовності векторів параметрів суцільного масиву звукозапису, після чого відбувається озвучення найкращого за інтегральною мірою відстані (тобто з найменшим її значенням) фрагменту фонограми. Якщо після озвучення фрагменту фонограми користувач натискає відповідну кнопку і подає команду продовжити пошук, то в залежності від режиму або відбувається пошук наступного за часом фрагменту в описаний вище спосіб, або озвучується той зі всіх знайдених фрагментів, який має найближчу вищу 48219 4 за значенням інтегральну міру відстані. Після того, як всі фрагменти озвучені, або якщо жодного фрагменту не знайдено користувач отримує відповідне повідомлення. Пошук закінчується за певної кількості спроб, або якщо користувач вирішує переформулювати запит. На фіг. 1 зображено послідовність дій по пошуку звукового фрагменту в суцільних масивах аудіозаписів. Звуковий сигнал ключового слова або словосполучення поступає на так званий аналізатор, в якому сигнал перетворюється на стиснуту послідовність апроксимуючих векторів параметрів. В блоці розпізнавання стиснуту послідовність апроксимуючих векторів параметрів порівнюється зі всіма можливими початками подібної послідовності в не стиснутих послідовностях векторів параметрів суцільних масивів аудіозаписів, які зберігаються разом з самими аудіозаписами в енергонезалежній пам'яті довідника. Створення таких не стиснутих послідовностей векторів параметрів відбувається в аналізаторі під час першого пошуку будь-якого ключового слова або словосполучення. Знайдений в результаті пошуку фрагмент озвучується з відповідного місця аудіозапису і до його кінця, або може бути перерваним, якщо результат пошуку не є задовільним. Користувач може продовжити пошук або продовжити прослуховування наступного знайденого фрагменту. На фіг. 2 зображена структурна схема електронного довідника з голосовим пошуком. Довідник складається з наступних частин: 1 - мікрофона; 2 - аналого-цифрового перетворювача; 3 - мікроконтролера; 4 - процесора цифрової обробки сигналів; 5 - енергонезалежної пам'яті; 6 - цифро-аналогового перетворювача; 7 - кнопки керування пошуком; 8 - інших засобів керування та індикації; 9 - динаміка (або головних телефонів); 10 - виходу для з'єднання диктофона з комп'ютером; 11 - акумулятора. Мікрофон 1 приєднують до аналого-цифрового перетворювача 2. Аналого-цифровий перетворювач 2 підключають до процесора цифрової обробки сигналу 4. До процесора цифрової обробки сигналу 4 приєднують мікроконтролер 3 та цифроаналоговий перетворювач 6, який має вихід на динамік або головні телефони 9. Мікроконтролер 3, окрім процесора, з'єднують з клавіатурою 7, засобами індикації 8 та зовнішньою пам'яттю 5. Живлення пристрою виконують від вбудованого акумулятора 11. Зв'язок з комп'ютером виконують через USB порт 10. Звуковий сигнал надходить на вбудований мікрофон, потім поступає на аналого-цифровий перетворювач. Оцифрований звуковий сигнал надходить до процесора цифрової обробки сигналу й, в залежності від поточного режиму, або розпочинається пошук, або звуковий сигнал записується до зовнішньої пам'яті голосового довідника. Результат пошуку озвучуються за допомогою динамі 5 48219 ка або надходить до аудіо-виходу головних телефонів. Для активації пошуку користувач має натиснути клавішу керування пошуком, сказати ключове Комп’ютерна верстка А. Крулевський 6 слово або словосполучення та відпустити клавішу. Знайдений фрагмент буде озвучений. Підписне Тираж 26 прим. Міністерство освіти і науки України Державний департамент інтелектуальної власності, вул. Урицького, 45, м. Київ, МСП, 03680, Україна ДП “Український інститут промислової власності”, вул. Глазунова, 1, м. Київ – 42, 01601
ДивитисяДодаткова інформація
Назва патенту англійськоюMethod for automated search for voice fragment in complete massif of audio-record
Автори англійськоюVintsiuk Taras Klymovych, Hrytsenko Volodymyr Illich, Pavlov Oleh Ihorovych, Stasevych Petro Anatoliiovych, Tertychnyi Hryhorii Mykolaiovych
Назва патенту російськоюСпособ автоматического поиска речевого фрагмента в сплошном массиве звукозаписи
Автори російськоюВинцюк Тарас Климович, Гриценко Владимир Ильич, Павлов Олег Игоревич, Стасевич Петр Анатольевич, Тертичный Григорий Николаевич
МПК / Мітки
МПК: G10L 15/00
Мітки: звукозапису, суцільному, спосіб, фрагмента, мовленнєвого, автоматичного, масиві, пошуку
Код посилання
<a href="https://ua.patents.su/3-48219-sposib-avtomatichnogo-poshuku-movlennehvogo-fragmenta-v-sucilnomu-masivi-zvukozapisu.html" target="_blank" rel="follow" title="База патентів України">Спосіб автоматичного пошуку мовленнєвого фрагмента в суцільному масиві звукозапису</a>
Попередній патент: Голосовий портативний словник-перекладач
Наступний патент: Голосовий електронний довідник
Випадковий патент: Гальмова колодка півня-ігнат'єва залізничного рухомого составу