Система та спосіб автоматизованих послуг з транскрипції

Номер патенту: 73495

Опубліковано: 15.08.2005

Автори: Кан Джонатан, Квін Чарльз, Флінн Томас П.

Завантажити PDF файл.

Формула / Реферат

1. Система автоматизованих послуг з транскрипції одного або кількох голосових користувачів, яка містить: засіб прийому надиктованого голосового файла від поточного користувача, яким є один з зазначених одного або кількох голосових користувачів; перший засіб автоматичного перетворення зазначеного надиктованого голосового файла на перший письмовий текст, який має перший набір змінних перетворення; другий засіб автоматичного перетворення зазначеного надиктованого голосового файла на другий письмовий текст, який має другий набір змінних перетворення, причому зазначені перший та другий набори змінних перетворення мають між собою принаймні одну відміну; засіб ручного редагування копії зазначених першого та другого письмових текстів для створення дослівного тексту зазначеного надиктованого голосового файла.

2. Система за п. 1, яка відрізняється тим, що зазначений перший письмовий текст принаймні тимчасово синхронізується із зазначеним надиктованим голосовим файлом, а зазначений засіб ручного редагування містить: засіб послідовного порівняння копії зазначеного першого письмового тексту із зазначеним другим письмовим текстом зі складенням послідовного списку неузгоджених слів, витягнутих з зазначеної копії зазначеного першого письмового тексту, причому зазначений послідовний список має початок, кінець та поточне неузгоджене слово, яке послідовно просувається від зазначеного початку до зазначеного кінця; засіб послідовного пошуку зазначеного поточного неузгодженого слова одночасно у першому буфері, пов'язаному із зазначеним першим засобом автоматичного перетворення, який містить зазначений перший письмовий текст, та у другому буфері, пов'язаному із зазначеним послідовним списком; засіб коригування зазначеного поточного неузгодженого слова у зазначеному другому буфері, причому зазначений засіб коригування містить засіб відтворення зазначеного поточного неузгодженого слова у по суті візуальній ізоляції від решти тексту в зазначеній копії зазначеного першого письмового тексту та засіб відтворення частини зазначеного синхронізованого запису надиктованого голосового файла із зазначеного першого буфера, пов'язаного із зазначеним поточним неузгодженим словом.

3. Система за п. 2, яка відрізняється тим, що зазначений засіб редагування містить також засіб альтернативного перегляду зазначеного поточного неузгодженого слова у контексті зазначеної копії зазначеного першого письмового тексту.

4. Система за п.1, яка відрізняється тим, що зазначені перший та другий засоби автоматичного перетворення мови містять кожний заздалегідь закладену програму розпізнавання мови, призначену для інтерактивної роботи з людиною, і засіб автоматичного реагування на послідовність інтерактивних запитів від зазначеної програми розпізнавання мови.

5. Система за п. 4, яка відрізняється тим, що зазначена відміна між зазначеними першим та другим наборами змінних перетворення являє собою зазначену заздалегідь закладену програму розпізнавання мови, що містить зазначені перший та другий засоби автоматичного перетворення мови.

6. Система за п. 5, яка відрізняється тим, що зазначений автоматичний засіб перетворення мови вибраний з групи, яка містить по суті Naturally Speaking фірми Dragon Systems, Via Voice фірми IBM та Magic Speech фірми Phillips Corporation.

7. Система за п. 4, яка відрізняється тим, що зазначена відміна між зазначеними першим та другим наборами змінних перетворення являє собою мовну модель, уживану в зв'язку з зазначеною заздалегідь закладеною програмою розпізнавання мови.

8. Система за п. 7, яка відрізняється тим, що у зазначеному першому наборі змінних перетворення використовується узагальнена мовна модель, а у зазначеному другому наборі - спеціалізована мовна модель.

9. Система за п. 4, яка відрізняється тим, що зазначена відміна між зазначеними першим та другим наборами змінних перетворення являє собою принаймні одне оточення, пов'язане з зазначеною заздалегідь закладеною програмою розпізнавання мови.

10. Система за п. 4, яка відрізняється тим, що зазначена відміна між зазначеними першим та другим наборами змінних перетворення являє собою засіб попередньої обробки аудіосигналу перед його введенням до зазначеного першого засобу автоматичного перетворення.

11. Система за п. 10, яка відрізняється тим, що  зазначена відміна між зазначеними першим та другим наборами змінних перетворення являє собою засіб попередньої обробки аудіосигналу перед його введенням до зазначеного другого засобу автоматичного перетворення, причому зазначені перша та друга змінні попередньої обробки розрізняються між собою.

12. Система за п. 11, яка відрізняється тим, що зазначені змінні попередньої обробки вибрані з групи, яка містить довжину цифрового слова, швидкість вибірки та усунення певних гармонійних інтервалів.

13. Система за п. 1, яка відрізняється тим, що зазначена відміна між зазначеними першим та другим наборами змінних перетворення являє собою мовну модель, уживану в зв'язку з зазначеною заздалегідь закладеною програмою розпізнавання мови.

14. Система за п. 13, яка відрізняється тим, що у зазначеному першому наборі змінних перетворення використовується узагальнена мовна модель, а у зазначеному другому наборі - спеціалізована мовна модель.

15. Система за п. 1, яка відрізняється тим, що зазначена відміна між зазначеними першим та другим наборами змінних перетворення являє собою засіб попередньої обробки аудіосигналу перед його введенням до зазначеного першого засобу автоматичного перетворення.

16. Система за п. 15, яка відрізняється тим, що зазначена відміна між зазначеними першим та другим наборами змінних перетворення являє собою засіб попередньої обробки аудіосигналу перед його введенням до зазначеного другого засобу автоматичного перетворення, причому зазначені перша та друга змінні попередньої обробки розрізняються між собою.

17. Система за п. 1, яка відрізняється тим, що містить засіб навчання зазначеного засобу автоматичного перетворення мови для забезпечення підвищеної точності транскрипції зазначеного надиктованого голосового файла від поточного користувача.

18. Система за п. 17, яка відрізняється тим, що зазначений засіб навчання являє собою навчальну частину заздалегідь закладеної програми розпізнавання мови, призначеної для інтерактивної роботи з людиною, та містить засіб автоматичного реагування на ряд інтерактивних запитів від зазначеної навчальної частини зазначеної заздалегідь закладеної програми розпізнавання мови.

19. Спосіб автоматизованих послуг з транскрипції одного або кількох голосових користувачів у системі, яка містить програму розпізнавання мови, згідно з яким: приймають надиктований голосовий файл від поточного голосового користувача; автоматично утворюють перший письмовий текст з надиктованого голосового файла з допомогою програми розпізнавання мови, використовуючи перший набір змінних перетворення; автоматично утворюють другий письмовий текст з надиктованого голосового файла з допомогою програми розпізнавання мови, використовуючи другий набір змінних перетворення; вручну утворюють дослівний файл шляхом порівняння першого та другого письмових текстів; повертають дослівний файл поточному користувачеві.

20. Спосіб за п. 19, який відрізняється тим, що на етапі ручного утворення дослівного файла: послідовно порівнюють копію першого письмового тексту з другим письмовим текстом, утворюючи послідовний список неузгоджених слів, витягнутих з копії першого письмового тексту, причому послідовний список має початок, кінець та поточне неузгоджене слово, яке поступово пересувають від початку до кінця; проводять послідовний пошук поточного неузгодженого слова одночасно у першому буфері, пов'язаному з принаймні одною програмою розпізнавання мови, яка містить перший письмовий текст, та у другому буфері, пов'язаному з послідовним списком; відтворюють поточне неузгоджене слово у по суті візуальній ізоляції від решти тексту в копії першого письмового тексту та відтворюють частину синхронізованого запису надиктованого голосового файла з першого буфера, пов'язаного з поточним неузгодженим словом; коригують поточне неузгоджене слово так, щоб воно дослівно представляло частину синхронізованого запису надиктованого голосового файла.

21. Спосіб за п. 19,  який відрізняється тим, що вибирають перший набір змінних перетворення із заздалегідь закладених програм розпізнавання мови; вибирають другий, відмінний набір змінних перетворення із заздалегідь закладених програм розпізнавання мови.

22. Спосіб за п. 19, який відрізняється тим, що вибирають перший набір змінних перетворення із заздалегідь закладених мовних моделей; вибирають другий, відмінний набір змінних перетворення із заздалегідь закладених мовних моделей.

23. Спосіб за п. 19, який відрізняється тим, що надиктований голосовий файл попередньо обробляють перед автоматичним утворенням першого письмового тексту, створюючи при цьому принаймні частину першогонабору змінних перетворення.

24. Спосіб за п. 23, який відрізняється тим, що надиктований голосовий файл попередньо обробляють інакше, ніж з першим набором змінних перетворення, перед автоматичним утворенням другого письмового тексту, створюючи при цьому принаймні частину другого набору змінних перетворення.

Додаткова інформація

Назва патенту англійською

Method and system for automatically transcribing voice information

Назва патенту російською

Способ и система автоматической перезаписи речевой информации

МПК / Мітки

МПК: G10L 15/00

Мітки: автоматизованих, послуг, система, спосіб, транскрипції

Код посилання

<a href="https://ua.patents.su/11-73495-sistema-ta-sposib-avtomatizovanikh-poslug-z-transkripci.html" target="_blank" rel="follow" title="База патентів України">Система та спосіб автоматизованих послуг з транскрипції</a>

Подібні патенти