Завантажити PDF файл.

Формула / Реферат

Портативний перекладач, який відрізняється тим, що містить мікрофон, приєднаний до аналого-цифрового перетворювача, який з'єднаний з процесором цифрової обробки сигналу, до якого підключені мікроконтролер, аналого-цифровий перетворювач, цифро-аналоговий перетворювач, енергонезалежна пам'ять, до якої приєднаний мікроконтролер, кнопку включення живлення, кнопку керування введенням усномовного сигналу для перекладу, засоби індикації, динамік, вихід для з'єднання диктофона з комп'ютером та акумулятор.

Текст

Реферат: Портативний перекладач містить мікрофон, приєднаний до аналого-цифрового перетворювача, який з'єднаний з процесором цифрової обробки сигналу, до якого підключені мікроконтролер, аналого-цифровий перетворювач, цифро-аналоговий перетворювач, енергонезалежна пам'ять, до якої приєднаний мікроконтролер, кнопку включення живлення, кнопку керування введенням усномовного сигналу для перекладу, засоби індикації, динамік, вихід для з'єднання диктофона з комп'ютером та акумулятор. UA 107670 U (12) UA 107670 U UA 107670 U 5 10 15 20 25 Корисна модель належить до портативних перекладачів. Існуючі багатомовні перекладні електронні словники призначені для пошуку перекладних еквівалентів. Такі словники є аналогом заміщення друкованого примірника перекладного словника. Так, багатомовний словник [режим доступу: http//www.slovnyk.org/fcgibin/dic.fcgi?hn=sel&iw=] надає можливості пошуку, якщо слово представлене у початковій формі. Також можна використовувати маски. В масці символ '?' представляє один будь-який знак, а символ '*' представляє декілька будь-яких знаків. Наприклад: УКР* (укрепить, Украина, …), Ф?К* (факел, фиктивный, фокус, …). Всього словник підтримує 30 мов перекладу. Недоліком даного словника є те, що він працює лише з нормалізованою формою слова, а значить не здатний шукати перекладні еквіваленти у тексті. Інша група словників представлена лексикографічною групою відділу прикладної лінгвістики компанії ABBYY. Так, словник LingvoUniversal (En-Ru), виданий вперше 1990 року, став першим у Росії лексикографічним виданням нового типу, призначеним для електронного пошуку, яке поєднує функції перекладного та тлумачного словника. Більшість лексичних значень супроводжуються тлумаченнями, коментарями щодо використання, прикладами вживання, для багатьох наведено синонімічні ряди й антонімічні пари. Усього компанією ABBYY представлено 217 словників, більшість з яких закриті (175). Словник LingvoUniversal можна використовувати як для перекладу з англійської, так і для написання текстів англійською мовою. Велика кількість прикладів, які супроводжують словникові статті, орієнтовані не лише на ілюстровані лексичні значення, але є потужним джерелом інформації в разі роботи з системою повнотекстового пошуку ABBYY Lingvo. Словник постійно поповнюється новими словами та значеннями, в тому числі розмовною та зниженою лексикою, без якої картина сучасної англійської мови була б неадекватною. На відміну від попереднього, даний словник має влаштовану функцію лематизації (приведення словоформи до початкової форми). Так, на наш запит російськомовного речення "На берегу реки стоит дом", ми отримали такий переклад по словах. На берегу реки стоит дом 30 35 с вин. п. на (кого-що) на - на какой (что) ни на есть - см. ни 1 2) берег- берег; надбережжя берегти; (стеречь) стерегти, пильнувати; (хранить) беречь зберігати, ховати, хоронити; (оберегать, предохранять - от чего-л.) глядіти, шанувати; (сохранять, щадить) щадити, шкодувати; диал. сокотити река - річка, ріка (иметь цену) коштувати, -тую, -туєш; (обходиться в стоить „ какую-л. сумму) обійтися, -йдуся, -йдешся, диал. виходити, -дить стоять - стояти (здание) будинок, -нку, дім, род. п. дому Як видно з наведеного прикладу формат представлення словника не здатний забезпечувати переклад фраз (тексту), оскільки не містить парадигматичних класів до слів, що змінюються, і це не дозволяє автоматично синтезувати слово у потрібній формі, відповідно до перекладу. Перекладні електронні словники як складова системи машинного перекладу потребують наявності словозмінної моделі мови. Словозмінна модель представляється в перекладному словнику по різному, але її сутність від цього не змінюється. Так в системі машинного перекладу PROMT 9.0 [http://www.translate.ru] у словниковій статті представляється повна парадигма до змінювального слова. Так, словникова стаття до слова "апельсин" буде мати такий вигляд: апельсин Существительное - апельсин 40 ИП (Кто? Что?) РП (Кого? Чего?) ДП (Кому? Чему?) ВП (Кого? Что?) ТП (Кем? Чем?) ПП (О ком? О чем?) ед.число апельсин апельсина апельсину апельсин апельсином апельсине мн.число апельсины апельсинов апельсинам апельсины апельсинами апельсинах 1 UA 107670 U 5 В системі англо-російського машинного перекладу PARS (розробник група "Лінгвістика", м. Харків) словозмінна модель представлена цифровим кодом словозмінного класу, що відповідає конкретному слову. Для цього в підсистемі ведення перекладних словників укладена таблиця парадигматичних класів (всього для російської мови виділено близько 300 парадигматичних класів) з відповідним цифровим кодом. Фрагмент такої таблиці має наступний вигляд: Код п/кл. 1 2 3 4 5 Слово жаба шуба ходьба судьба баобаб 6 7 … 10 15 20 25 30 35 40 фиолетовый множество … Форми слова а; ы; е; у; ой; е; ы;?; ам;?; ами; ах а; ы; е; у; ой; е; ы;?; ам; ы; ами; ах а; ы; е; у; ой; е; ы ьба; ьбы; ьбе; ьбу: ьбой; ьбе; ьбы; еб; ьбам: ьбы: ьбами: ьбах ?; а; у;?; ом; е; ы; ов; ам; ы; ами; ах; ый; ого; ому; ый; ым; ом; ая; ой; ой; ую; ой; ой; ое; ого; ому; oe; ым; ом; ые; ых; ым; ые; ыми; ых о; а; у; о; ом; е; а;?; ам; а; ами; ах … Для введення нового слова, крім його перекладу вказується і код парадигматичного класу, що відповідає перекладному еквіваленту, якщо перекладів декілька, то для кожного перекладного еквіваленту вказується код парадигматичного класу. Так словникова стаття до англійського слова "marriage" буде мати такий вигляд: marriage брак 5 замужество 7 женитьба 2 свадьба 4 брачный 6 Основним недоліком підсистем ведення перекладних словників є певна складність їх поповнення новими словами, оскільки вони розраховані на фахівця-лінгвіста, а не на кінцевого користувача. Тому, як правило, такі словники є закритими для користувача (що притаманно всім перекладачам, що працюють в режимі он-лайн), а значить їх не можливо користувачеві налагодити під свою вузьку предметну галузь. Загальним недоліком розглянутих портативних перекладачів, в яких застосовуються способи інтегрального кодування лексико-граматичної інформації і є інтегральне представлення знань про світ (реалії навколишнього світу, представлені словами або словосполученнями) та знань про мову (закономірності словозмінення в тій чи іншій мові). Задачею корисної моделі є створення портативного перекладача з меншими габаритами для машинного перекладу з можливістю підтримки перекладу в ручному режимі, розширення можливостей системи ведення електронних перекладних словників, а саме формування трансцендентних словників (наприклад, якщо є російсько-англійський і російсько-український словники, тоді є можливість сформувати автоматично англо-український словник). Поставлена задача вирішується тим, що портативний перекладач, згідно з корисною моделлю, містить мікрофон 1, приєднаний до аналого-цифрового перетворювача 2, який з'єднаний з процесором цифрової обробки сигналу 4, до якого підключені мікроконтролер 3, аналого-цифровий перетворювач 2, цифро-аналоговий перетворювач 6, енергонезалежну пам'ять 5, до якої приєднаний мікроконтролер 3, кнопки включення живлення 7, кнопки керування введенням усномовного сигналу для перекладу 8, засоби індикації 9, динамік 10, вихід для з'єднання диктофона з комп'ютером 11 та акумулятор 12. Використання у портативному перекладачеві нових словників, точніше їх організація, відокремлення інформаційного забезпечення (знання про світ) від лінгвістичного (знання про мову) надає можливість використати менший об'єм пам'яті (зрозуміло, що пам'ять можна виконати з меншими розмірами), отже і створити менші розміри перекладача. На кресленні зображено структурну схему портативного перекладача, в якому реалізований спосіб усномовного перекладу; Приклад реалізації: Портативний перекладач складається з наступних частин: 1 - мікрофона; 2 - аналого-цифрового перетворювача; 2 UA 107670 U 5 10 15 20 25 30 3 - мікроконтролера; 4 - процесора цифрової обробки сигналів; 5 - енергонезалежної пам'яті; 6 - цифро-аналогового перетворювача; 7 - кнопки включення живлення; 8 - кнопки керування введенням усномовного сигналу для перекладу; 9 - двох світлових індикаторів; 10 - динаміка; 11 - виходу для з'єднання диктофона з комп'ютером; 12 - акумулятора. Пристрій працює таким чином. Введення усномовних слів та словосполучень активується натисненням кнопки керування введенням усномовного сигналу. Введення усномовного сигналу полягає в тому, що звуковий сигнал, який з мікрофона 1 надходить в аналого-цифровий перетворювач 2, оцифровується і подається в процесор 4 цифрової обробки сигналу, починає сприйматися ним як послідовність звукових відліків, які починають поділятися на блоки даних, оброблятися, перетворюватися на вектори параметрів та розпізнаватися. Результатом розпізнавання можуть бути переклад або відмова від розпізнавання (наприклад, якщо слово або словосполучення відсутнє в словнику транскрипцій). В залежності віл результату розпізнавання, процесор 4 генерує сигнал мікроконтролера 3, який вибирає за заданим алгоритмом слово або словосполучення для озвучення та викликає його із енергонезалежної пам'яті 5. Слово або словосполучення для озвучення подається в процесор 4, декодується в прийнятну для озвучення форму, надходить в цифро-аналоговий перетворювач 6 та озвучується в динаміку 10. Світлові індикатори 9 індексують режими, в яких працює пристрій: очікування, перекладу, озвучення, з'єднання з персональним комп'ютером тощо. Для розширення або зміни набору фраз для розпізнавання користувач має змінити файл словника транскрипцій, який зберігається в пам'яті портативного перекладача. В нашому випадку словник формується: Компоненти інформаційного забезпечення перекладних електронних словників представляються у форматі, близькому до друкованих примірників двомовних словників. Словникова стаття включає слово або словосполучення та його перекладні еквіваленти, наприклад: marriage marriage marriage marriage marriage 35 40 45 50 брак замужество женитьба свадьба брачный Компоненти лінгвістичного забезпечення представляють словозмінні моделі вхідної мови та мови-перекладу, які представлені словником, що синтезує початкові форми слів безпосередньо за текстом, та словником що синтезує парадигму слова, за його початковою формою не прив'язуючись до конкретного слова, а описуючи закономірності словозмінення за кінцевою послідовністю букв, що однозначно дає змогу визначити парадигматичний клас. Лематизаційний словник (тобто словник, що приводить словоформу до початкової форми) представляється у такому форматі: Поле 1. Кінцева послідовність букв, що однозначно визначає словозмінні граматичні характеристики словоформи (частина мови, рід, число). Поле 2. Кінцева послідовність букв, що однозначно визначає початкову форму слова. Наприклад, для російського слова полка буде така словникова стаття: Поле 1 Поле 2 лка 1*11/1*21 1*21: лка/1*11: лк Де лка - кінцева послідовність букв словоформи в тексті, 1 - код лексико-граматичного класу (в даному випадку 1 - іменник), знак * відокремлює код лексико-граматичного класу від кодів граматичної інформації (1-ша позиція рід, де 1 означає чоловічий рід, а 2 - жіночий; 2-га позиція означає число, де 1 означає однина). Алгоритм лематизації працює наступним чином: 1. Від словоформи з тексту відкидається послідовність букв, що співпала із послідовністю з поля 1. 2. В залежності від того, яка лексико-граматична інформація проявилася в тексті додається послідовність букв з поля 2. 3 UA 107670 U 5 10 15 20 Так, для словоформи полка алгоритм, в залежності від контексту сформує або початкову форму полка або - полк. Демонстрація на прикладі не означає, що дана словникова стаття підійде тільки для однієї словоформи. Послідовність кінцевих букв добирається таким чином, що під дану словникову статтю підпадають всі слова, що закінчуються лка. Для російської мови це близько 400 іменників жіночого роду (прялка, палка, кобылка тощо) та 10 іменників чоловічого роду (волка, шелка, катафалка тощо), які описуються лише однією словниковою статтею [Злизняк А.А. Грамматический словарь русского языка. Словоизменение. Около 100 000 слов. - М.: "Русский язык", 1977]. З урахуванням чергування голосних і приголосних, біглих голосних для російської та української мов лематизаційний словник складає близько 1 тис. сл. статей, що у тричі перевищує кількість парадигматичних класів. Перевагою даного лематизаційного словника є те, що він здатний синтезувати для нові для перекладного словника слова, оскільки синтез відбувається на основі словозмінних закономірностей в мові, а не на основі заданих слів. Наступна важлива функція для систем машинного перекладу - це синтез всіх можливих форм слова, представленого у перекладному словнику, засобами вихідної мови. Ця функція потрібна для перекладу фраз і тексту в цілому. Цю функцію забезпечує парадигматичний словник, який також належить до компоненти лінгвістичного забезпечення, і реалізує синтез словоформ за початковою формою слова на основі кінцевої послідовності букв. Парадигматичний словник має такий формат словникової статті. Поле 1: кінцева послідовність букв, що визначає слово у початковій формі з відповідною лексико-граматичною інформацією (частина мови, рід число, істотність, вид) Поле 2: кінцеві послідовності букв, що генерують всі форми слова. Поле 1 -лка 1*200000000 -лк 1*1000000001 -лк 1*1000000002 -ый 2*0000000001 -ый 2*1000000002 -влять 10*000020000 25 30 35 40 45 Поле 2 лка/лки/лке/лку/лкой/лке/лки/лок/лкам/лки/лками/лках лк/лка/лку/лк/лком/лку/лки/лков/лкам/лки/лками/лках лк/лка/лку/лка/лком/лке/лки/лков/лкам/лков/лками/лках ып/ого/ому/ый/ым/ол4/ая/ой/ой/ую/ой/ой/ое/ого/ому/ое/ым/ом/ые/ых/ым/ыс ыми/ых ый/ого/ому/ого/ым/ом/ые/ых/ым/ых/ыми/ых 8*влял/вляла/вляло/вляли!9*вляю/вляешь/вляет/вляем/вляете/вляют! вляй/вляйте!12* вляющ#ий/вляєм#ий!13*вляя! 11 * Алгоритм автоматичного формування парадигми працює аналогічно алгоритму лематизації: від слова відкидається кінцева послідовність букв, яка співпала із послідовністю букв в полі 1, і додається послідовність букв необхідної словоформи. Квазіфлексії парадигми подаються через знак «/». Прийняті такі домовленості: квазіфлексії іменників (1*) записуються в такому порядку: спочатку відмінювання в однині називний відмінок, родовий, давальний, знахідний, орудний, місцевий; потім відмінювання в множині (всього 12 позицій); квазіфлексії прикметників (2*) записуються в такому порядку: спочатку відмінювання в однині за родами (чоловічий, жіночий, середній) і відмінками (називний, родовий, давальний, знахідний, орудний, місцевий), потім - у множині за відмінками (всього 24 позиції); квазіфлексії форм дієслова (10*) записуються в такому порядку: спочатку форми особового дієслова минулого часу (8*) однини за родами (чоловічий, жіночий, середній) та множини; потім форми особового дієслова не минулого часу (9*) за ознаками особи і часу: 1-а особа однини, 2особа однини, 3 особа однини, 1-а особа множини, 2-особа множини, 3 особа множини; форми дієслова наказового способу (11*) однини і множини; форми дієприкметника (12*): початкові форми за ознакою стан: активний, пасивний. Оскільки дієприкметники ще змінюються за відмінком і числом, то знак # означає, що послідовність букв після # знову запускається на парадигматичну таблицю і форми слова генеруються у відповідності з прикметником. Додаткові функції підсистеми ведення перекладних електронних словників Перекладні електронні словники призначені перш за все для підтримки процесу перекладу, тому повнота і адекватність перекладних еквівалентів у словнику є важливими критеріями їх якості. Запропонований портативний перекладач за допомогою організації електронних 4 UA 107670 U 5 10 15 20 25 30 перекладних словників дозволяє зробити словник відкритим для кінцевого користувача, а значить налаштовувати його безпосередньо під власні потреби. Функція налаштування на предметну область дозволяє користувачеві досить легко корегувати перекладні еквіваленти відповідно до його предметної області. Структура словника містить лише слово (словосполучення) і множину перекладних еквівалентів, які не супроводжуються лексикографічною інформацією, що є важливим для непідготовленого користувача. У порівнянні: на введення 1 словникової статті у відомих підсистемах ведення словників (Stylus, PARS) відводиться до 4 хв. В нашій підсистемі введення 1 словникової статті займає менше 1 хв. Крім того, запропонований спосіб дозволяє автоматизований пошук нових слів за текстом. Всі слова в тексті автоматично приводяться до початкової форми за лематизаційним словником і перевіряються на наявність у перекладному електронному словнику. Слова, для яких відсутні перекладні еквіваленти, видаються користувачеві. Це зручна функція при налаштуванні системи машинного перекладу на спеціалізовану предметну область (виявлення нових термінів, понять тощо), в якій буде постійно працювати користувач. Така функція в існуючих перекладних електронних словниках відсутня. Функція автоматизованого розширення мов перекладу. Окреме зберігання граматичної інформації від перекладних еквівалентів дозволяє реалізувати такі функції як автоматичне укладання зворотних перекладних словників і транзитивних перекладних словників. Перша задача формально зводиться до наступного. Нехай ми маємо англо-російський перекладний електронний словник, він підтримує переклад англомовних текстів російською мовою. Для зміни напряму перекладу (тобто російськомовних англійською мовою) потрібен російсько-англійський словник. При запропонованому способі організації функція побудови зворотних словників реалізується автоматично. Достовірність нового словника складає близько 85 %. Побудова транзитивних перекладних словників. Нехай ми маємо англо-російський та російсько-український перекладні електронні словники. Реалізуючи функцію транзитивності, автоматично можна побудувати англо-український словник. Достовірність нового словника складає близько 60 %. Таким чином, маючи всього два перекладних електронних словника (англо-російський і українсько-російський) можна автоматично побудувати ще 4 перекладні електронні словники. На сьогодні такі функції взагалі не передбачені в існуючих перекладних електронних словниках. ФОРМУЛА КОРИСНОЇ МОДЕЛІ 35 40 Портативний перекладач, який відрізняється тим, що містить мікрофон, приєднаний до аналого-цифрового перетворювача, який з'єднаний з процесором цифрової обробки сигналу, до якого підключені мікроконтролер, аналого-цифровий перетворювач, цифро-аналоговий перетворювач, енергонезалежна пам'ять, до якої приєднаний мікроконтролер, кнопку включення живлення, кнопку керування введенням усномовного сигналу для перекладу, засоби індикації, динамік, вихід для з'єднання диктофона з комп'ютером та акумулятор. 5 UA 107670 U Комп’ютерна верстка О. Гергіль Державна служба інтелектуальної власності України, вул. Василя Липківського, 45, м. Київ, МСП, 03680, Україна ДП “Український інститут інтелектуальної власності”, вул. Глазунова, 1, м. Київ – 42, 01601 6

Дивитися

Додаткова інформація

МПК / Мітки

МПК: G06F 17/28

Мітки: перекладач, портативний

Код посилання

<a href="https://ua.patents.su/8-107670-portativnijj-perekladach.html" target="_blank" rel="follow" title="База патентів України">Портативний перекладач</a>

Подібні патенти