Спосіб адаптивного контекстно-граматичного стискання текстових повідомлень

Номер патенту: 90653

Опубліковано: 25.05.2010

Автори: Чернега Віктор Степанович, Ісаєва Олеся Володимирівна

Завантажити PDF файл.

Формула / Реферат

Спосіб адаптивного контекстно-граматичного стискання текстових повідомлень, заснований на підрахунку на кожному кроці стискання кількості появи символів у вхідному тексту, зв'язаних з поточними контекстами різних порядків, обчисленні сумарних оцінок імовірностей появи символів у відповідних контекстах, наступного множення цих оцінок на вагові коефіцієнти відповідних контекстів та присвоєнні символам тексту кодових комбінацій у відповідності з їх імовірностями, який відрізняється тим, що в кодері та декодері додатково розміщують таблиці, в яких занесені афіксальні морфеми та характерні морфологічні частини разом із їхніми ваговими коефіцієнтами для української, російської, англійської мов, підраховують у вхідному тексті, який стискають, кількість одноіменних символів і обчислюють оцінки імовірностей їх появи, виділяють у вхідному тексті групи символів розміром не більше 5-ти символів, які обмежені зліва, справа або з обох сторін знаками пропуску, порівнюють їх з морфологічними частинами, що знаходяться в таблицях відповідних мовам текстових повідомлень, визначають по співпадінню належність вхідного повідомлення конкретній мові, вибирають із відповідній мові таблиці вагові коефіцієнти морфологічних частин і коректують оцінки імовірностей символів.

Текст

Спосіб адаптивного контекстно-граматичного стискання текстових повідомлень, заснований на підрахунку на кожному кроці стискання кількості появи символів у вхідному тексту, зв'язаних з по C2 2 (19) 1 3 чного символу оцінюється з урахуванням О попередні символів, то така модель називається моделлю О-го порядку. У кращому, на дійсний час, способі стискання на основі контекстного моделювання [Bell Т. Modeling for Text Compression / T. Bell, I.H. Witten, J.G. Cleary // ACM Computing Surveys. - 1989, Vol.21, No.4, P.557-591], узятому як прототип, використовується контекстно-змішана оцінка імовірності поточного символу Φ алфавіту А. Даний спосіб стискання текстових повідомлень заснований на підрахунку на кожнім кроці стискання кількості появи символів, зв'язаних з поточними контекстами різних порядків, обчисленні сумарних оцінок імовірностей появи символів у відповідних контекстах, наступному множенні цих оцінок на вагові коефіцієнти відповідних контекстів і присвоєння символам тексту кодових комбінацій відповідно до їхніх імовірностей. Відповідно до цього способу обчислюються імовірності появи символу Φ за умови попередніх О символів Р(О,Ф). Кожній імовірності контексту О присвоюється ваговий коефіцієнт w(O)

Дивитися

Додаткова інформація

Назва патенту англійською

Method for adaptive contextual-grammatical compression of text messages

Автори англійською

Cherneha Viktor Stepanovych, Isaeiva Olesia Volodymyrivna

Назва патенту російською

Способ адаптивного контекстно-грамматического сжатия текстовых сообщений

Автори російською

Чернега Виктор Степанович, Исаева Олеся Владимировна

МПК / Мітки

МПК: G10L 19/00, H03M 7/30, G06F 11/00

Мітки: контекстно-граматичного, стискання, текстових, спосіб, адаптивного, повідомлень

Код посилання

<a href="https://ua.patents.su/3-90653-sposib-adaptivnogo-kontekstno-gramatichnogo-stiskannya-tekstovikh-povidomlen.html" target="_blank" rel="follow" title="База патентів України">Спосіб адаптивного контекстно-граматичного стискання текстових повідомлень</a>

Подібні патенти