Парамонов Антона Іванович. Інтерпретація текстової інформації на основі нечітких концептуальних моделей : Дис... канд. наук: 05.13.06 - 2009.
Анотація до роботи:
Парамонов А.І. Інтерпретація текстової інформації на основі нечітких концептуальних моделей. – Рукопис.
Дисертація на здобуття наукового ступеня кандидата технічних наук зі спеціальності 05.13.06 – «Інформаційні технології». – Донецький національний університет, Донецьк, 2008.
У дисертації зроблено огляд сучасного стану проблеми автоматизації бізнес-процесів, виділено основні напрями її рішення та обґрунтовано її актуальність. Здійснено огляд сучасних інформаційно-пошукових систем, форматів представлення інформації в мережах і служб їх обробки. Наведено критерії оцінки результатів роботи пошукових систем. Зроблено огляд стану проблеми розуміння природно-мовних текстів. На підставі відомостей з когнітивної психології розроблено нечітку гібридну модель представлення знань. Розроблено метод інтерпретації текстової інформації на основі нечіткої концептуальної моделі. Введено нечітку характеристику мереж моделі – активність, на базі формалізованої когнітивної моделі логогену Мортона. Етап концептуального аналізу побудований на основі моделі активності мереж, згідно з якою смисл тексту формується з урахуванням трьох складових. Формалізовано механізм міркувань на основі досвіду у вигляді моделі інтерпретації тексту. Описано технологію побудови автоматизованих систем інтерпретації тексту та методика побудови баз знань. Запропоновано організацію, реалізацію та оцінку автоматизованих систем інтерпретації тексту.
У дисертаційній роботі запропоновано нове рішення актуальної проблеми пошуку в інформаційних системах і набули подальший розвиток автоматизовані системи інтерпретації тексту. Основні результати роботи сформульовано таким чином.
Проведений огляд форматів представлення інформації в мережі Інтернет і додатків, які працюють з мережевими ресурсами, показав неузгодженість цих форматів, що значно ускладнює процес автоматичної обробки текстової інформації. Для вирішення цього питання запропоновано використовувати єдиний формат RSS, побудований на основі XML, що став фактично стандартом для зберігання, передачі і обробки динамічної інформації.
Проведений аналіз сучасних систем пошуку виявив наступні недоліки:
– індексний пошук, по-перше, не забезпечує достатнього рівня показників релевантності і пертинентності, по-друге, не дозволяє ефективно працювати з динамічним контентом, що ускладнює використання його для автоматизації бізнес-процесів, по-третє, велика роль в отриманні результатів покладається на користувача;
– існуючі інтелектуальні системи, по-перше, інтегруються з пошуковими системами за ключем, що в результаті знижує показник релевантності; по-друге, механізми самонавчання систем слабо автоматизуються, по-третє, підходи до інтелектуального пошуку не дозволяють інтегрувати різні аспекти проблеми розуміння ПМ текстів у єдину модель.
Одним із шляхів подолання вказаних недоліків є розробка інтелектуальної пошукової системи, яка інтегрує різні моделі когнітивної психології в єдину концептуальну модель представлення знань і комплексно використовує її під час інтерпретації.
Показано можливість формалізації концептуальної нечіткої гібридної моделі представлення знань на основі апарату нечітких множин. Це дозволяє автоматизувати інформаційні процеси, що моделюють людське мислення, а також врахувати індивідуальні знання про оточення і неявні знання, що містяться в текстових фрагментах.
Запропоновано інтерпретацію тексту розбити на етапи, які включають термінологічний, фразеологічний і концептуальний аналізи, що дозволяє автономно та незалежно формалізувати перебування тексту на різних етапах обробки
Етап концептуального аналізу побудований на основі моделі активності мереж, згідно з якою смисл тексту формується з урахуванням аналізованого фрагменту тексту, пам'яті і контексту. Це дозволило враховувати смислову зв'язність тексту і локалізацію знань у ньому під час побудови контексту. В основу моделі активності мережі покладена формалізована когнітивна модель логогену Мортона, адаптована для обробки тексту, на підставі НГМ.
Показано, що інтерпретацію тексту на основі нечіткої гібридної моделі представлення знань та моделі активності мереж можливо розглядати як формалізований механізм міркування на основі досвіду.
Приховані знання (неявні знання або смисл), здобуті шляхом висновку на основі досвіду, можуть бути використані як факти в нечітких продукційних системах. Це дозволяє, по-перше, інтегрувати на загальній математичній платформі два механізми висновку (висновок на основі прихованих і висновок на основі поверхових знань), а, по-друге, розширити область інтерпретації тексту, і, як наслідок, приймати рішення з більшим ступенем упевненості при використанні в автоматизованих системах категоризації, анотації, а також в ІПС.
Метод й моделі представлення та інтерпретації інформації реалізовані у вигляді бібліотеки процедур, яка дозволяє компонувати на її основі ядро АСІТ – автоматизовану систему категоризації та інтерпретації текстової інформації «Text-Term-Concept» – і налаштовувати на конкретний додаток шляхом формування інтенсіональної частини ГМ. Система використана для розробки інтелектуальної ІПС, яка пройшла дослідну експлуатацію на сайті Донецького національного університету.
АСІТ у вигляді інтелектуальної ІПС «ENewsAnalyzer» упроваджена на підприємстві ТОВ «УФС». За наслідками дослідної експлуатації системи «ENewsAnalyzer», до складу якої входить модуль отримання знань «SemanticExpert», модуль автоматизованого збору і передобробки фінансових даних «Intelligent MailAgent», модуль інтерпретації текстової інформації та формування даних для продукційних правил «TC», отримана оцінка ефективності розробленого методу й моделей: обсяг актуальної (необхідної) для прийняття рішення інформації зростає від 20% до 65%.
Публікації автора:
Парамонов А.И. Представление знаний гибридной моделью для систем интеллектуального поиска // Вісник Донецького національного університету – 2005. – Серія А, №1. – С. 404-409.
Парамонов А.И. Интеллектуальная поисковая система «ENewsAnalyzer» // Штучний Інтелект. – ІПШІ МОН і НАН України «Наука і освіта», 2006. – №3/2006. – С. 203-213.
Парамонов А.И., Каргин А.А., Ломонос Я.Г. Интеллектуальная система категоризации и интерпретации текстовой информации «Text-Term-Concept» // Збірка наукових праць «Моделювання та керування станом еколого-економічних систем регіону», Випуск №3 – Національна Академія Наук України, МННЦ ІТС, 2006. – С. 122-131.
Парамонов А.И. Об одном подходе к формированию базы знаний // Наукові праці Донецького національного технічного університету, Серія: «Обчислювальна техніка та автоматизація», Випуск 13 (121) – Донецьк: ДонНТУ, 2007. – С. 153-160.
Парамонов А.И. Интенсиональные представления в виде нечеткой гибридной модели знаний // Штучний Інтелект. – ІПШІ МОН і НАН України «Наука і освіта», 2008. – №3/2008. – С. 605-611.
Paramonov A.I., Kargin A.A. Intellectual Search Systems Based on the Model of Natural Language Understanding // Proceedings of the Third IEEE Workshop on «IDAACS`2005» – Sofia, Bulgaria, 2005. – P. 150-154.
Парамонов А.И., Каргин А.А. Гибридная нечеткая модель обработки концептуальной информации // Збірка наукових праць V міжнародної конференції «Інтелектуальний аналіз інформації» – Київ, 2005. – С. 234-241.
Каргин А.А., Ломонос Я.Г., Парамонов А.И. Интеллектуальная система категоризации и интерпретации текстовой информации «Text-Term-Concept» // Збірка наукових праць VII міжнародної наукової конференції «Інтелектуальний аналіз інформації» – Київ, 2007. – С. 140-149.
Парамонов А.И. Об одном подходе к построению модели контекста // Материалы IX Международной конференции “Интеллектуальные системы и компьютерные науки”, Том 2, Часть 2. – М.: Изд-во механико-математического факультета МГУ, 2006. – С. 224-225.
Парамонов А.И. Автоматизированная система сбора новостных лент «Intelligent Mail Agent» // Материалы международной научной конференции «Интеллектуальные системы принятия решений и проблемы вычислительного интеллекта», ISDMCI`2008 (19-23 мая 2008 г.) – Евпатория: Видавництво Херсонського національного технічного університету, 2008. – С. 54-57.
Парамонов А.И., Каргин А.А., Ломонос Я.Г. Интеллектуальная система категоризации и интерпретации текстовой информации «Text-Term-Concept» // Збірка наукових праць міжнародної наукової конференції «Інтелектуальні системи прийняття рішень та прикладні аспекти інформаційних технологій», Том 1 – Євпаторія: Видавництво Херсонського морського інституту, 2006. – С. 92-99.
Парамонов А.И. Hybrid model of representation of knowledge for intellectual search systems on the Internet // Сборник докладов и тезисов II-го Международного молодежного форума «Информационные технологии в XXI веке» (27-28 апреля 2004 г.) – Днепропетровск, 2004. – С. 135-136.
Парамонов А.И. Модель обработки текстовой информации // Сборник трудов четвертой международной научно-практической конференции «Современные информационные и электронные технологии» (23-27 мая 2005 г.) – Одесса, 2005. – С. 178.
Каргин А.А., Парамонов А.И. Гибридная модель представления знаний // Сборник трудов четвертой международной научно-практической конференции «Современные информационные и электронные технологии» (17-21 мая 2004 г.) – Одесса, 2004. – С. 72.
Каргин А.А., Парамонов А.И., Жозе П.Р. Интеллектуальная система принятия решений на рынке финансовых инструментов в среде интернет // Сборник трудов четвертой международной научно-практической конференции «Современные информационные и электронные технологии» (19-23 мая 2003 г.) – Одесса, 2003. – С. 100.
Каргин А.А., Петренко Т.Г., Парамонов А.И. Нечеткие модели в задачах интерпретации финансовых данных // Збірник «Інформаційно-керуючи системи на залізничному транспорті» – Харьків: ХарДАЗТ, Додаток до журналу № 4,5, 2002. – С. 35.
Парамонов А.І. Про один підхід до моделювання процессу розуміння тексту // Тези доповідей сьомої всеукраїнської (другої міжнародної) студентської наукової конференції з прикладної математики та інформатики «СНКПМІ-2004» (22-23 квітня 2004 р.) – Львів, 2004. – С. 29-30.
Каргин А.А., Петренко Т.Г., Парамонов А.И. Гибридная модель представления и извлечения знаний // Збірник «Інформаційно-керуючи системи на залізничному транспорті» – Харьків: ХарДАЗТ, Додаток до журналу № 4,5, 2004. – С. 103-104.
Каргин А.А., Ломонос Я.Г., Парамонов А.И. Интеллектуальные поисковые системы в администрировании информационных ресурсов корпоративной сети ДонНУ // Сборник докладов международной научно-практической конференции «Единое информационное пространство-2004» – Днепропетровск: УГХТУ, 2004. – С. 9-12.