Порхун Олена Володимирівна. Автоматична класифікація багатовимірних об'єктів із застосуванням апарату нейронних мереж : Дис... канд. наук: 01.05.01 - 2009.
Анотація до роботи:
Порхун О. В. Автоматична класифікація багатовимірних об’єктів із застосуванням нейронних мереж. – Рукопис.
Дисертація на здобуття наукового ступеня кандидата фізико-математичних наук за спеціальністю 01.05.01 – теоретичні основи інформатики та кібернетики. – Київський національний університет імені Тараса Шевченка, Київ, 2009.
Дисертація присвячена дослідженню проблеми автоматичної класифікації багатовимірних об’єктів, розробці нових методів та алгоритмів для вирішення ключових проблем, які виникають при класифікації та кластеризації об’єктів, представлених числовими ознаками.
Запропоновано метод для визначення числа кластерів при кластеризації корпусу об’єктів нейронною мережею Кохонена із застосуванням критерію якості отриманих розбиттів та методу ідеальної точки. Запропоновано метод побудови вектора ознак, що розподілені по різнорідним групам, для класифікації об'єктів. Розроблено алгоритм пошуку оптимальної вибірки для класифікації об'єктів, представлених набором ознак, розподілених по різнорідним групам. Встановлено та обґрунтовано оцінки складності алгоритму пошуку оптимальної вибірки із врахуванням випадків наявності у вибірці прикладів з нерівномірним розподілом груп ознак. Із застосуванням нейронної мережі прямого розповсюдження та запропонованого методу побудови вектора ознак розроблено автоматичну систему класифікації текстів. Розроблено автоматичну систему кластеризації текстів з використанням запропонованого методу визначення числа кластерів. Застосовано автоматичні системи класифікації та кластеризації текстів для вирішення задач атрибуції художніх творів. Розроблені системи виявилися ефективними для класифікації великих масивів текстів значних об’ємів.
Головним результатом дисертації є розробка і дослідження нових методів, які розв’язують практично значимі завдання класифікації та кластеризації багатовимірних об’єктів і мають істотне значення для теорії і практики розробки програмного забезпечення у галузях людської діяльності, що пов'язані з інформаційним пошуком, систематизацією та структуризацією інформації.
В роботі поставлено та вирішено такі завдання:
Запропоновано метод визначення числа кластерів при кластеризації корпусу об'єктів із застосуванням нейронної мережі Кохонена, критерію якості отриманих кластерів та методу ідеальної точки. Розроблено автоматичну систему кластеризації текстів Clasterizator з використанням запропонованого методу визначення числа кластерів.
Запропоновано метод побудови вектора ознак об'єкту із врахуванням випадків їх розподілу по різнорідним групам. Розроблено автоматичну систему класифікації текстів Atributer на основі виділеного набору ознак із застосуванням нейронної мережі прямого розповсюдження та даного методу побудови вектора ознак.
Розроблено алгоритм пошуку оптимальної вибірки для побудови вектора ознак при класифікації багатовимірних об'єктів. Встановлено та обґрунтовано оцінки складності даного алгоритму із врахуванням випадків наявності у вибірці прикладів з нерівномірним розподілом груп ознак.
Застосовано розроблені автоматичні системи Atributer та Clasterizator для вирішення задач атрибуції художніх творів. Запропоновано метод визначення зв’язку між іменником та описовими характеристиками (прикметником, дієприкметником та дієприслівником), які йому співставляються, для аналізу творів, що підлягають атрибуції.
Публікації автора:
Порхун О.В. Методи та алгоритми для розв’язання задач класифікації // Вісник Київського університету. Серія фіз.-мат. наук. – 2005. – №1. – С. 212-220.
Порхун О.В. Побудова параметричного простору в задачах атрибуції текстів. Метод формування вхідного вектору для розпізнавання стилю тексту нейронною мережею // Вісник Київського університету. Серія фіз.-мат. наук. – 2005. – №4. – С. 207-212.
Анисимов А.В., Порхун Е.В., Тарануха В.Ю. Алгоритм формирования параметрического вектора для решения задач классификации нейронной сетью прямого распространения // Кибернетика и системный анализ. – 2007. – №2. – C. 3-14.
Анисимова Е.А., Порхун Е.В., Тарануха В.Ю. Информационные технологии обработки документов, представленных в виде текстов на естественном языке. Возможности применения WORDNET и нейронных сетей // Матеріали міжнародної конференції з автоматичного управління “Автоматика – 2006”. – Вінниця, 2006. – С. 344.
Порхун Е.В., Тарануха В.Ю. Применение WORDNET и нейронных сетей в создании интеллектуальных систем обработки текстов на естественном языке // Матеріали міжнародної конференції TAAPSD’2006 “Теоретичні та прикладні аспекти побудови програмних систем”. – Київ, 2006. – С. 183-186.
Порхун Е.В. Разработка автоматической системы классификации текстов с применением аппарата нейронных сетей // Матеріали міжнародної наукової конференції MegaLing’2007 “Горизонти прикладної лінгвістики та лінгвістичних технологій”. – Крим, Партеніт, 2007. – С. 283-285.