Библиотека диссертаций Украины Полная информационная поддержка
по диссертациям Украины
  Подробная информация Каталог диссертаций Авторам Отзывы
Служба поддержки




Я ищу:
Головна / Технічні науки / Автоматизовані системи управління та прогресивні інформаційні технології


Дорошенко Анастасія Володимирівна. Методи та інформаційні технології класифікації для завдань видобування даних : Дис... канд. наук: 05.13.06 - 2008.



Анотація до роботи:

Дорошенко А.В. Методи та інформаційні технології класифікації для завдань видобування даних. – Рукопис.

Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06 – Інформаційні технології. – Національний університет ”Львівська політехніка”, Львів, 2008.

В дисертації вирішується актуальна науково-прикладна задача – розроблення методів та інформаційних технологій класифікації для завдань видобування даних на основі моделі геометричних перетворень.

В дисертаційній роботі з метою врахування такої особливості задач видобування даних, як різна вага помилок під час класифікації, розроблено метод та інформаційну технологію класифікації на основі правила „переможець забирає все” (WTA) з використанням матриці штрафів та заохочень, що надає можливість враховувати неоднакову вагу помилок при розпізнаванні об’єктів різних класів. Розроблено метод кускової побудови розділяючих поверхонь на основі дерева поділу на класи, що забезпечує підвищення точності розпізнавання об’єктів, для яких в заданому просторі реалізацій не виконується гіпотеза компактності. Запропоновано, досліджено і реалізовано метод послідовного вирівнювання тренувальної вибірки по кластерах, що формуються у вузлах дерева, який забезпечує покращання точності розв’язання задач класифікації для вибірок, представлених в просторі реалізацій нерівномірно. Вдосконалено метод навчання нейроподібних структур моделі геометричних перетворень доповненням його процедурою оптимізації методом імітації відпалу металу за параметрами головних компонентів, що дало змогу покращити якість класифікації завдяки використанню інших, окрім середньоквадратичного, критеріїв якості. Розроблено та застосовано програмні скрипти мовою Python, які виконують передобробку даних та реалізують розроблені метод вирівнювання вибірки, метод штрафів і заохочень та кусковий метод побудови розділяючих поверхонь. Створено інформаційні технології на основі розроблених методів, які застосовано для задач електронної комерції. Наведено результати проведених експериментів, які свідчать про ефективність застосованих методів.

У дисертаційній роботі розв’язано актуальну наукову задачу вдосконалення існуючих та розроблення нових ефективних методів та інформаційних технологій класифікації для задач видобування даних. При цьому отримано такі основні результати:

  1. Проведено аналітичний огляд існуючих методів класифікації. Проаналізовано їх ефективність для розв’язання задач видобування даних. Встановлено переваги та перспективність застосування моделі геометричних перетворень для розв’язання задач великої розмірності.

  2. Вперше для нейроподібних структур моделі геометричних перетворень розроблено метод класифікації на основі правила „переможець забирає все” з використанням матриці штрафів та заохочень, що надає можливість враховувати неоднакову вагу помилок при розпізнаванні об’єктів різних класів.

  3. Вперше для нейроподібних структур моделі геометричних перетворень розроблено метод кускової побудови розділяючих поверхонь на основі дерева поділу на класи, що забезпечує підвищення точності розпізнавання об’єктів, для яких в заданому просторі реалізацій не виконується гіпотеза компактності.

  4. Вперше запропоновано, досліджено і реалізовано метод послідовного вирівнювання тренувальної вибірки по кластерах, що формуються у вузлах дерева, який забезпечує покращання точності розв’язання задач класифікації для вибірок, представлених в просторі реалізацій нерівномірно.

  5. Вдосконалено метод навчання нейроподібних структур моделі геометричних перетворень доповненням його процедурою оптимізації методом імітації відпалу металу за параметрами головних компонентів, що дало змогу покращити якість класифікації завдяки використанню інших, окрім середньоквадратичного, критеріїв якості.

  6. Розроблено та застосовано інформаційні технології на базі програмних скриптів мовою Python, які виконують передобробку даних та реалізують розроблені метод вирівнювання вибірки, метод штрафів і заохочень та кусковий метод побудови розділяючих поверхонь.

  7. Розроблені інформаційні технології прийняття рішень для завдань електронної комерції (класифікація клієнтів, виявлення шахраїв, класифікація лотів Інтернет-аукціону eBuy)дозволили підвищити ефективність розв’язання задач видобування даних великих розмірностей (порядку сотні атрибутів), представлених тренувальними вибірками значних обсягів (десятки тисяч векторів) в умовах, коли в заданому просторі реалізації не виконується гіпотеза компактності.

  8. Застосування розроблених методів налагодження та оптимізації нейроподібних структур і програмних продуктів на їх основі в задачах електронної комерції забезпечило підвищення точності класифікації в середньому на 2–7 %, а в окремих випадках на 10–20 % (від 85 до 95 % правильно класифікованих даних), скоротило час отримання розв’язків приблизно в 5 разів (з 60–120 до 10–30 секунд), що свідчить про ефективність застосованих методів.

Публікації автора:

  1. Дорошенко А.В. Нейромережний розв’язок задач класифікації в умовах неповноти інформаційного базису // Моделювання та керування станом еколого-економічних систем регіону. – 2006. – Вип.3. – С.114–122.

  2. Дорошенко А.В. Методи класифікації на основі моделі геометричних перетворень для завдань інтелектуального аналізу даних// Вісник Нац. ун-ту “Львівська політехніка”: Комп’ютерні науки та інформаційні технології. – 2007. – № 598. – С. 206 –213.

  3. Ткаченко Р.О., Дорошенко А.В. Нейромережні технології класифікації для систем інтелектуального аналізу даних // Відбір і обробка інформації. – 2006. – № 25 (101). – С. 109–115

  4. Ткаченко Р., Дорошенко А., Заграй А., Поліщук У. До проблеми класифікації в завданнях видобування даних// Вісник Нац. ун-ту “Львівська політехніка”: Комп’ютерні науки та інформаційні технології. – 2006. – № 565. – С.73–80.

  5. Ткаченко Р.О., Дорошенко А.В. База моделей на основі моделі геометричних перетворень для систем підтримки прийняття рішень // Комп'ютерні технології друкарства. – 2007. – № 17. – С. 21–28.

  6. Ткаченко Р.О., Дорошенко А.В. Вдосконалення нейромережних методів класифікації в завданнях інтелектуального аналізу даних за допомогою методу імітації відпалу металу // Вісник Нац. ун-ту “Львівська політехніка”: Комп’ютерні системи проектування. Теорія і практика. – 2007. – № 591. – С.33–37.

  7. Дорошенко А.В. Нейромережна інформаційна технологія для аналізу фінансової стійкості підприємств // Збірник матеріалів міжнародної наукової конференції ”Інтелектуальні системи прийняття рішень та прикладні аспекти інформаційних технологій” (ISDMIT’ 2005). – Т.5. – С.34–37.

  8. Дорошенко А.В. Нейромережна інформаційна технологія прогнозування й аналізу фінансових показників та економічного стану підприємств // Збірник матеріалів відкритої науково-технічної конференції молодих науковців і спеціалістів фізико-механічного інституту ім. Г.В. Карпенка НАН України (2005). – С.414–418.

  9. Дорошенко А.В. Нейромережна інформаційна технологія для аналізу фінансової стійкості підприємств // Збірник матеріалів міжнародної наукової конференції ”Інтелектуальні системи прийняття рішень та прикладні аспекти інформаційних технологій” (ISDMIT’ 2005). – Т.5. – С.34–37.

  10. Дорошенко А.В. Нейромережний розв’язок задач класифікації в умовах неповноти інформаційного базису // Збірник матеріалів міжнародної наукової конференції ”Інтелектуальні системи прийняття рішень та прикладні аспекти інформаційних технологій” (ISDMIT’ 2006). – Т.2. – С.203–206.

  11. Дорошенко А.В. Вдосконалення нейромережних методів класифікації в завданнях видобування даних за допомогою методу імітації відпалу металу // Збірник матеріалів міжнародної наукової конференції ”Інтелектуальні системи прийняття рішень та прикладні аспекти інформаційних технологій” (ISDMIT’ 2007). – Т.2. – С.203 – 206.

  12. Дорошенко А.В. Нейромережні методи класифікації на основі моделі геометричних перетворень для завдань інтелектуального аналізу даних // Збірник матеріалів ІІ Міжнародної наукової конференції ”Комп’ютерні науки та інформаційні технології” (CSIT’ 2007). – С.100 – 101.