У дисертаційній роботі наведене теоретичне узагальнення і нове вирішення науково-технічної задачі розробки методів генерації та оцінки логічних залежностей в даних у вигляді агрегованих асоціативних правил для систем формування знань з даних. Обґрунтованість й достовірність отриманих результатів, висновків й рекомендацій забезпечено коректним використанням методів математичної логіки, математичної статистики та теорії ймовірності, а також теорії ін-формації. В дисертації отримано наступні основні результати: 1. В результаті аналізу сучасного стану проблеми формування знань з даних визначено недоліки існуючих методів виявлення логічних правил в даних, а саме: встановлення асоціативних правил тільки для бінарних ознак та відсутність узагальненої характеристики для оцінки асоціації. Шляхом вирішення цих проблем є розробка методів генерації агрегованих асоціативних правил для дискретних небінарних ознак а також удосконалення методів оцінки отриманих залежностей. 2. Набув подальшого розвитку метод генерації агрегованих асоціативних правил в базах даних на основі об’єднання гілок дерева покрить. Це дозволяє знаходити асоціації для ознак об’єктів, що є небінарними величинами. Проведений порівняльний аналіз характеристик простих та агрегованих асоціативних правил показав, що агреговані асоціативні правила завжди мають більш високі показники рівня підтримки, а в деяких випадках й більш високі показники рівня довіри. Завдяки застосуванню розробленого методу ефективність пошуку асоціацій в базах даних підвищується. 3. Розроблений метод розрахунку характеристик агрегованих асоціативних правил дозволяє аналітично розраховувати характеристики узагальненої асоціації шляхом розкладання агрегованого асоціативного правила на прості. Суттєвою перевагою даного підходу є те, що для визначення характеристик агрегованих асоціативних правил не потребується додаткове сканування бази даних. Для обґрунтування методу сформульовано і доказано відповідні теореми. 4. Запропонований метод оцінки інформативності асоціації на основі стандартних характеристик асоціативного правила дозволяє завдати лінійний порядок в трьохмірному просторі Support-Confidence-Improvement і скоротити розмірність задачі оцінювання асоціації. Ця характеристика враховує всі загальноприйняті характеристики асоціативного правила та її обґрунтованість не викликає сумніву з теоретичної точки зору, так як в основі її побудови лежать фундаментальні принципи математичної теорії інформації. Інформаційна характеристика асоціації може використовуватися також для фільтрації отриманих асоціативних правил – відбракування залежностей, інформативність яких нижче за зазначений рівень. Це спрощує процес відбору й очистки отриманих правил. 5. Результати дисертаційної роботи впроваджені та довели свою ефективність при розробці алгоритмів обробки інформації в інтелектуальних базах даних автоматизованої системи управління електронними документами "Стандарти та нормативи" науково-дослідного інституту (акт реалізації ДП НДТІП від 05.06.2004 р.), а також при виявленні логічних залежностей в базах даних при проведенні науково-дослідної роботи "Дуель" Харківського військового університету (акт реалізації Наукового центру Військ ППО від 13.02.2004 р.). Результати дисертаційної роботи було використано в навчальному процесі Харківської академії культури під час проведення лекційних занять. Таким чином, проведені дослідження дозволяють вважати мету дослідження, яка полягає в підвищенні ефективності пошуку логічних залежностей в базах даних на основі розроблених методів побудови та оцінки агрегованих асоціативних правил досягнутою. |