Таянов Віталій Анатолійович. Моделювання систем розпізнавання на основі показників вірогідності для малих тестових вибірок : дис... канд. техн. наук: 01.05.02 / НАН України; Фізико- механічний ін-т ім. Г.В.Карпенка. — Л., 2006. — 159арк. : рис., табл. — Бібліогр.: арк. 140-148.
Анотація до роботи:
Таянов В.А. Моделювання систем розпізнавання на основі показників вірогідності для малих тестових вибірок.- Рукопис.
Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 01.05.02 - математичне моделювання та обчислювальні методи.-Національний університет «Львівська політехніка», Львів, 2007.
Дисертація присвячена розробці моделі систем розпізнавання (СР) в умовах малих вибірок на основі оцінки вірогідності їх роботи. В подібних випадках використання класичних оцінок часто веде до некоректного їх визначення. Для розв’язання проблеми пропонуються диференційні прототипні та ймовірнісні показники оцінки вірогідності роботи СР. Ці показники дають можливість оцінювати вірогідність розпізнавання кожного окремого образу. В рамках прототипного підходу досліджено статистичні властивості коефіцієнта вірогідності розпізнавання (КВР). Запропоновано спосіб порівняння ефективності роботи двох систем розпізнавання на основі 1-го та 2-го моментів КВР. Введено параметр вірогідності розпізнавання, що визначає стійкість КВР до впливу різних видів спотворюючих факторів. В рамках імовірнісного підходу показано коректність гіпотези, що розподіл відстаней між образами в межах класів і всієї бази даних є нормальним, визначено ймовірність розпізнавання окремого образу та ймовірності переходів КВР з різних станів. Запропоновано модель класифікації образів у межах довірчого інтервалу. Крім того, для побудови моделі класифікації образів за допомогою диференційного підходу досліджено особливості використання статистичних критеріїв виявлення. На основі розроблених показників проводиться швидкий, різнобічний та ефективний аналіз і синтез СР в умовах малих вибірок як результат оптимізації параметрів моделі, який неможливо реалізувати за допомогою класичних підходів.
В дисертаційній роботі розроблено модель СР і процесу класифікації на основі оцінки параметричної вірогідності розпізнавання в умовах малих тестових вибірок. Модель системи розпізнавання і процесу класифікації дозволила провести аналіз і параметричний синтез тестованої системи, а також оцінити вірогідність роботи класифікаторів.
Основні наукові результати дисертаційної роботи полягають в наступному:
Проведено порівняльний аналіз та класифікацію методів оцінки вірогідності розпізнавання в умовах малих вибірок. Виявлено, що існуючі теоретичні положення є неадекватними для проведення аналізу та параметричного синтезу СР за показниками вірогідності в умовах малих вибірок.
Вперше запропоновано та обґрунтовано диференційний підхід до аналізу роботи СР, який дозволяє отримати оцінки вірогідності розпізнавання системи в умовах класичних малих вибірок. Підхід дає можливість встановити нестаціонарний характер вірогідності розпізнавання, а саме: вона прямує до нуля, якщо розмір бази даних прямує до нескінченності, а розмір класу обмежений.
На основі диференційного підходу створено математичну модель СР у вигляді диференційних прототипних та ймовірнісних показників оцінки вірогідності їх роботи. В рамках прототипних показників вперше проведено апроксимацію вірогідності розпізнавання при дії внутрішніх (недосконалість алгоритму) та зовнішніх спотворюючих факторів, що дало можливість отримати усереднене на діапазоні дій цих факторів значення вірогідності. Коректність гіпотези про нормальність закону розподілу відстаней між образами в метричному просторі дозволила отримати ряд диференційних імовірнісних показників оцінки вірогідності розпізнавання, а також визначити міру компактності класу в імовірнісному просторі.
Створений спосіб на основі диференційного підходу дає можливість побудувати модель класифікації образів для випадку однопрототипних і багатопрототипних класів не в ознаковому багатовимірному просторі, а в одновимірному просторі мір відстаней при застосуванні статистичних критеріїв виявлення. Встановлено умови, яким мають задовольняти розподіли класів для того, щоб отримати мінімальну сумарну помилку виявлення при класифікації образів, а також умови можливого розпізнавання. Показано, що розділяти класи можна не лише попарно, але й шляхом розбиття всіх образів на правильний та неправильні класи.
Запропонована та обґрунтована модель класифікації правильних образів у межах довірчого інтервалу дає можливість значно зменшити кількість класів, які підлягають перевірці при сильно обмеженому інформаційному описі образів цих класів. Вибрано довірчий інтервал, розмір якого є достатнім з точки зору довірчої ймовірності для найгіршого образу з тестової вибірки. Метод дозволив підвищити вірогідність і середню швидкість процесу розпізнавання для тестової послідовності образів.
На основі отриманих результатів проведено оптимізацію класифікатора СР та її параметричний синтез, що дає наступні результати для помилок виявлення 1-го та 2-го роду (, ): розмір вектора ознак дорівнює 100 елементів (200 байт на образ), усереднений за базою даних середній розмір класу рівний 5, розмір бази даних складає 200 зображень.
Порівняно класичні точкові та інтервальні оцінки ймовірності неправильного розпізнавання з оцінками, отриманими на основі диференційного підходу. У випадку точкових оцінок виграш в дисперсії порівняно з оцінкою максимальної правдоподібності складає 2.54, а в порівнянні з баєсівською – 1.8 разів. Виграш в розмірах інтервалів порівняно з фішерівськими та нейманівськими досягнуто в 1.77, 1.74, 1.71 рази для коефіцієнтів довіри , та , відповідно. Визначено розмір малої вибірки, який для тестованої бази даних складає 30 образів.
Розроблено програмні модулі, що дають можливість проводити аналіз СР, оптимізацію їх класифікаторів та здійснювати параметричний синтез систем на основі побудованої моделі.
Отримані в дисертаційній роботі результати моделювання можуть бути використані як при синтезі СР в різних галузях науки і техніки, так і при їх аналізі. Вони дозволяють отримати різнобічну оцінку вірогідності їхньої роботи.
Публікації автора:
Капустій Б.О., Русин Б.П., Таянов В.А. Системи розпізнавання образів з малими базами даних. – Львів: СПОЛОМ, 2006. – 152 с.
Капшій О.В., Русин Б.П., Таянов В.А. Критерій оцінки якості розпізнавання системою підтримки прийняття рішення // Электроника и связь. – 2002. №15. – C. 89-93.
Капустій Б.О., Русин Б.П., Таянов В.А. Про особливості стохастичних характеристик коефіцієнта надійності розпізнавання для об’єктів з класу R3 // Вісник Національного університету “Львівська політехніка”. Радіоелектроніка та телекомунікації.-2003. – №477. – С 69-76.
Капустій Б.О., Русин Б.П., Таянов В.А. Розподіл середньоквадратичних відстаней між об’єктами в просторі R2 // Відбір і обробка інформації. – 2003. – Вип. 19(95). – C.110-114.
Капустій Б.О., Русин Б.П., Таянов В.А. Особливості застосування моделей функції відношення правдоподібностей до задач розпізнавання // Моделювання та інформаційні технології. – 2004. – Вип. 26. – С. 49-55.
Капустій Б.О., Русин Б.П., Таянов В.А. Критерії оптимізації набору спектральних складових перетворення Карунена-Лоєва при розрахунку диференційної ймовірності правильного розпізнавання // Радиоэлектроника и информатика. – 2004. – № 3. – С. 118-121.
Капустій Б.О., Русин Б.П., Таянов В.А. Визначення апостеріорної надійності системи підтримки прийняття рішення методом верифікації мір локальних переходів коефіцієнта надійності розпізнавання // Вісник Національного університету “Львівська політехніка”: Радіоелектроніка та телекомунікації.–2004. – №508. – С. 46–52.
Капустій Б.О., Русин Б.П., Таянов В.А. Особенности применения критериев обнаружения к задачам распознавания объектов // Проблемы управления и информатики. – 2005. – № 1. – С. 107-114.
Капустій Б.О., Русин Б.П., Таянов В.А. Новый подход к определению вероятности правильного распознавания объектов множеств // УСиМ. – 2005. – № 2. – С. 8-13.
Капустій Б.О., Русин Б.П., Таянов В.А. Нові підходи до параметричного синтезу алгоритмів розпізнавання // Радиоэлектроника и информатика. – 2005. – № 3. – С. 128-134.
Капустий Б.Е., Русын Б.П., Таянов В.А. Сравнительный анализ различных оценок вероятности распознавания // Проблемы управления и информатики. – 2006. – № 4. – С.89-96.
Капустій Б.О., Русин Б.П., Таянов В.А. Реалізація статистичних критеріїв виявлення в задачах розпізнавання // Радиоэлектроника и информатика. – 2006. – № 1. – С. 91-96.
Таянов В.А. Оптимізація вибору ознак у системах розпізнавання, побудованих на основі ортогональних перетворень / Матер. XVII відкр. наук.-техн. конф. молодих науковців і спеціалістів “Діагностичні системи та сигнали”. – Львів, 2002. – С. 175-178.
Таянов В.А. Про деякі похибки, що виникають при визначенні параметрів надійності систем підтримки прийняття рішень / Матер. XVIII відкр. наук.-техн. конф. молодих науковців і спеціалістів “Діагностичні системи”. – Львів, 2003. – С. 210-213.
Tayanov V.А., Tayanov S.A. The error analysis of speech signal computer compression by Karhunen-Loeve transform / Proc. of the 11-th Polish-Ukrainian Conf. on "Cad in Machinery Design – Implementation and Educational Problems”. – Warsaw, 2003. – P. 113-119.
Kapustiy B.O., Rusyn B.P., Tayanov V.A. Definition of the object density measure in class boundary / Proc. of the Intern. Conf. TCSET’2004 “Modern Problems of Radio Engineering, Telecommunications and Computer Science”. – Lviv-Slavsko, 2004. – P. 253.
Капустій Б.О., Русин Б.П., Таянов В.А. Про концепції оптимально-надійнісного розпізнавання / Оброблення сигналів і зображень та розпізнавання образів: Праці 7 - ї Всеукр. міжнар. конф. – Київ, 2004. – С. 29-32.
Капустій Б.О., Русин Б.П., Таянов В.А. Функції відношення правдоподібностей та їх застосування для розв’язку частинних випадків задачі розпізнавання / Матер. наук.-практ. конф. “Сучасні проблеми телекомунікацій-2004”. – Львів, 2004. – С. 29-31.
Капустій Б.О., Русин Б.П., Таянов В.А. Параметричний синтез алгоритмів розпізнавання за диференційними показниками вірогідності / Тези доп. Третьої міжнар. наук.-техн. конф. з оптоелектронних інформаційних технологій “Фотоніка-ОДС-2005”. – Вінниця, 2005. – С. 103-104.
Kapustiy B.O., Rusyn B.P., Tayanov V.A. Realization of the statistical detection methods in pattern recognition tasks / Proc. of the Intern. Conf. “The Experience of Designing and Application of CAD Systems in Microelectronics” CADSM’2005. – Lviv-Polyana, 2005. – P. 99-101.
Таянов В.А. Оптимізація класифікаторів в умовах малих вибірок / Матер. XIX відкр. наук.-техн. конф. молодих науковців і спеціалістів “Діагностичні системи”. – Львів, 2005. – С. 367-370.
Kapustiy B.O., Rusyn B.P., Tayanov V.A. Parametrical recognition algorithm synthesis based on the sequential analysis / Proc. of the Intern. Conf. TCSET’2006 “Modern Problems of Radio Engineering, Telecommunications and Computer Science”. – Lviv-Slavsko, 2006. – P. 294-296.
Капустий Б.Е., Русын Б.П., Таянов В.А. Параметрический синтез систем распознавания / Материалы международной молодежной научн.-техн. конф. студентов, аспирантов и ученых “Молодежь и современные проблемы радиотехники и телекоммуникаций РТ-2006”. – Севастополь, 2006. – С. 181.
Капустій Б.О., Русин Б.П., Таянов В.А. Оптимізація класифікатора в ознаковому і метричному просторах / Оброблення сигналів і зображень та розпізнавання образів: Праці 8-ї Всеукр. міжнар. конф. – Київ, 2006. – С. 31-34.