Єгорова О. А. Реляційна кластерна сегментація напівтонових зображень. – Рукопис.
Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.23 – системи та засоби штучного інтелекту. – Харківський національний університет радіоелектроніки, Харків, 2007.
Дисертацію присвячено розробці інтелектуальних методів сегментації та контекстної інтерпретації зображень, та оцінці отриманих результатів за допомогою моделі порівняння зображень на основі нової метрики на розбиттях кінцевих множин. Розглянуто існуючі методи для вирішення задач сегментації зображень та їх недоліки. Обґрунтована доцільність розробки методу реляційної кластерної сегментації, що має переваги за рахунок урахування просторового контексту зображення. Розроблено модель представлення зображень, яка дозволяє враховувати усі можливі варіанти позиціювання областей для ефективної обробки розбиттів та покриттів. Запропоновано та обґрунтовано використання матриць толерантності для аналізу об’єднання областей. Розроблено модель порівняння зображень на основі нової метрики на розбиттях кінцевих множин. Вперше введена, обґрунтована та досліджена нова метрика на кінцевих розбиттях – інструмент аналізу розбиттів, отриманих на ранніх етапах обробки зображень, для вибору та комбінування результатів сегментації на етапі інтерпретації відеоданих. Проведено експериментальний аналіз, який показав, що метрика має ряд переваг у порівнянні з традиційними, зокрема з евклідовою та відстанню Хаусдорфа, так як є більш стійкою до шумів, а також трансформацій об’єкту. Проведено імітаційне моделювання розробленого методу реляційної кластерної сегментації зображень. Показано його переваги перед відомими методами сегментації в задачах пошуку областей інтересу за рахунок аналізу позиціювання областей та аналізу їх об’єднань. Вирішено практичної задачі сегментації цитологічних зображень для виділення певного роду клітин для попередньої діагностики наявності пухлин.
В дисертаційній роботі для систем комп’ютерного зору запропоновано нове рішення задачі інтелектуальної сегментації зображень, яке полягає в розробці методу реляційної кластеризації, що враховує просторовий контекст позиціювання областей, та моделі порівняння зображень з використанням нової метрики на розбиттях кінцевих множин для аналізу, вибору та комбінування результатів сегментації.
При проведенні досліджень отримано наступні основні результати:
Встановлено, що для підвищення ефективності обробки візуальної інформації для виявлення областей інтересу доцільно використовувати елементи теорії відношень множин, що забезпечує передумови для створення ефективних та надійних методів обробки зображень. Формалізація зображення у вигляді покриття надає можливості для більш повного аналізу відношень областей, що може значно зменшити втрату інформації, а також дозволить проводити аналіз зв’язків не просто між окремими елементами, а для цілих фрагментів зображень.
Синтезовано правила упорядкування складових зображень, що дозволяють аналізувати об’єднання областей, так як певна кількість областей із спостерегаємого покриття можуть відображатися в одну область еталонного покриття.
Наведена модель представлення зображень із використанням просторових відносин між класами еквівалентності дозволяє враховувати усі можливі варіанти позиціювання областей, і проводити ефективну обробку розбиттів та покриттів. Схема обчислювання істинних границь об’єктів допомагає переходити од покриттів до розбиттів для аналізу ознак областей.
У розробленому методі реляційної кластеризації в задачах сегментації зображень для заданих ознак введено та досліджено матриці толерантності. Використання інструментарію теорії відношень на множинах дозволяє ефективно застосовувати кластеризацію для автоматичного пошуку областей інтересу та інтерпретації зображень.
Введено, обґрунтовано та досліджено модель порівняння зображень на основі нової метрики на розбиттях кінцевих множин. Головне призначення цієї метрики – створити інструмент аналізу розбиттів, отриманих на ранніх етапах обробки зображень, для вибору і комбінування результатів сегментації на етапі інтерпретації відеоданих. При цьому, з одного боку, виникає можливість об’єктового інтегрального порівняння алгоритмів сегментації, а з іншого - введення операцій над розбиттями створює передумови для отримання кращого в значенні заданого критерію розбиття, що дозволяє вірогідно виділити об’єкти або області інтересу.
Шляхом експериментальних досліджень з напівтоновими зображеннями продемонстровані високі показники точності та завадостійкості реляційної сегментації. Результати теоретико-експериментальних досліджень реалізовані та впроваджені у вигляді прикладних та дослідницьких програмних комплексів, два з котрих сертифіковані. Результати дисертації орієнтовані на ефективне використання в системах технічного зору, що використовуються при розробці та створенні засобів стеження за об’єктом та порівняння з еталоном.
Публікації автора:
Егорова Е.А. Киношенко Д.К., Машталир В.П., Шляхов Д.В. Метрическое сравнение результатов сегментации изображений // Радиоэлектроника та информатика. – № 2. – 2006. – С. 55–62.
Егорова Е. А. Анализ методов сегментации изображений // Восточно-Европейский журнал передовых технологий. – № 4. – 2006. – С. 67–71.
3. Егорова Е.А., Чупиков А.Н., Щербинин К.С. Интеллектуальная обработка результатов сегментации синтезированных изображений // Прикладная радиоэлектроника. – Т. 5, № 3. – 2006. – С. 408–411.
4. Kinoshenko D,. Mashtalir S., Yegorova E. Image normalization via salient points of skeletons // ICGST International Journal on Graphics, Vision and Image Processing. Special Issue on Features and Analysis. – 2006. – P. 1–7.
5. Kinoshenko D., Mashtalir V., Orlov A., Yegorova E. Method of creating of functional invariants under one parameter geometric transformations // Patters Recognition. Michaelis B., Krall G. (Eds.). Lecture Notes in Computer Science, Berlin-Heidelberg, Springer-Verlag. – Vol. 2781. - 2003. – P. 68-75.
6. Kinoshenko D., Mashtalir V., Yegorova E. Clustering method for fast content-based image retrieval // Computer Vision and Graphics. K. Wojciechowski et al. (Eds.). Computational Imaging and Vision, Springer. – Vol. 32. – 2006. P. 946–952.
7. Kinoshenko D., Mashtalir V., Vinarsky V., Yegorova E. Hierarchical partitions for content image retrieval from large-scale database // Machine Learning and Data Mining in Pattern Recognition. Perner. P., Imlya A. (Eds.). Lecture Notes in Artificial Intelligence, Springer–Verlag. – Vol. 3587. – 2005. – P. 445–455.
Mashtalir S., Shcherbinin K., Yegorova E. Internal and external salient points under affine transformations. Comparative Study // Proc. of 14th International Conference in Central Europe for Computer Graphics, Visualization and Computer Vision. Plzen, Czech Republic. – 2006. – P. 156–161.
9. Mashtalir V., Mikhnova E., Shlyakhov V., Yegorova E. A Novel metric on partitions for image segmentation // IEEE International Conference on Video and Signal Based Surveillance. Los Alamitos, CA, USA. – 2006. – P. 18–23.
Егорова Е.А. Применение методов кластерного анализа в задачах сегментации // Материалы 8–го Международного молодежного форума «Радиоэлектроника и молодежь в XXI веке». ХНУРЭ. – 2004. – С. 83.
Егорова Е.А. Анализ алгоритмов кластеризации при сегментации изображений // Матеріали 7–й Міжнародної науково–практичної конференції “Наука і освіта 2004”.– Т. 72. –Дніпропетровськ: Наука і освіта. – 2004. – С. 7–8.
Егорова Е.А., Машталир В.П. Пространственный контекст в задачах сегментации изображений // Материалы Международной научно–технической конференции «Искусственный интеллект. Интеллектуальные и многопроцессорные системы». – Т. 2. Таганрог. Изд-во ТРТУ. – 2004. – С. 256 – 258.
Егорова Е.А., Шерстюк Н.М. Сегментация изображений с учетом позиционирования областей // Материалы 9–го Международного молодежного форума «Радиоэлектроника и молодежь в XXI веке». ХНУРЭ. – 2005. – С. 414.
Егорова Е.А. Пространственный контекст элементов покрытия поля зрения // Материалы 10–го Международного молодежного форума «Радиоэлектроника и молодежь в XXI веке». ХНУРЭ. – 2006. – С. 277.