Библиотека диссертаций Украины Полная информационная поддержка
по диссертациям Украины
  Подробная информация Каталог диссертаций Авторам Отзывы
Служба поддержки




Я ищу:
Головна / Технічні науки / Автоматизовані системи управління та прогресивні інформаційні технології


Карпов Олег Миколайович. Методи аналізу і розпізнавання складних сигналів в автоматизованих системах мовного діалогу: дисертація д-ра техн. наук: 05.13.06 / Національний авіаційний ун-т. - К., 2003.



Анотація до роботи:

Карпов О.М. Методи аналізу і розпізнавання складних сигналів в атоматизованих системах мовного діалогу. - Рукопис.

Дисертація на здобуття вченого ступеня доктора технічних наук за спеціальністю 05.13.06 -автоматизовані системи управління і прогресивні інформаційні технології. - Національний авіаційний університет. Київ. 2003.

Дисертація присвячена питанням побудови моделей аналізу складних сигналів і їх спектрів, методів визначення параметрів систем, що формують ці сигнали, розробки алгоритмів розпізнавання мовних сигналів і розробка на цій основі - інформаційних технологій побудови систем розпізнавання мови.

Для рішення поставлених задач у роботі запропоновані нові методи аналізу сигналів і їх спектрів, що розглядають їх як функції багатьох змінних з невідомим порядком і складом компонент, що входять до них і невідомими параметрами компонент. Методи рішення виходять із теореми Колмогорова A.М. про те, що функцію багатьох змінних можна уявити як суму, добуток і суперпозицію одновимірних функцій. У даній роботі розглядається уявлення багатовимірних функцій у базисі елементарних функцій виду: для параметричного уявлення спектра і частотної функції мовотворного тракту - резонансні функції другого порядку, в тому числі функції запізнюючіх ланок і експоненційні функції; для непараметричного уявлення спектра - параболи другого порядку і локон Аньєзі - крива 3-го порядку. Для резонансних функцій і запізнюючих ланок задача вирішена в часовій і частотній областях. Параметри мовного тракту визначені методами: послідовного вилучення складових сигналу - CET і послідовних наближень - SAT для акустичної і біомеханічної систем.

Алгоритми розпізнавання реалізовані як послівне, фонемне і сегментно-складове розпізнавання з застосуванням згладжуючих сплайнів, сплайн-ідентифікації і сплайн-синтезу. Реалізован базовий алгоритм розпізнавання на основі екстремальних функцій, який досліджен по словнику 800 слів і виявив стабільну надійність розпізнавання слів не менше 98% на одного диктора. Словарь еталонів, в загальному випадку, утримує по одної реалізації кожного слова. Добре разрізняються слова типу “бочка - дочка”.

Результати вирішення науково-технічної проблеми по створенню теоретичних основ аналізу і розпізнаванню мовних сигналів - функцій багатьох змінних як суперпозиції функцій меньшого числа змінних і розробки методів реалізації при обробці мовних сигналів зводяться до наступного:

1. Вперше запропонований і реалізований метод побудови частотної функції мовотворного тракту людини шляхом послідовного вилучення компонент у часовій і частотній областях (Consecutive Extraction Transform - CET) і послідовних наближень -SAT ( Sequential Approximation Transform). Розроблені алгоритми і схеми аналізу в прямому і логарифмічному видах при розв’язку задач визначення механізму формування мовних сигналів у часовій і частотній областях. Дано опис мовного сигналу в базисі функцій CET- і SAT- перетворень при розв’язку задач структурної апроксимації спектрів у різних базисах.

2. Запропоновано і реалізовано 5 методів формування функції сегментації: верифікацією послідовності параметрів; диференціюванням функцій у частототних смугах; ідентифікацією відрізків мови символами Г, С, У, Ш по групових ознаках; виділенням із обвідних сигналів у частотних смугах сигналів в діапазоні частот (312) Гц; по методу СЕТ, що у сукупності дозволяє розв’язати у повному обсязі задачу сегментації.

3. Для структурної апроксимації параметричних функцій у виді СЕТ- і SAT-перетворень сигналів реалізовано сплайн-перетворення для фонемних і сегментно-складових послідовностей, що дозволяє розв’язати задачу опису і синтезу функцій параметрів при розпізнаванні, що визначає послідовність переходу від однієї категорії інформації до іншої, так наприклад, від параметричної до фонетичної, від символьної до словесної, при цьому мінімізуються часові витрати розпізнавання мови.

4. Теоретично й експериментально обгрунтована модель адаптивного аналізу основного тону (ОТ), яка заснована на дробових номерах коефіцієнтів Фур'є, що дозволяє здійснити синхронізацію процесу розпізнавання.

5. Розроблено обчислювальні схеми, алгоритми і програмне забезпечення сплайн-синтезу і сплайн-ідентифікації мовних сигналів.

6. Обгрунтована і реалізована оптимальна послідовність порівняння мовних параметрів при розпізнаванні, що дозволяє побудувати ієрархію розпізнавання у виді подвійкового дерева розподілу словника еталонів на підсловарі.

7. Для аналізу і наступного об'єднання різноманітних категорій інформації про мовний сигнал розроблена концепція проектування класів програмних систем із застосуванням передпроцесорних засобів мови програмування СІ і об'єктно-орієнтованого програмування, що дозволяє генерувати і модифікувати програмні засоби. Розроблені алгоритми і програмне середовище розпізнавання мови, протестовані і реалізовані для значного об’єму словників на мові DELPHI.

8. Результати вирішення даної науково-техничної проблеми впроваджені у організаціях різних галузей науки і техніки та учбовому процесі.

Основний зміст дисертації опубліковано в роботах:

1. Карпов О.Н. Технология построения устройств распознавания речи. Монография. - Д.: Изд-во ДНУ. - 2001. - 184 с.

2. Карпов О.Н. Представление функций многих переменных в классе функций меньшего числа переменных. Методы анализа речевых сигналов. Монография. - Д.: Изд-во ДНУ. - 2003. - 112 с.

3. Карпов О.Н. Текстовый редактор с речевым управлением // Проблемы управления и информатики. - К., 1997. - N2. - C. 132-145.

4. Карпов О.Н. Сплайн-описание слоговой структуры речи // Математичне моделювання. -Днепродзержинск: ДТУ, 1998. - С. 42-47.

5. Карпов О.Н. Технология первичной обработки информации о речевом сигнале // Актуальні проблеми автоматизації та інформаційних технологій. - Д., 2001. - Т.4. - С. 31- 40.

6. Карпов О.Н. Метод последовательных приближений вычисления параметров передаточной функции речеобразующего тракта // Актуальні проблеми автоматизації та інформаційних технологій. - Д., 2002. - Т.5. - С.

7. Карпов О.Н. Представление многомерных функций в базисах элементарных функций // Питання прикладної математики і математичного моделювання. -Д., 2001. - С.26-39 .

8. Карпов О.М. Вступ до курсу "Технологія проектування пристроїв розпізнавання мови": Навч. посіб. Д., 2000. - 64с.

9. Карпов О.Н. Быстросходящиеся алгоритмы распознавания слов речи // Вопр. прикладной матем. и мат. моделирования. -Д., 1997. - С.62-63.

10. Карпов О.Н. Быстрый и надежный алгоритм сопоставления выборок речевых сигналов // Вопросы прикладной математики и мат. моделирования. Д., 1995. - С. 28-29.

11. Карпов О.Н., Карпов А.О. Качественный анализ связи амплитудно-частотных параметров речевого сигнала, геометрических размеров резонаторов и входных управляющих воздействий речеобразующей системы //Автоматич. распознавание и синтез речевых сигналов. - К., 1989. - С. 89-93.

12. Карпов О.Н. Многокритериальный динамический иерархический подход к задаче распознавания речи //Вопросы прикладной математики и математического моделирования. -Д., 1991. - С.128-131.

13. Карпов О.Н. Некоторые вопросы автоматизации описания сегментов речи элементарными функциями //Методы решения нелинейных задач и обработка данных. -Д., 1985. - С.95-100.

14. Карпов О.Н. Некоторые свойства сплайн-модели фазочастотных характеристик речевых сигналов // Питання прикладної математики і математичного моделювання. -Д.: РВВ ДНУ, 2000. -С. 35-37.

15. Карпов О.Н. Некоторые цепочки анализа речи // Вопросы прикладной математики и мат. моделирования. - Д., 1994. - С. 20-21.

16. Карпов О.Н., Носенко Э.Л., Чугай А.А. Электронные речевые анализаторы и возможности их практического применения //Психологический журнал АН СССР. - 1981. - Т.2, N6. - С. 104-106.

17. Карпов О.Н. Обобщенная постановка задачи распознавания речи, эмоционального состояния и индивидуальных особенностей говорящего //Актуальные пробл. ЭВМ и программирования. - Д., 1981. - С. 39-43.

18. Карпов О.Н. Оптимальный формантный анализ речи //Вопр. прикладной математики и мат. моделирования. - Д., 1992. - С. 89- 92.

19. Карпов О.Н. Посегментное распознавание слов //Решение прикладных задач мат. физики и дискр. математики. -Д., 1985. - С. 95-100.

20. Карпов О.Н. Представление знаний в системах анализа и распознавания речи //Вопросы прикладной математики и мат. моделирования. Д., 1994. - С.18-19.

21. Карпов О.Н. Речь как продукт работы прогнозирующей следящей речеобразующей системы с дискретным управлением//Вопросы прикладной математики и математического моделирования. - Д., ДГУ, 1988. - С. 93-98.

22. Карпов О.Н., Сегеда Н.Е. Информационное и программное обеспечение системы распознавания речи // Вопросы прикладной математики и мат. моделирования. - Д., 1995. - С. 38-44.

23. Карпов О.Н., Сегеда Н.Е. Исследование связей между параметрическим, фонемным и символьным представлениями речевого сообщения //Речевая информатика. - К., 1989. - С. 94-101.

24. Карпов О.Н. Сегментация речи как функция длительности периодов сигналов в формантных областях //Вопросы прикладной математики и математического моделирования. -Д., 1991. - С. 88- 90.

25. Карпов О.Н. Структурное моделирование аппроксимирующих функций //Вопросы прикладной математики и математического моделирования. - Д., 1995. - С.32-35 .

26.А.С. N743016, СССР, МКИ G 10 L 1/02. Устройство для автоматического распознавания устных команд / О.Н. Карпов, Г.Н. Бордовский // Открытия. Изобретения. - 1980. - N 23. - С.282.

27. А.С. 773689, СССР, МКИ G 10 L 1/02. Устройство для выделения частоты основного тона /О.Н. Карпов, Э.Л. Носенко, А.А. Чугай// Там же. 1980. -N39.-С. 247.

28. А.С. N817746, СССР, МКИ G 10 L 1/04. Электронный анализатор распознавания эмоционального состояния человека. Электронный регистратор временных характеристик речи / О.Н. Карпов, А.А. Чугай, Э.Л. Носенко // Там же. - 1981. - N 12. - С.212.

29. А.С. N1180969, СССР, МКИ G 10 L 5/00. Спектрополосный анализатор для распознавания речевых команд / О.Н. Карпов, А.А. Чугай, Л.Н. Исаев и др. // Открытия. Изобретения. - 1985. - N 35. - С.235.

30. А.С. N1690688, СССР, МКИ 5A 61 B 8/02. Ультразвуковой вазолокатор / О.Н. Карпов, В.М. Школьник, Е.И. Белоусова // Там же. -1991. -N 42. -С.61.

31. Выделение и ввод в ЭВМ параметров речевого сигнала // Методы решения нелинейных задач и обработка данных / В.Е. Дуранин, О.Н. Карпов, Чугай А.А. и др. - Д., 1983, С. 98-101.

Анотації