Библиотека диссертаций Украины Полная информационная поддержка
по диссертациям Украины
  Подробная информация Каталог диссертаций Авторам Отзывы
Служба поддержки




Я ищу:
Головна / Технічні науки / Радіотехнічні пристрої та засоби телекомунікацій


Гудим Володимир Васильович. Використання вейвлет-перетворень та нейронних мереж для обробки та покращання розпізнавання мовних сигналів: дисертація канд. техн. наук: 05.12.13 / Національний ун-т "Львівська політехніка". - Л., 2003. , табл.



Анотація до роботи:

Гудим В.В. Використання вейвлет-перетворень та нейронних мереж для обробки та покращання розпізнавання мовних сигналів – Рукопис.

Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.12.13 – радіотехнічні пристрої та засоби телекомунікацій – Національний університет “Львівська політехніка”, Львів, 2003.

Дисертаційна робота присвячена вирішенню важливої й актуальної задачі покращання ефективності розпізнавання мовних сигналів та їх компресії за допомогою засобів цифрової обробки, розроблених на основі апарату вейвлет-перетворень та штучних нейронних мереж.

Для досягнення поставленої мети проведено аналіз математичних моделей формування та сприйняття мовних сигналів і використання цих моделей у задачах цифрової обробки. Вдосконалено метод попередньої сегментації сигналів. Запропоновано нові (для мовних сигналів) параметри спектрально-часової невизначеності та ентропії спектру часового вікна з нелінійною (логарифмічною) шкалою частот. Побудовано новий принцип застосування НВП для цифрової обробки та аналізу мовних сигналів. Проведено попередній вибір ВФ за критерієм мінімальної ентропії коефіцієнтів вейвлет-перетворення та частотно-часової локалізації ВФ. Модифіковано та адаптовано метод ДВП для задач компресії, декомпресії та зниження рівня шумів. Подальший розвиток отримало застосування ШНМ для обробки та розпізнавання елементів мовних сигналів на основі введення нових, запропонованих та досліджених складових вектора вхідних параметрів.

Проведено комп’ютерні експерименти, їх аналіз та порівняння з відомими результатами. Результати теоретичних досліджень підтверджено експериментально.

У дисертаційній роботі розвинуто підходи вирішення задач цифрової обробки мовних сигналів з використанням апарату вейвлет-перетворень і нейронних мереж для розпізнавання та компресії мовних сигналів. Нижче перераховані основні висновки та результати дисертаційної роботи:

1. Вдосконалено метод попередньої сегментації мовних сигналів на основі аналізу спектральних характеристик їх елементів, який відрізняється від відомих тим, що базується на кореляційному аналізі спектрів сусідніх сегментів і дозволяє точніше виділяти межі елементів мовних сигналів.

2. Запропоновано нові параметри спектрально-часової невизначеності та ентропії спектру часового вікна мовних сигналів з логарифмічною шкалою частот, використання яких разом з відомими параметрами дозволило на 2-6% підвищити ефективність розпізнавання голосних звуків.

3. Розроблено методику вибору вейвлет-функцій для задач цифрової обробки та аналізу мовних сигналів на основі критеріїв мінімальної ентропії коефіцієнтів розкладу та показника частотно-часової локалізації вейвлет-функцій.

4. Розроблено та обґрунтовано методику вибору кроку масштабних коефіцієнтів НВП з точки зору рівномірного перекриття частотного діапазону мовних сигналів масштабованими вейвлет-функціями, що дозволило ефективніше аналізувати мовні сигнали та зменшити об'єм обчислень, проводити аналіз та контроль зміни частоти основного тону.

5. Розроблені чисельні алгоритми побудови вейвлет-функцій, що відповідають фонемам звуків, та реалізації оберненого НВП, які дозволяють реалізувати процедури вейвлет-фільтрації мовних сигналів для виявлення тонкої частотної структури мовних сигналів з метою ідентифікації відповідних смислових елементів.

6. Модифіковано та адаптовано до цифрової обробки мовних сигналів метод дискретного вейвлет-перетворення на основі вибору ортонормованого вейвлет-базису за критерієм мінімальної ентропії коефіцієнтів на масштабованих рівнях розкладу та врахування особливостей слухового сприйняття, що дозволило знизити рівень шумів та підвищити коефіцієнт компресії мовного сигналу до 18-20 разів при задовільній якості відтворення.

7. Побудована ШНМ дозволяє враховувати, крім основних параметрів, додаткові та їх динаміку у часі, за рахунок чого підвищилася ефективність розпізнавання нейронною мережею елементів мовних сигналів на 2-6%. На роботу ШНМ негативно впливають шумові складові мовного сигналу, внаслідок чого для забезпечення ефективного розпізнавання елементів мовного потоку доцільно попередньо використовувати процедури зниження рівня шумів за рахунок використання апарату ДВП.

Публікації автора:

1. Романишин Ю.М., Гудим В.В. Часові та спектральні характеристики мовних елементів для побудови шаблонів // Електроніка та зв'язок. Тематичний випуск журналу. - 1999. - № 6. - Т. 1. - С. 227-230.

2. Смердов А., Романишин Ю., Гудим В., Крижанівський В. Спектрально-часова невизначеність двополярних сигналів / Вісник Державного університету "Львівська політехніка", № 367. Серія “Радіоелектроніка та телекомунікації”. - Львів, 1999. - С. 18-22.

3. Романишин Ю., Гудим В. Цифрова обробка мовних сигналів / Вісник Державного університету “Львівська політехніка”, № 387. Серія “Радіоелектроніка та телекомунікації”. - Львів, 2000. - С. 319-323.

4. Романишин Ю., Гудим В. Компресія мовних сигналів на основі дискретних хвильових перетворень / Вісник Національного університету “Львівська політех-ніка”, № 428. Серія “Радіоелектроніка та телекомунікації”. - Львів, 2001. – С. 22-27.

5. Гудим В.В., Романишин Ю.М. Побудова нейронної мережі для обробки мовних сигналів / Вісник Житомирського інженерно-технологічного інституту. Технічні науки. Спеціальний випуск - 2002.- Житомир, 2002. - С. 186-191.

6. Романишин Ю.М., Гудим В.В. Розрахунок двополюсних резистивних структур прямокутної форми методом конформних перетворень / Вісник Державного університету "Львівська політехніка", № 352. Серія “Радіоелектроніка та телекомунікації”. - Львів, 1998. - С.101-104.

7. Romanyshyn Yu., Gudym V. Digital Processing and Identification of Speech Signals /Proceedings of International Conference on Modern Problems of Telecommunications, Computer Science and Engineering Training. - Lviv-Slavsko, Ukraine, 2000. – P. 136–137.

8. Romanyshyn Yu., Hudym V. Wavelet Transforms Applications for Speech Signals Processing / The Experience of Designing and Application of CAD Systems in Microelectronics. Proceedings of the VI-th International Conference CADSM 2001. - Lviv-Slavsko, Ukraine, 2001. – P. 297–298.

9. Романишин Ю., Гудим В. Особливості спектральних характеристик мовних сигналів / Тези доповідей 3-ї міжнародної науково-технічної конференції "Математичне моделювання в електротехніці та електроенергетиці". - Львів: ДУ "ЛП", 1999. - С. 234.

10. Романишин Ю.М., Гудим В.В., Данчишин І.В., Романишин О.І. Порівняння спектрально-часових властивостей хвильових функцій / Матеріали 2-ї науково-практичної інтернет-конференції “Україна наукова 2002”, т. 12. Дніпропетровськ: Наука і освіта, 2002 - С. 21-24.