|
Лаборатория речевых технологий |
|
|
Заведующий лабораторией - к.т.н. Конев Антон Александрович. Научные направления –анализ, распознавание и синтез речи, идентификация диктора, медицинская и биологическая акустика. Тематика исследований Основой научных исследований является разработанная модель внутреннего уха человека, которая была создана на основе психоакустических данных по слуховой системе. Основные направления исследований – получение параметров речевого сигнала с высокой точностью, выделение ключевых слов и распознавание слитной речи, идентификация диктора, установление влияния заболеваний речеобразующего тракта на речевой сигнал и др. Для исследований речевого сигнала применяется программный комплекс (рис. 1), который создан на основе собственных алгоритмов, не имеющих аналогов в мире. Так, например, в автоматическом режиме проводится сегментация на вокализованные и невокализованные участки и выделение частоты основного тона речевого сигнала. Надёжность определения границ при сегментации составляет 0,91, относительное количество пропущенных границ – 0,02, относительное количество лишних границ – 0,09. Погрешность определения частоты основного тона составляет менее 1%. Создан и успешно используется медико-технический комплекс для голосовой реабилитации пациента после полного удаления гортани (рис. 2). Данный комплекс позволяет пациенту под контролем врача-логопеда проводить тренировки по становлению и улучшению качества пищеводного голоса. Тренировки проводятся в режиме реального времени с использованием биологической обратной связи. Внедрение разработанного программного комплекса в медицинскую практику позволило вдвое сократить сроки голосовой реабилитации пациентов с полностью удалённой гортанью, а также улучшить качество их голоса. Партнером исследований является ГУ НИИ онкологии ТНЦ СО РАМН. Текущие исследования: - классификация и параметризация речевого сигнала, позволяющие проводить дикторонезависимое распознавание слитной речи;
- определение зависимости параметров речевого сигнала от величины опухоли при раке гортани;
- синтез речевого сигнала по правилам.
Рисунок 1. Структура программного комплекса по исследованию речевого сигнала
Рисунок 2. Общий вид медико-технического комплекса
|