Нейросетевая модель распознавания эмоций по голосу
Дата
2020
Автори
Терейковская, Л. А.
Заголовок журналу
Журнал ISSN
ISSN журналу
2219-5300
Назва тому
Видавець
КНУБА
Анотація
Разработаны средства распознавания эмоционального состояния диктора. Показана перспективность использования нейронных сетей для анализа фиксированных фрагментов голосового сигнала. Установлена необходимость адаптации вида и параметров нейросетевой модели к условиям задачи распознавания эмоций по голосу. В результате проведенных исследований определено, что в задаче распознавания эмоций диктора по голосовым фрагментам фиксированной продолжительности целесообразно использовать двухслойный персептрон, входные параметры которого ассоциируются с мел-кепстральными коэффициентами, характеризующими каждый из квазистационарных фрагментов анализируемого голосового сигнала, а выходные параметры соответствуют распознаваемым эмоциям диктора. Целесообразность использования двухслойного персептрона подтверждена с помощью компьютерных экспериментов. Определено, что направления дальнейших исследований связаны с определением количества мел-кепстральных коэффициентов, которое является достаточным для описания одного квазистационарного фрагмента, и адаптацией параметров двухслойного персептрона к условиям распознавания при воздействии помех различного вида.
Опис
Ключові слова
эмоции, распознавание эмоций, голосовой сигнал, нейросетевая модель, мел-кепстральные коэффициенты, квазистационарный фрагмент
Кафедра авторів
кафедра інформаційних технологій проектування та прикладної математики
Бібліографічний опис
Терейковская Л. А. Нейросетевая модель распознавания эмоций по голосу / Л. А. Терейковская // Управління розвитком складних систем : зб. наук. праць / Київ. нац. ун-т буд-ва і архітектури ; гол. ред. П. П. Лізунов. – Київ : КНУБА, 2020. – № 41. – С. 95 - 100. - Бібліогр. : 18 назв.
УДК
004.056.5