Нейросетевая модель распознавания эмоций по голосу

Вантажиться...
Ескіз
Дата
2020
Автори
Терейковская, Л. А.
Заголовок журналу
Журнал ISSN
Назва тому
Видавець
КНУБА
Анотація
Разработаны средства распознавания эмоционального состояния диктора. Показана перспективность использования нейронных сетей для анализа фиксированных фрагментов голосового сигнала. Установлена необходимость адаптации вида и параметров нейросетевой модели к условиям задачи распознавания эмоций по голосу. В результате проведенных исследований определено, что в задаче распознавания эмоций диктора по голосовым фрагментам фиксированной продолжительности целесообразно использовать двухслойный персептрон, входные параметры которого ассоциируются с мел-кепстральными коэффициентами, характеризующими каждый из квазистационарных фрагментов анализируемого голосового сигнала, а выходные параметры соответствуют распознаваемым эмоциям диктора. Целесообразность использования двухслойного персептрона подтверждена с помощью компьютерных экспериментов. Определено, что направления дальнейших исследований связаны с определением количества мел-кепстральных коэффициентов, которое является достаточным для описания одного квазистационарного фрагмента, и адаптацией параметров двухслойного персептрона к условиям распознавания при воздействии помех различного вида.
Опис
Ключові слова
эмоции, распознавание эмоций, голосовой сигнал, нейросетевая модель, мел-кепстральные коэффициенты, квазистационарный фрагмент, кафедра інформаційних технологій проектування та прикладної метематики
Бібліографічний опис
Терейковская Л. А. Нейросетевая модель распознавания эмоций по голосу / Л. А. Терейковская // Управління розвитком складних систем : зб. наук. праць / Київ. нац. ун-т буд-ва і архітектури ; гол. ред. П. П. Лізунов. – Київ : КНУБА, 2020. – № 41. – С. 95 - 100. - Бібліогр. : 18 назв.
Зібрання