Нейросетевая модель распознавания эмоций по голосу

Ескіз

Дата

2020

Автори

Терейковская, Л. А.

Заголовок журналу

Журнал ISSN

ISSN журналу

2219-5300

Назва тому

Видавець

КНУБА

Анотація

Разработаны средства распознавания эмоционального состояния диктора. Показана перспективность использования нейронных сетей для анализа фиксированных фрагментов голосового сигнала. Установлена необходимость адаптации вида и параметров нейросетевой модели к условиям задачи распознавания эмоций по голосу. В результате проведенных исследований определено, что в задаче распознавания эмоций диктора по голосовым фрагментам фиксированной продолжительности целесообразно использовать двухслойный персептрон, входные параметры которого ассоциируются с мел-кепстральными коэффициентами, характеризующими каждый из квазистационарных фрагментов анализируемого голосового сигнала, а выходные параметры соответствуют распознаваемым эмоциям диктора. Целесообразность использования двухслойного персептрона подтверждена с помощью компьютерных экспериментов. Определено, что направления дальнейших исследований связаны с определением количества мел-кепстральных коэффициентов, которое является достаточным для описания одного квазистационарного фрагмента, и адаптацией параметров двухслойного персептрона к условиям распознавания при воздействии помех различного вида.

Опис

Ключові слова

эмоции, распознавание эмоций, голосовой сигнал, нейросетевая модель, мел-кепстральные коэффициенты, квазистационарный фрагмент

Кафедра авторів

кафедра інформаційних технологій проектування та прикладної математики

Бібліографічний опис

Терейковская Л. А. Нейросетевая модель распознавания эмоций по голосу / Л. А. Терейковская // Управління розвитком складних систем : зб. наук. праць / Київ. нац. ун-т буд-ва і архітектури ; гол. ред. П. П. Лізунов. – Київ : КНУБА, 2020. – № 41. – С. 95 - 100. - Бібліогр. : 18 назв.

УДК

004.056.5

Зібрання

item.page.endorsement

item.page.review

item.page.supplemented

item.page.referenced