Нейросетевая модель распознавания эмоций по голосу

Ескіз

Дата

2020

Автори

Терейковская, Л. А.

Заголовок журналу

Журнал ISSN

Назва тому

Видавець

КНУБА

Анотація

Разработаны средства распознавания эмоционального состояния диктора. Показана перспективность использования нейронных сетей для анализа фиксированных фрагментов голосового сигнала. Установлена необходимость адаптации вида и параметров нейросетевой модели к условиям задачи распознавания эмоций по голосу. В результате проведенных исследований определено, что в задаче распознавания эмоций диктора по голосовым фрагментам фиксированной продолжительности целесообразно использовать двухслойный персептрон, входные параметры которого ассоциируются с мел-кепстральными коэффициентами, характеризующими каждый из квазистационарных фрагментов анализируемого голосового сигнала, а выходные параметры соответствуют распознаваемым эмоциям диктора. Целесообразность использования двухслойного персептрона подтверждена с помощью компьютерных экспериментов. Определено, что направления дальнейших исследований связаны с определением количества мел-кепстральных коэффициентов, которое является достаточным для описания одного квазистационарного фрагмента, и адаптацией параметров двухслойного персептрона к условиям распознавания при воздействии помех различного вида.

Опис

Ключові слова

эмоции, распознавание эмоций, голосовой сигнал, нейросетевая модель, мел-кепстральные коэффициенты, квазистационарный фрагмент, кафедра інформаційних технологій проектування та прикладної метематики

Бібліографічний опис

Терейковская Л. А. Нейросетевая модель распознавания эмоций по голосу / Л. А. Терейковская // Управління розвитком складних систем : зб. наук. праць / Київ. нац. ун-т буд-ва і архітектури ; гол. ред. П. П. Лізунов. – Київ : КНУБА, 2020. – № 41. – С. 95 - 100. - Бібліогр. : 18 назв.

Зібрання

item.page.endorsement

item.page.review

item.page.dataset

item.page.dataset