Gå direkte til innholdet
???????? ?????? ??????? ???????? ???????
Spar

???????? ?????? ??????? ???????? ???????

pocket, 2023
Russisk
Результаты, полученные в этой системе с использованием MFCC+LPCC с SVM, заслуживают высокой оценки. Уровень распознавания системы составляет 81,2% для IITKGP-SESC, 78,6% для EmodB и 70% для базы данных, записанной в реальном времени. MFCC и LPCC, соответствующие каждому произнесению каждой эмоции в базах данных, были вычислены, и их объединение используется для извлечения признаков вместе с их коэффициентами дельта и двойная дельта. Эти извлеченные функции обучающих файлов обучаются модели SVM. Позже характеристики тестовых файлов передаются в качестве входных данных в классификатор SVM для прогнозирования. Затем проводится классификация тестовых образцов и рассчитывается процент как совпадающих, так и несовпадающих эмоций с использованием матрицы путаницы. Производительность базы данных, записанной в реальном времени, ограничена внешними факторами, влияющими на высказывания говорящего, такими как шум в сигнале и среда, в которой осуществляется запись. Производительность можно повысить за счет использования высококачественных аудиоустройств в условиях отсутствия шума. Кроме того, большое количество обучающих выборок повышает производительность. В заключение можно твердо заявить, что, несмотря на определенные ограничения, данная система обеспечивает заметную эффективность и точность.
ISBN
9786206959670
Språk
Russisk
Vekt
141 gram
Utgivelsesdato
19.12.2023
Antall sider
88