Siirry suoraan sisältöön
Unterstützt Vector Machine Based Erkennung von Sprachgefühlen
Tallenna

Unterstützt Vector Machine Based Erkennung von Sprachgefühlen

pokkari, 2023
saksa
Die in diesem System unter Verwendung von MFCC+LPCC mit SVM erzielten Ergebnisse sind lobenswert. Die Erkennungsrate des Systems betr gt 81,2 % f r IITKGP-SESC, 78,6 % f r EmodB und 70 % f r die in Echtzeit aufgezeichnete Datenbank. Die MFCCs und LPCCs, die jeder u erung jeder Emotion aus Datenbanken entsprechen, wurden berechnet und ihre Fusion wird zusammen mit ihren Delta- und Doppel-Delta-Koeffizienten zur Merkmalsextraktion verwendet. Diese extrahierten Merkmale der Trainingsdateien werden auf das SVM-Modell trainiert. Sp ter werden die Merkmale der Testdateien zur Vorhersage als Eingabe an den SVM-Klassifikator bergeben. Anschlie end erfolgt die Klassifizierung der Testproben und der Prozentsatz der bereinstimmenden und nicht bereinstimmenden Emotionen wird mithilfe einer Verwirrungsmatrix berechnet. Die Leistung der in Echtzeit aufgezeichneten Datenbank wird durch externe Faktoren begrenzt, die die u erungen des Sprechers beeinflussen, wie z. B. Rauschen im Signal und die Umgebung, in der die Aufzeichnung durchgef hrt wird. Die Leistung kann durch den Einsatz hochwertiger Audioger te in einer ger uschfreien Umgebung gesteigert werden. Auch eine gro e Anzahl von Trainingsbeispielen steigert die Leistung. Zusammenfassend l sst sich festhalten, dass dieses System trotz gewisser Einschr nkungen eine beachtliche Effizienz und Genauigkeit bietet.
ISBN
9786206959625
Kieli
saksa
Paino
141 grammaa
Julkaisupäivä
19.12.2023
Sivumäärä
88