Gå direkt till innehållet
Genauigkeit des Clustering von Textdokumenten mit semantischem Ansatz
Spara

Genauigkeit des Clustering von Textdokumenten mit semantischem Ansatz

Lägsta pris på PriceRunner
Im Zeitalter der Informationstechnologie nehmen Textdokumente ber das Internet, E-Mail, Webseiten, Offline- und Online-Berichte, Zeitschriften und Artikel spontan zu und werden in elektronischen Datenbanken gespeichert. Millionen von neuen Textdateien werden pro Tag erstellt, durch die fehlende Klassifizierung entgehen den Menschen viele Informationen, die f r verschiedene Aufgaben n tzlich sind. Die Aufrechterhaltung und der Zugang zu diesen Dokumenten ist ohne eine angemessene Bewertung sehr schwierig, und wenn es eine Klassifizierung ohne jegliche Informationen gibt, nennt man das Clustering. Um solche Schwierigkeiten zu berwinden, sind K-means und andere alte Clustering-Algorithmen ungeeignet, wie man es bei nat rlichen Sprachen erwarten kann. Wegen der hochdimensionalen ber Texte, das Vorhandensein von logischen Struktur Hinweise innerhalb der Texte und neuartige Segmentierung Techniken haben die Vorteile der Fortschritte in der generativen Thema Modellierung Algorithmen, speziell entwickelt, um Fragen in Intervallen Text zu verschl sseln Wort Thema Verteilungen. In Anbetracht dieser Einschr nkung wurde der COBWEB-Algorithmus f r konzeptionelles Clustering auf die vorverarbeiteten Daten angewendet. Um die Genauigkeit der Cluster zu gew hrleisten, wurde die f-measure-Genauigkeitsmessmethode f r die Bewertung der Cluster ausgew hlt.
Undertitel
Natürliche Sprachverarbeitung mit Semantik mit Hilfe von WordNet. Die Genauigkeit des Clustering wird durch F-Measure sichergestellt
ISBN
9786208074814
Språk
Tyska
Vikt
213 gram
Utgivningsdatum
2024-09-01
Sidor
140