Siirry suoraan sisältöön
Precisão do agrupamento de documentos textuais com abordagem semântica
Tallenna

Precisão do agrupamento de documentos textuais com abordagem semântica

Na era da tecnologia da informa o, os documentos textuais est o a aumentar espontaneamente na Internet, no correio eletr nico, nas p ginas Web, nos relat rios offline e online, nas revistas, nos artigos e s o armazenados em formato de base de dados eletr nica. Milh es de novos ficheiros de texto s o criados por dia e, por falta de classifica o, as pessoas perdem uma vasta informa o que til para v rios desafios. A manuten o e o acesso a esses documentos s o muito dif ceis sem uma classifica o adequada e, quando existe uma classifica o sem qualquer informa o, chama-se clustering. Para ultrapassar estas dificuldades, os algoritmos K-means e outros algoritmos de clustering antigos n o s o adequados para dar o contributo que se espera das l nguas naturais. Devido elevada dimens o dos textos, presen a de pistas de estrutura l gica nos textos e s novas t cnicas de segmenta o, tirou-se partido dos avan os nos algoritmos de modela o de t picos generativos, especificamente concebidos para detetar quest es em intervalos de texto para cifrar distribui es de t picos de palavras. Assim, tendo em conta esta limita o, o algoritmo de agrupamento concetual COBWEB foi aplicado aos dados pr -processados. Para garantir a exatid o dos clusters, foram selecionados m todos de medi o da exatid o f-measure para avaliar os clusters.
Alaotsikko
Processamento de Linguagem Natural com Semântica com a ajuda da WordNet. A exatidão do agrupamento é assegurada pela medida F
ISBN
9786208074876
Kieli
portugali
Paino
209 grammaa
Julkaisupäivä
1.9.2024
Sivumäärä
136