Na era da tecnologia da informa o, os documentos textuais est o a aumentar espontaneamente na Internet, no correio eletr nico, nas p ginas Web, nos relat rios offline e online, nas revistas, nos artigos e s o armazenados em formato de base de dados eletr nica. Milh es de novos ficheiros de texto s o criados por dia e, por falta de classifica o, as pessoas perdem uma vasta informa o que til para v rios desafios. A manuten o e o acesso a esses documentos s o muito dif ceis sem uma classifica o adequada e, quando existe uma classifica o sem qualquer informa o, chama-se clustering. Para ultrapassar estas dificuldades, os algoritmos K-means e outros algoritmos de clustering antigos n o s o adequados para dar o contributo que se espera das l nguas naturais. Devido elevada dimens o dos textos, presen a de pistas de estrutura l gica nos textos e s novas t cnicas de segmenta o, tirou-se partido dos avan os nos algoritmos de modela o de t picos generativos, especificamente concebidos para detetar quest es em intervalos de texto para cifrar distribui es de t picos de palavras. Assim, tendo em conta esta limita o, o algoritmo de agrupamento concetual COBWEB foi aplicado aos dados pr -processados. Para garantir a exatid o dos clusters, foram selecionados m todos de medi o da exatid o f-measure para avaliar os clusters.