MÉTODOS DE CLASSIFICAÇÃO PARA DOCUMENTOS XML - UMA COMPARAÇÃO QUALITATIVA // METHODS OF CLASSIFICATION FOR XML DOCUMENTS - A QUALITATIVE COMPARISON

Williams Diaz, Paulo Caetano da Silva

Resumo


A classificação de documentos semi-estruturados, a exemplo dos documentos XML, se torna necessária devido a grandes bases de dados que estão sendo criadas neste formato, em todas as áreas do conhecimento. A extração de informações úteis nessas bases é um grande desafio e passa necessariamente pela classificação das informações. Um dos principais desafios não é o de como classificar, mas sim o que classificar, em razão da possível heterogeneidade das bases de dados. Neste artigo descrevem-se e comparam-se alguns dos métodos e algoritmos utilizados para realizar esta tarefa.

 

ABSTRACT

The classification of semi-structured documents, like XML documents becomes increasingly necessary due to large databases that are being created in all areas of knowledge in this format. The extraction of useful information from these databases becomes a major challenge and necessarily involves the classification of information. One such challenge is not how to classify, but what sort, because of the possible heterogeneity of databases. In this article we describe and compare some of the methods and algorithms used to accomplish this task.


Palavras-chave


Documentos XML; Classificação XML; Algoritmos de Classificação; Métodos de Classificação; Mineração de dados; XML Documents; XML Classification; XML Algorithms; Classfiication Algorithms; Classification Methods; Data Mining.

Texto completo: PDF

Todo conteúdo da revista está sob a licença 

Revista de Sistemas e Computação. ISSN 2237-2903