MÉTODOS DE CLASSIFICAÇÃO PARA DOCUMENTOS XML - UMA COMPARAÇÃO QUALITATIVA // METHODS OF CLASSIFICATION FOR XML DOCUMENTS - A QUALITATIVE COMPARISON
Resumo
A classificação de documentos semi-estruturados, a exemplo dos documentos XML, se torna necessária devido a grandes bases de dados que estão sendo criadas neste formato, em todas as áreas do conhecimento. A extração de informações úteis nessas bases é um grande desafio e passa necessariamente pela classificação das informações. Um dos principais desafios não é o de como classificar, mas sim o que classificar, em razão da possível heterogeneidade das bases de dados. Neste artigo descrevem-se e comparam-se alguns dos métodos e algoritmos utilizados para realizar esta tarefa.
ABSTRACT
The classification of semi-structured documents, like XML documents becomes increasingly necessary due to large databases that are being created in all areas of knowledge in this format. The extraction of useful information from these databases becomes a major challenge and necessarily involves the classification of information. One such challenge is not how to classify, but what sort, because of the possible heterogeneity of databases. In this article we describe and compare some of the methods and algorithms used to accomplish this task.
Palavras-chave
Todo conteúdo da revista está sob a licença
Revista de Sistemas e Computação. ISSN 2237-2903