Última alteração: 2017-10-10
Resumo
Investiga a utilização dos sintagmas nominais no processo de indexação automática de artigos de periódicos da área de Ciência da Informação. Tem como objetivo verificar a validade da hipótese que a indexação automática por sintagmas nominais do título e resumo permite obter um bom nível de revocação das palavras-chave, o que motiva o uso do título e resumo como entrada para sistemas de indexação automática por sintagmas nominais na construção de bases de dados científicas. A pesquisa é exploratória e experimental (empírica), pautada em estudo de caso. Avalia a revocação das palavras-chave dos autores na indexação automática por sintagmas nominais do título e resumo dos 60 artigos de periódicos do corpus de Souza (2005), utilizando as palavras-chave como padrão de referência de qualidade na indexação. O experimento consiste em: extrair os sintagmas nominais dos documentos compostos por título e resumo através da plataforma de processamento e extração de informação denominada PyPLN; comparar os sintagmas nominais extraídos com as palavras-chave; e mensurar a revocação das palavras-chave. A análise da revocação das palavras-chave na indexação automática por sintagmas nominais, indicou que em 66,6% dos documentos (40 documentos) foi obtido um nível de revocação igual ou superior a 50%, em 26,6% (16 documentos) o nível de revocação ficou entre 14% e 43%, e em 6,6% (4 documentos) o nível de revocação foi 0%, sendo a média de revocação obtida de 56% das palavras-chave por documento. Portanto, conclui-se que a indexação automática por sintagmas nominais do título e resumo dos artigos científicos apresentou bons resultados quanto ao nível de revocação das palavras-chave e que com o tratamento de casos especiais, como a utilização de termos estrangeiros e de caracteres especiais, os resultados podem ser melhorados.