Portal de Conferências, XIX ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO (XIX ENANCIB)

Tamanho da fonte: 
BIG DATA NO CONTEXTO DE DADOS ACADÊMICOS: O USO DE MACHINE LEARNING NA CONSTRUÇÃO DE SISTEMA DE ORGANIZAÇÃO DO CONHECIMENTO
Fabio Piola Navarro, Caio Saraiva Coneglian, José Eduardo Santarem Segundo

Última alteração: 2018-10-24

Resumo


A quantidade de dados no âmbito acadêmico tem aumentado significativamente, sendo causado principalmente pelo aumento da quantidade de documentos científicos. Neste sentido, há uma poderosa fonte de informação, enquadrada no contexto do Big Scholarly Data, que pode ser utilizada para análise e o aprimoramento das tradicionais técnicas da Ciência da Informação, ao fornecer um conhecimento relevante para a construção de Sistemas de Organização do Conhecimento que reflitam com mais veracidade dados contidos nestes ambientes. Adicionalmente, uma forma de realizar o tratamento e a análise desse conglomerado de dados é relativo ao machine learning. No entanto, é necessário refletir como as técnicas de aprendizado de máquina quando aplicado a grandes volumes de dados podem favorecer a construção de sistemas de organização de conhecimento. Assim, o objetivo deste trabalho é discutir a aprendizagem de máquinas, em especial o método topic modeling, no processo de construção de sistemas de organização do conhecimento, visando discutir como dados pertencentes ao domínio do BSD podem fornecer informações necessárias para aprimorar os instrumentos de organização do conhecimento. Para isso, utilizou-se de uma metodologia com característica tanto bibliográfica, quanto aplicada. Enquanto resultados, primeiramente, foi proposto um modelo teórico, que vincula os dados de repositórios digitais, com as técnicas de machine learning, para a construção de sistemas de organização do conhecimento. Para validar esse modelo, realizou-se uma prova de conceito que utilizou o método topic modeling e o LDA para identificar tópicos de interesse dentro de um corpus científico de um repositório digital no intuito de organizar, sumarizar e entender seu conteúdo, visando fornecer uma base para a construção de sistemas de organização do conhecimento. Por fim, concluiu-se que a aplicação das técnicas de machine learning contribui para fornecer um panorama amplo sobre os dados contidos em repositórios digitais, sendo uma base bastante rica para apoiar e aprimorar a construção de sistemas de organização do conhecimento.

Palavras-chave


machine learning; repositórios digitais; topic modeling; sistema de organização do conhecimento.

Texto completo: PDF