Classificação de opinião no Twitter em português utilizando o Multilingual Universal Sentence Encoder para apoiar pesquisas sobre filter bubble

CASTRO DOS SANTOS, JÔNATAS ; WOLFGAND MATSUI SIQUEIRA, SEAN . Classificação de opinião no Twitter em português utilizando o Multilingual Universal Sentence Encoder para apoiar pesquisas sobre filter bubble. In: XV Simpósio Brasileiro de Sistemas Colaborativos, 2019, Rio de Janeiro. Anais do Simpósio Brasileiro de Sistemas Colaborativos. Porto Alegre: Sociedade Brasileira de Computação – SBC, 2019. v. 15. p. 68-73. doi: 10.5753/sbsc.2019.7809


Classificação de opinião no Twitter em português utilizando o Multilingual Universal Sentence Encoder para apoiar pesquisas sobre filter bubble

Autores

Jônatas Castro dos Santos (UNIRIO)
Sean Wolfgand Matsui Siqueira (UNIRIO)

Resumo

Pesquisas sobre filter bubbles necessitam de mecanismos para capturar e classificar a polaridade de opinião de documentos em ambientes crowdsourced. Apresentamos um modelo preliminar baseado em aprendizado de máquina para classificar a opinião de tweets em português sobre o tema da Reforma de Previdência no contexto político brasileiro. Nossa abordagem utiliza o Multilingual Universal Sentence Encoder for Semantic Retrieval, um modelo pré-treinado recém-lançado por pesquisadores do Google para gerar representações vetoriais semanticamente ricas. Treinamos e classificamos nosso dataset em uma rede neural profunda feedfoward. Nosso modelo preliminar apresentou uma acurácia média de 82%. Esta tarefa é parte de um trabalho em andamento que visa apoiar a realização de pesquisas sobre filter bubbles.

Palavras-chave:

Classificação de opinião, Twitter, Multilingual Universal Sentence Encoder, Filter Bubble, Bolhas de filtro, Reforma da previdência, Google

 

doi: 10.5753/sbsc.2019.7809