2022-01-21 14:11:23 - Atualizado em 2022-01-21 14:12:31
O trabalho foi aceito no 18th XVIII Encontro Nacional de Inteligência Artificial e Computacional (ENIAC 2021), obteve o prêmio de melhor artigo da trilha principal e aborda dois tópicos principais:
O trabalho propõe o método TripleVAE, um Variational Autoencoder Multimodal que representa os eventos. O método explora três modalidades: (i) embeddings geradas pelo modelo de linguagem dependente de contexto Bidiretional Encoder From Transformers (considerado um dos estado-da-arte para tarefas envolvendo texto) que capturam características sintáticas e semânticas dos textos; (ii) informação de tópicos dos eventos, uma vez que eventos contêm tópicos bem definidos e (iii) geolocalização dos eventos (latitude e longitude). Depois de representados, os eventos de interesse são detectados por meio do OCL. No OCL, é definida uma classe de interesse e o usuário fornece um conjunto de exemplos desta classe para o algoritmo treinar. Dessa forma, quando um novo exemplo for apresentado ao algoritmo de OCL, o exemplo pode ser atribuído à classe de interesse ou não. Portanto, é possível minimizar o esforço de rotulação do usuário, uma vez que o mesmo não terá que rotular eventos de não interesse. No cenário de OCL, o TripleVAE apresentou melhores resultados em 10 coleções de eventos e em 4 de 5 métricas do que outros 3 métodos de representação de eventos.
Mais detalhes: