2021-09-20 15:01:58

Abordagem baseada em redes para Positive and Unlabeled Learning no periódico Information Sciences

Por Ricardo Marcacini

Pesquisadores do LABIC/ICMC-USP e LIVES/UFMS publicam abordagem baseada em redes para Positive and Unlabeled Learning no periódico Information Sciences.

O aprendizado com exemplos positivos e não rotulados (do Inglês Positive and Unlabeled Learning - PUL) permite identificar em um conjuntos de exemplos não rotulados os documentos positivos (os quais o usuário rotulou ou tem interesse) e os exemplos negativos. Além disso, uma vez identificados documentos positivos e negativos, pode-se induzir modelos de classificação para classificar exemplos não vistos. 

 

Nesse artigo, publicado no Journal of Information Sciences, é proposta uma abordagem inteiramente baseada em grafos para o PUL. A proposta é dividida em 3 etapas: (i)  construir um grafo baseado em similaridades, (ii) identificar exemplos negativos confiáveis, e (iii) executar um processo de propagação de rótulos para a classificação dos exemplos remanescentes (não rotulados) como positivos ou negativos. Além de possuir etapas simplificadas em relação a outras abordagens de PUL, a proposta foi capaz de melhorar em 2% a performance de classificação considerando um único exemplo positivo rotulado, e em até 28% quando considerando 30 exemplos positivos rotulados.

Mais detalhes: https://doi.org/10.1016/j.ins.2021.08.099