2021-09-20 15:01:58
Pesquisadores do LABIC/ICMC-USP e LIVES/UFMS publicam abordagem baseada em redes para Positive and Unlabeled Learning no periódico Information Sciences.
O aprendizado com exemplos positivos e não rotulados (do Inglês Positive and Unlabeled Learning - PUL) permite identificar em um conjuntos de exemplos não rotulados os documentos positivos (os quais o usuário rotulou ou tem interesse) e os exemplos negativos. Além disso, uma vez identificados documentos positivos e negativos, pode-se induzir modelos de classificação para classificar exemplos não vistos.
Nesse artigo, publicado no Journal of Information Sciences, é proposta uma abordagem inteiramente baseada em grafos para o PUL. A proposta é dividida em 3 etapas: (i) construir um grafo baseado em similaridades, (ii) identificar exemplos negativos confiáveis, e (iii) executar um processo de propagação de rótulos para a classificação dos exemplos remanescentes (não rotulados) como positivos ou negativos. Além de possuir etapas simplificadas em relação a outras abordagens de PUL, a proposta foi capaz de melhorar em 2% a performance de classificação considerando um único exemplo positivo rotulado, e em até 28% quando considerando 30 exemplos positivos rotulados.
Mais detalhes: https://doi.org/10.1016/j.ins.2021.08.099