Projetos

...

Democratizando pesquisas com Grandes Modelos de Língua via Open Pre-Trained Large Language Models

Este projeto visa investigar o uso do Instruction Meta-Learning (IML) para ajustar modelos Open Pretrained Large Language Models em cenários de baixo custo computacional. A iniciativa busca encontrar um equilíbrio entre desempenho e custo, promovendo o desenvolvimento de modelos de linguagem no âmbito da ciência aberta, sem depender de APIs proprietárias. A disponibilização recente de modelos de acesso aberto e a possibilidade de ajuste fino localmente para ambientes com menos recursos computacionais também promovem a democratização do uso de Large Language Models, ampliando o acesso a essas poderosas ferramentas de processamento de linguagem natural.

...

Representações de séries temporais semanticamente enriquecidas com informações textuais

Os modelos de previsão em séries temporais visam coletar e analisar observações do passado para estimar dados futuros. Fatores externos podem influenciar os dados em séries temporais, como eventos políticos, crises econômicas, política macroeconômica do governo e outros. Informações textuais extraídas de notícias, fóruns e redes sociais podem ser um fonte importante de conhecimento sobre fatores externos e potencialmente úteis para modelos de previsão de séries temporais. Alguns estudos apresentam técnicas de mineração de texto para combinar dados textuais com séries temporais, gerando representações alternativas para modelos de previsão. Neste projeto, é utilizado o uso de características semânticas e modelos de linguagem neural para enriquecer séries temporais com mais informações semânticas e estratégias de previsão com base na arquitetura do modelo transformers.

...

One-Class Learning For Heterogeneous Graph Neural Networks

Grafos modelam problemas do mundo real. Nos diferentes problemas de classificação modelados por grafos, existe uma classe que interesse. Considerando o aprendizado de máquina, o One-Class Learning (OCL) é capaz de classificar instâncias de uma determinada classe observando somente instâncias desta classe uma vez que o OCL treina somente com estas instancias e posteriormente classifica uma instancia como pertencente a classe de interesse ou não. Portanto, One-class graph learning é uma estrategia atrativa para resolução de problemas do mundo real. Podemos dividir os trabalhos de One-class graph learning em três familias: (i) graph embeddings em conjunto com o OCL; (ii) Graph Neural Networks não supervisionadas em conjunto com OCL; e (iii) One-class graph neural networks (estado-da-arte). O objetivo central desse trabalho é avançar o estado da arte de one-class learning para graph neural networks.

...

Multimodal Variational Autoencoder for Text Representation in One-Class Classification

O One-Class Learning (OCL) é um tipo de aprendizado de máquina em que o usuário rotula somente textos da classe de interesse, o que torna esse método mais viável em aplicações de classificação automática de textos enquanto diminui o esforço de rotulação do usuário. Os algoritmos de aprendizado de máquina necessitam de representações estruturadas e os textos são naturalmente não estruturados. Por isso, os textos devem ser estruturados. Os algoritmos de OCL não aprenderem com representações de contra-exemplos da classe de interesse, o que torna desafiador a maneira de representar esses textos. Portanto, nesse mestrado é proposto um método chamado Multimodal Variational Autoencoder (MVAE) para representar os textos da classe de interesse. O MVAE é uma rede neural que aprende uma representação a partir de mais de uma modalidade, o que torna a representação aprendida mais robusta e apropriada para o OCL.

...

Pinda Systematic Mapping

This web page, based on the Pinda tool, presents additional visualizations for a systematic mapping study about text mining and semantics titled "Text mining and semantics: a systematic mapping study".

...

Exploração de informações contextuais para enriquecimento semântico em representações de textos

Esse projeto de mestrado tem o objetivo geral de contribuir para uma melhora na performance de algoritmos supervisionados de Aprendizado de Máquina na tarefa de classificação automática de textos. De acordo com os experimentos realizados, os resultados obtidos indicam uma efetividade promissora das técnicas propostas CIRT.5 e CIET.5 utilizando modelos de linguagem baseados em word embeddings, e o uso de fontes externas de conhecimento para o enriquecimento semântico e contextual tanto das representações de textos quanto dos contextos textuais extraídos.

...

Análise e mineração de redes sociais

Redes sociais online são plataformas web que refletem as estruturas de redes sociais do mundo real, tais como redes de amizades, profissionais, familiares, entre outras. Nos últimos anos, o estudo das redes sociais tem atraído a atenção da comunidade científica pela sua variedade de aplicações, tais como: sistemas de recomendação de amizade, locais e produtos, sistemas de planejamento de viagens, e social cataloging, que permite aos usuários organizar suas coleções (de livros, músicas, lugares visitados, entre outros) enquanto interagem com outros usuários e anotam suas impressões e recomendações. Algumas dessas redes contém informações de geolocalização dos usuários que abrem portas para uma gama maior ainda de aplicações.

Mostrando de 1 até 7 de 7 registros