Contextual Information Representation Technique based on 5 steps (CIRT.5) é uma nova técnica de representação de textos baseada no Modelo de Espaço Vetorial. Essa técnica assume que a relação de frequência entre os termos é dependente, considerando a dependência de um conjunto de termos correlacionados (contexto) diretamente proporcional à frequência com que seus termos ocorrem em um documento de texto.
Contextual Information Extraction Technique based on 5 steps (CIET.5) é uma nova técnica de extração de informações contextuais baseada no Modelo de Espaço Vetorial. Analogamente à técnica CIRT.5, essa técnica assume que a relação de frequência entre os termos é dependente, considerando a dependência de um conjunto de termos correlacionados (contexto) diretamente proporcional à frequência com que seus termos ocorrem em um documento de texto.
Ferramenta para treinamento de modelos Doc2Vec.
Representações de documentos baseadas em expressões do domínio
Ferramenta para gerar representações de documentos com base em papéis semânticos.
RotuLabic is a system developed to support manual labeling of documents. The system uses a transductive learning algorithm to recommend labels to the user and, thus, supports the manual labeling work. Currently, the system interface is available only in Portuguese.
Inductive Classification Tool was developed in Java language and aims to generate results using traditional inductive algorithms and their different parameter for datasets represented in ARFF format.
This is a Java tool which transforms text files in a document-term matrix.
This tool extracts keywords from single documents using statistical methods.