2018-03-26 09:20:43 - Atualizado em 2018-04-11 18:32:51

Doc2Vec tools

Objetivo

O conjunto de scripts Doc2Vec tool possibilita a treinamento de modelos Doc2Vec [1], oferecido pela biblioteca gensim [2]. A partir dos modelos treinados, é possível obter embeddings dos documentos do dataset, ou inferir embeddings para outros datasets. Também há scripts para baixar e pré-processar o dataset da Wikipédia.


Download

Código - Doc2Vec tools


Equipe

Hugo Moraes Dzin

Roberta Akemi Sinoara

Solange Oliveira Rezende


Bibliografia

[1] LE, Q.; MIKOLOV, T. Distributed representations of sentences and documents. In: ICML-14 - Proceedings of the 31st International Conference on Machine Learning, p. 1188–1196, 2014.
[2] Gensim: https://radimrehurek.com/gensim/ (acessado em 10/04/2018).