diff --git a/README.md b/README.md index 9026292..7b0623c 100644 --- a/README.md +++ b/README.md @@ -17,6 +17,7 @@ Doc2Vec模型基于Word2vec模型,并在其基础上增加了一个段落向

min_count是指低于此数量是词忽略不计

workers指线程数量

原始语料进行处理之后对模型进行训练,得到模型并进行存储。下一次使用直接调用节省时间 +'corpus_seg.txt'为分词好的语料,需要自行准备。 结果分析 -------------