2018-03-03 23:49:33 +08:00
|
|
|
|
# 3.0 - 更简单的定制和配置,增加了额外的开销
|
|
|
|
|
* 去掉nearby words, 使用 kdtree检索空间词汇的最近临
|
|
|
|
|
* 增加了对sk-learn的依赖,但是减少了对词向量的预处理
|
|
|
|
|
* 优化了分词所使用的字典,也可以使用环境变量声明主字典
|
|
|
|
|
* 支持自定义word2vec模型,使用环境变量声明
|
|
|
|
|
|
2018-03-02 11:07:45 +08:00
|
|
|
|
# 2.5
|
|
|
|
|
* 使用空间距离近的词汇优化编辑距离计算
|
|
|
|
|
|
2018-03-01 23:29:35 +08:00
|
|
|
|
# 2.3
|
|
|
|
|
* 计算相似度时增加平滑策略
|
|
|
|
|
|
2017-10-28 10:06:11 +08:00
|
|
|
|
# v1.6
|
|
|
|
|
* use ```jieba``` instead of ```thulac``` as tokeninzer.
|
|
|
|
|
* refine console log for Jupyter notebook.
|