当前位置:
  1. 首页 »
  2. 标签:结巴分词
共 1 篇

结巴(jieba)分词PHP引入6M字典(40万关键词),明显卡顿

最近在弄一个自动抽取关键词,折腾了一下结巴(jieba)分词,默认的情况下,对于分词不算很满意,于是找了一个40万关键词的字典,引入时,发现卡了很多,即便出来结果还算满意,相对于速度,还是放弃自定义字典!(还是怀念以前DZ的分词接口) 结巴分词关键使用代码(PHP版): <?php ini_set('memory_limit', '1024M'); require_once "jiebafc/vendor/multi-array/MultiArray.php" ; require_once "jiebafc/vendor/multi-array/Factory/MultiArrayFac
笔记 1,031