当前位置:
  1. 首页 »
  2. 标签:分词
共 1 篇

VicWord纯PHP分词

VicWord,一个纯PHP完全靠词典的分词类,词典支持.igb和json格式,.igb格式需要PHP扩展,json比较方便。 VicWord,只有两个类和词典,一个分词类和一个添加词的类。支持utf-8编码格式的任意字符 分词: $fc = new VicWord('igb'); $arr = $fc->getWord('北京大学生喝进口红酒,在北京大学生活区喝进口红酒'); //北京大学|生喝|进口|红酒|,|在|北京大学|生活区|喝|进口|红酒 //$arr 是一个数组 每个单元的结构[词语,词语位置,词性,这个词语是否包含在词典中] 这里只值列出了词语 $arr = $fc-
笔记 1,826