可能因为词库中没有这个词,建议通过外挂一个文本型的扩展词典来解决。参见置顶贴子的说明!
有些罕用字不在词库里明确标明IDF,那么默认就为0
发布时间:2011-03-21 20:03 t
By zfzeng
自定义的词库没有数字,可是对含有数字的一段话,还是把数字给分出来了,
怎么样才能忽略对数字的分词呢?
在xdb.class.php中有一个函数Put,可以写入xdb词库.可是put的两个参数格式应该是什么样的?新人刚学php,看不懂的说,能不能有大神给我说一下.谢谢了
如股票名:
*ST海龙
已经在词库中,但分词结果:
“ST”和“海龙”
请问有现成的解决办法吗?
经反复测试,ST海龙可以拆分,*ST海龙不可拆分
发布时间:2013-01-09 19:01 t
By pingrj
数据库数据源是怎么回事,文档看完没怎么懂, 词库是怎么创建的?
又是怎么更新的呢?
繁体的词库当时是一个台湾的朋友给整理的,可能有一些误差
直接 scws 应该不行,没这个写法,规则集也是建立在非词库词的基础上。