发布时间:2011-03-21 20:03 t
By zfzeng
自定义的词库没有数字,可是对含有数字的一段话,还是把数字给分出来了,
怎么样才能忽略对数字的分词呢?
发布时间:2011-12-16 11:12 t
By abckk
碰到空格和3个以上的半角字符就会终止分词
发布时间:2012-02-22 19:02 t
By vanni
可以跟据词性在分词后自己过滤
分词过程中有一点奇怪的错误,如下:
输入:跑马的时候非常的卡
输出:跑马 | 的 | 时候 | 非常 | 的卡
输入:求最新的卡怪物方法
输出:求 | 最新 | 的卡 | 怪物 | 方法
输入:这个副本可以单刷也可以组队去打
输出:...
如股票名:
*ST海龙
已经在词库中,但分词结果:
“ST”和“海龙”
请问有现成的解决办法吗?
经反复测试,ST海龙可以拆分,*ST海龙不可拆分
宝马3系
我想分词为 宝马 3系 不是 宝马 3 系
发布时间:2014-11-28 15:11 t
By tt123
自定义的分词文件怎么调用使用