10秒 10元 这样的想做为一个词要怎么配置 ?? 我尝试了修改rule.ini但是不成功。如果数字是全角的话倒是可以成为词,但我同时也需要半角的数字+单位 作为一个词,
安装使用了下,感觉有些词的相关搜索词只能从简单词找到更复杂的词: 比如 mi 的关联词是: mi2 mi1 mi2a mi1s mi2s mi-one 而 mi2 的关联词是: mi2s mi2a 没有mi 但是有些词就可以 从复杂的词 找到关联的简单词 比如手机...
你要用自定义词库 编写一个 dict_extra.txt 里面写上每个词,一个一行 然后调用 add_dict 加入词典
...tman' pid='7103' dateline='1319824645'] 你要用自定义词库 编写一个 dict_extra.txt 里面写上每个词,一个一行 然后调用 add_dict 加入词典 [/quote] 您好,用自定义词库是可以解决但却不是太方便,如果SCWS不能这样的配置,我还是用...
...身不是词,只是因为二元结合法所以scws自动将其合成为一个词。 复合分词是对原本是词的长词情况处理的,比如”中国“可以切成”中“+”国“+”中国“ 你的问题必须是 [code] $tk = $tokenizer->setDuality(false)->setIgnore(true)->setMul...
...呀 [/quote] 这样做确实是可以,只是这时候文件就只是一个联系数据库和scws的一个中介,一个很临时的东西。我的意思是想可不可以绕过它。
...身不是词,只是因为二元结合法所以scws自动将其合成为一个词。 复合分词是对原本是词的长词情况处理的,比如”中国“可以切成”中“+”国“+”中国“ 你的问题必须是 [code] $tk = $tokenizer->setDuality(false)->setIgnore(true)->s...
...的词语很多很多,希望能够整词匹配。 我看了 前面的一个帖子,说要修改源代码,请大侠指导一下,怎么修改? 那个文件以及大概的行数, 非常感谢!!!!
...见了 如果我启动系统自带词典 那么“北海”又就被分成一个词。 但是我想明确的分词 , “ 北海365” 作为一个词。怎么就不行呢。[hr] 经过测试,还发现。 不加载任何字典和规则。 数字是照样能给分词出来的。。似乎...