对于能够枚举出来的“1天”、“2天”……可以用自定义词库来解决,但对于如题所示的情况,组合太多,不可能在自定义词库里都枚举出来,所以想问下老大,是否有什么解决方案来达到这个效果?
[root@IDC-D-1115 etc]# /usr/local/scws/bin/scws -i 我今天看到了一条狗 我 今 天 看 到 了 一 条 狗 +--[scws(scws-cli/1.1.8)]----------+ | TextLen: 18 | | Prepare: 0.0001 (sec) | | Segment: 0.0001 (sec) | +--------------------------------+ ...
既然有php扩展,为什么不推出一个php+mysql版本的,把词库放在mysql中,这样可以更方便我们对词库的扩展和管理,更加降低入门门槛,对scws的发展也会有一定的帮助。
[quote='bigxu' pid='7789' dateline='1399872014'] 我也碰到过这个问题,是加了一个品牌字段,并且增加了权重。 [/quote] 。。。嗯,明明是一个已定义的词语,非要拆分了弄出一些不相干的结果。。。咋办啊
$hdr['fsize'] 是从 XDB 的头部 unpack 出来的,可能 xdb 文件损坏了,PSCWS4的XDB文件必须和SCWS一样,从 www.ftphp.com/scws/ 下载
http://bbs.xunsearch.com/showthread.php?tid=2141&pid=4025#pid4025 我找到了这个帖子,不过好像结果更离谱了。 自定义的直接搜不到了理想的结果了,而数据库是存在完全匹配的。。。
[quote='hpxl' pid='7811' dateline='1400033006'] sdk/php/app/demo.ini配置 [id] type = id [/quote] 是scws-1.2.2 的如何让它支持自已定义的英文词库? 像http://bbs.xunsearch.com/showthread.php?tid=3088 这样修改代码吗?
[quote='hightman' pid='7795' dateline='1399967280'] 这不是切分。这是增加匹配,以同义词的形式支持切分后的短词匹配。 [/quote] 嗯,确实呀,不过这个需求估计很多自定义的同学都希望自己可以调整设置吧。 谢谢管理员:D。