项目主页: http://www.ftphp.com/scws/ 经过适当的语义词性规则调整, 目前有效的消除了大量的岐义切词. 列部分如下: 1. 学人家人肉搜索 2. 俄罗斯民调显示梅德韦杰夫人气急升 3. 奥巴马上台后中美关系如何变革 4. 结合成分子时 ...
...使用了吧。 如果有命令行可以在命令行运行 php -m | grep scws 看看有没有能加载 如果都还不行,可以看看php的运行日志(如果有开启)
自定义 SCWS 词库 如之前所说,我们所有的索引分词器默认为 scws,这也是我们开发的开源分词系统, 内置的词库基本上能满足绝大多数应用。但总有例外,这也就是即将说的如何自定义词库。 全局自定义词库 -----...
可能是你的加载路径不对吧,检查一下 php.ini extension_dir 的设置 如果加载运行 php -m开头会有一段错误消息
hightman: 补丁我试图去打了,但出现以下错误: patch -c libscws/scws.c scws.patch patching file libscws/scws.c Hunk #1 FAILED at 328. Hunk #2 FAILED at 684. 2 out of 2 hunks FAILED -- saving rejects to file libscws/scws.c.rej 补丁针对的版本是scws-1.5吗?
mblen 只是个指针,指向的是在 charset.c 中定义的全局变量,应当已经是共用的了; 至于 mode 看需要吧,只是一个整型 ,如果你在不同线程中切分建议各自用一个 mode ,除非你自己能确定它们的切词设置是共用的(主要用于保存...
...觉搜索速度还是不够,想看看其他的方案,因为xunsearch是scws+xapian,就想看看有scws+sphinx的方案。 我600多万的数据,4G内存,搜频率高一点的词都是5秒以上,xunsearch很好用啊,但是没办法……我建索引建了2天建好,搜索效果也...