...开源,并使用最流行的开源许可协议 GPL 发布。任何人均可以免费 获取本项目的全部源代码,并在许可条件下修改和再分发。 * __分布式架构__ 搜索程序的前端和后端可以分离部署在不同服务器中,对于大规模的搜索应用还...
...添加不会自动去重的哦。 [/quote] 还一个问题 我搜索123可以出来结果 搜索12 却不可以出结果 怎么回事? [/quote] 出不来才是对的啊,这是全文检索不是 LIKE '12%' [/quote] 我用的是工具生成的搜索骨架!
...rch采用 scws 分词 xunsearch好像集成了 scws 对于分词 xunsearch 可以通过 XSTokenizer 扩展 我想问的是 既然是 集成scws 那么 1.有没有提供scws的api接口,实现短语分词功能 2.是否可以对scws自定义中文词典,方便扩展
...- Notice: src/ 下的 cmd.c 必须先编译 libscws/ 生成 libscws.a 才可以。 phpexe/ 下的 libscws 直接连接 ../libscws 安全起见请先在 libscws/ 执行 make clean[/quote] 现在还没搞明白,能有个详细的操作指引么? 我的环境是windows,php5 我不懂c...
如果只要文章中有Linux出现就算是Linux相关文章的话,其实是不需要分词了,直接用全文搜索Linux就好了。 只是SCWS目前看前来它的自定义词典不支持超过3个字,如果可以的话,可以通过自定义“Linux优化”来指定分词
还是不明白! 你把这段文字用scws切割会有问题吗?如果你这段字是用空格或逗号分隔,那么你可以用 split 这个分词器啊。 搜索的时候搜索任何一个分割后的TAG都可以搜索到。
...因为通常用户不能很好的自我归类。 我想XUNSEARCH是否可以实现, 文章发过来的,自动分词的基础上,得出最适合本文的标签。 这里可以按照权重来给标签来个排序,如:热门度,关联度,重复度等等。 如果xunsearch能出...
xunsearch/bin/xapian-check xapian-inspect 这几个工具可以检查一下数据库,看看是不是坏了。 还有你可以试试用命令行的 util/Quest.php --db=db_a,db 这样强制指定DB库来测试一下呢?
词库的字节序原因,你可以在 ppc 处理器上重新用 bin/gen-scws-dict 制作一份词库就可以了。