...og分析来处理的但是有一个隐藏的弊端. 比如一些敏感词,如果一个人反复搜索的话,他的搜索记录就会进入log这样下次有人搜索的时候输入自动提示和相关推荐都会出现这种敏感词,有什么方法可以在保证搜索记录正常的条件下,在...
你编译的SCWS.SO和所用的PHP不是同一个版本。。。重新用对应配套的 phpize php-config 吧,如果你的系统有默认装的早先的php 请在 ./configure 中明确的用 --with-php-config=.... 指定真正在用的PHP-CONFIG
这个分词系统虽说是简易的,但是我觉得还是过于强大了 譬如说像我们行业类网站,要分的词不多,屈指可数,也可能就几百个 如果能提供分词方法,和一个自己可以添加的词库就好了 呵呵 谢谢
发现xunsearch很有前途的。 如果能够再将爬虫部分也一起组合起来,并提供前端PHP页面。。。提供一体化的解决方案就更方便了。。。。
这是效率测试。。。性能完全是硬伤 如果在高并发时候 都是一些第一次检索的关键词 这时%wa会很高 更别说一个请求页面就二次检索的那些 一个访问效率是不错 还是不适合这种多数情况
已解决,原来,hightman给的是php4.4.x的扩展 如果是5.2.x的请下载Ben 的 "点击下载 SCWS 扩展 PHP 5.2.x 版二进制文件"
谢谢 hightman 这个接口是read log_db中的内容吧。一个项目会有一个log_db。 如果按照项目来,那样会不会有什么不好的地方呢?