[quote='yunxiaoad2' pid='822' dateline='1336696429'] 你这样不是过滤蜘蛛,是“通过代码中的域名访问时,可以记录log”,但从你2小时未记录log来看,似乎用户后者搜索引擎能通过别的域名访问你的网站 比如,你在代码中配置的是www.xxxx....
...身就提供的功能,xunsearch 只是做了整合和规范。涉及的相关文件如下 (假设 $prefix 是您的安装目录) ~~~ $prefix/etc/dict_user.txt ~~~ 打开上述文件,文件开头已经有了相关注释和说明。这个文件就是自定义词库文件, 如果您同一...
非常不错,可以继续琢磨一下如何优化。第二次搜索同一关键词缓存起作用后速度应该能明显变快 此外似乎没有开启拼音相关的功能,个人认为拼音相关的纠错功能还是很实用的
xunsearch在搜索的时候 相关搜索和推荐搜索都是通过log分析来处理的但是有一个隐藏的弊端. 比如一些敏感词,如果一个人反复搜索的话,他的搜索记录就会进入log这样下次有人搜索的时候输入自动提示和相关推荐都会出现这种敏感...
如果要生成相关文档 可能会有大量的搜索 这样子log_db就会迅速的增加 达到好几个G 如果有开关就好了 只让用户搜索的部分进入log_db 还有搜索词加上附加条件后 也有这样的需求 比如搜索词满足一定的长度(5-10个汉字)添加...
来个邪门的方法,把六千常用汉字放进词典,坏处是会给相关性带来干扰 稍微正常的方法,去别的网站收集所有一字歌的汉字,导入,坏处是要记得更新 题外话,nutch默认就是单字索引,但为了单字要牺牲其他,比如最重要的...
...起作用后速度应该能明显变快 此外似乎没有开启拼音相关的功能,个人认为拼音相关的纠错功能还是很实用的 [/quote] 是的,没有开启,慢慢完善吧,领导要求急着上线,就先整个版本上线,其它功能慢慢添加
ERR_XAPIAN 的话你可以看一下 tmp/searchd.log 看看里面应该有相关的错误 或直接打印 XSException 的错误信息应该也有相关描述。 把错误信息提供全面一点我也看看
...均存放在此 - `log_db` 搜索日志数据库,用于存放搜索日志相关,用于实现相关搜索、搜索建议、拼音搜索等 如何开始使用索引? --------------- 在 `PHP-SDK` 中,索引管理由类型为 [XSIndex] 的对象所维护。在 [XS] 项目中,通过读取 [...
感谢站长的无私奉献及相关帮助,项目上线过程中遇到了很多问题,但都一一解决。 最终一句话总结: 请仔细的看文档 项目地址:http://search.dezhoudaily.com 功能实现: 定时更新文档,包括新增、删除 相关管理功能,慢...