我们的BBS现在有一百五十万篇的帖子,接近四百个版面,分在十二个区块里,而且帖子数目很不均匀。目前我是将所有数据都放在一个库内,搜索速度只能说还行,差不多0.5秒一次。 这种情况下是按版面分库好还是按区块分...
嗯 谢谢 这下有个大致的方向了 原先一直注意IO方面问题了 现在想想看 x3450的确比不过e-2370 由于多种因素在一块 比较难以区分
没有特别去开进程来修改索引库阿. 我这里只是在数据有更新时才会执行性一次 --rebuild索引, 都是手工来做的. 我们现在的处理方式: 凌晨4:00 固定的去重起xunsearch, 如果没有做, 凌晨4:00多就挂掉。很奇怪,每天都这样。。
...结果后,对结果如何进行处理获取自己想要的信息呢? 现在获取返回结果是这样的, a:2:{s:6:"status";s:2:"ok";s:5:"words";a:1:{i:0;a:5:{s:4:"word";s:12:"在线测试";s:3:"off";i:0;s:3:"len";i:12;s:3:"idf";d:8.19999980926513671875;s:4:"attr";s:1:"n";}}} 我如何用p...
...华大”,“大学”。 总之,原先有set_ignore时无返回的,现在全部拆成了一个一个单字,太奇怪了。[hr] 补充一句:我安装的版本是scws-1.2.2
...。。。 老大你的词库更新的好慢啊,2010年十二月距离现在都一年了,何况互联网上每天都有新词出现。。。总之拜托了!把TF/IDF算法公布出来吧。到时候大家都可以更方便的制作词库了,也会更愿意把自己的词库分享出来。
...scws 安全起见请先在 libscws/ 执行 make clean[/quote] 现在还没搞明白,能有个详细的操作指引么? 我的环境是windows,php5 我不懂c,不明白怎么生成扩展的 [quote]src/ 下的 cmd.c 必须先编译 libscws/ 生成 libscws.a 才可以。[/quote] 这...
...这两天正在尝试将SCWS与一国外的开源搜索引擎结合…… 现在目前已经成功用SCWS替换其原本的分词代码。 但是却发现一个问题,就是SCWS的适用范围似乎特别的窄…… 对于一个页面来说,通常含有数字、英文、英文标点、中文...
现在在虚拟机搭建的网站根目录是 /home/wwwroot/shikee 然后服务器上的网站根目录是/www 我用svn提交到服务器上 xunsearch的路径就不对了 需要修改哪些地方,还是必须要在服务器上重新安装?