....utf8.ini 的 [attrs] 后方加入 p(1) + n = 5 即可 我们的DEMO已经更新,[url]http://www.xunsearch.com/scws/demo/v4.php[/url] 您也可以参见我们的 GITHUB 日志:[url]https://github.com/hightman/scws/commit/53269c304f6f8b84263ed18522152eb3b070c51a[/url]
每次更新都是期望改进,而不是倒退呵。 1.1.2 目前已经放入 [url]http://www.ftphp.com/scws/down/scws-1.1.2.tar.bz2[/url] 供下载。 您说的 1.1.2 在分词效果上比 1.1.8 还要好,可否指出哪几个实例 ?
...uild = true; return $this;} 开始重建索引 此后所有的索引更新指令将写到临时库, 而不是当前搜索库, 重建完成后调用 endRebuild 实现平滑重建索引, 重建过程仍可搜索旧的索引库, 如直接用 clean 清空数据, 则会导致重建过程搜索到...
没有特别去开进程来修改索引库阿. 我这里只是在数据有更新时才会执行性一次 --rebuild索引, 都是手工来做的. 我们现在的处理方式: 凌晨4:00 固定的去重起xunsearch, 如果没有做, 凌晨4:00多就挂掉。很奇怪,每天都这样。。
怎么样php怎么重建索引,数据库是mysql。 并且索引中的数据没在一个表中。得多条sql才能查完。 每次可能会一下更新好多数据。经常卡死。有木有方法可以跟mysql数据库同步。
不必客气, scws 主页上的1.0.3源码包已经同步更新了. 这是因为 php5.3以上版本更改了一些Zend API所致, 以前没有用到这个版本所以没有发现, 感谢您的汇报.
...万条请求你的服务器招架不住啊。。。 老大你的词库更新的好慢啊,2010年十二月距离现在都一年了,何况互联网上每天都有新词出现。。。总之拜托了!把TF/IDF算法公布出来吧。到时候大家都可以更方便的制作词库了,也会...
pscws4和scws大致相同的算法,只是后来pscws4没有再进一步更新了。 粗分毕竟只是粗分,要想正式用只用其中一种肯定是不够的。 scws 里面先按逐字把所有可能的词都列出来,建成一个2维表,然后把有岐义的部分拧出来,以其...
1.没有记录,不能直接调,系统只记录了一部分干净的词用于统计热门搜索、拼音建议 2.search.log是一个交换文件,系统定时取走更新入 log_db,不必理它。