1. 全文检索,此次全文搭配数据库进行。测试中大概有 45万篇文章,约900万个词(是分好的词不是字)。 检索效果还不错,如果纯单词进行检索效果相当好。长句略慢。。。。 [url=http://www.dot66.net/search2.php]http://www.dot66.net/...
按官方提供的测试数据,索引大小大约为数据大小的3.5倍。 我不是很理解,为什么索引的东西反而比原数据大,而且是3.5倍。 照理说,索引的东西是源数据的精华精简来的,应该小才对?
...没有连接推广名呢?我加上您的连接撒,既然是用了您的东西,就应该加上您的连接,这是做人的基本,我墓前是用的是centos+php+python+c+ImageMagick++Scws+sphinx+memcached 应该也算是个典型案例了,我的网站流量不大,但是地接很大,...
晕啊,看来是MYSQL这个东西不兼容真多啊。 utf8 不加引号吧? 当时 tina那儿说要写成 utf-8 。。。 这个 PDO 的版本很多,有些情况 是在 DSN里指定就好。下次统一修正一下。谢谢
锅炉的用法上 No. WordString Attr Weight(times) ------------------------------------------------- 01. 法上 nz 14.14(1) 02. 锅炉 n 5.86(1) 分词也不对的[hr] 下载的rules.ini里没有v+v=10这个东西
...最大颗粒分词?:exclamation: (弱弱的说,我没有找到这方面的东西. 哪位同仁,可以给我点提示和援助啊?:huh:)[hr] 在线先行回复,项目进行的很急啊 QQ:471347130 (自己一直使用lucene做开发.但是,在分词技术上,总会遇到问题.希望可以在xunsea...
...elect * from user" --project=sokc,怎么写php脚本(类似后台的东西)达到同样的建立索引效果呢?