.../local/etc/dict_chs_gbk.xdb", SCWS_XDICT_MEM); 这句话出了问题, 也就是可能词典不正确. 但这个词典目前测试在64位系统下也是可以正常工作的, 检查一下词典的字节数是不是没有下载完整. [/quote] 谢谢您的回复,词典是用README中提供的...
...比如索引库有1000万份文档了 这些文档有共同的特征 然后就是搜索一些共性的关键字有200万个结果 比如一页显示10条 一般来说,作为一个搜索的话让点到20万页是毫无意义的 假设我们这里限制到100页 我发现如果搜索结...
[quote='hightman' pid='3685' dateline='1282406611'] 返回的时候根据长度排除啊,GBK的话单字就是2字节,很好判断啊,UTF-8三字节,但也能判断出是不是一个单个的汉字 [/quote] 原来如此。明白了。非常感谢!
谢谢hightman,就是没有安装g++。 接着把步骤记录一下吧,备忘: # apt-get install g++ # apt-get install zlib1g-dev # apt-get install mysql-server # apt-get install apache2 # apt-get install php5 # apt-get install php5-mysql 需要配置的文件位置如下: apache 的配置...
unique id = table_name + id_in_table 将主键修改为 Table1_1 和 Table2_1 就好了呀 检索结果中提取 id 中 最后一个 _ 之前的部分就是 table 名了。
报上面错误的原因是没有给type为id的主键赋值,也就是pid没有值。字段赋值时如果不指定,就字段必须一样。如果在赋值的时候指定也可以不一样啊。例如$arr['pid'] = $tmp['id'];
...同品牌的CPU频率一样但性能不一样 影响检索速度的其实就是看XS本身是怎么处理数据了
我想请教一个问题,就是我使用的是C版的scws库,函数scws_set_dict和scws_add_dict加载一个大小为58K的txt字典文件的时候出现了递归的堆栈溢出。但是我将该txt字典转换成xdb文件后再次调用,就不会出现该问题了? 但是如果资源使...
初步看了就是死锁吧,反正并发越来越高,所有任务处理不完,直到内存耗尽。 下一步继续优化一下线程检测再看看吧,短时间你就自己定时重开服务吧。只要杀掉 xs-searchd子进程即可。
...et'],'multi'=>$number) 目前来看,武汉都被分开了. 我的建议就是,scws是否可以针对不同的站点有不同的解决方案.比如汽车类型网站,游戏类型网站,就如同搜狗输入法的词库.我估计如果搜狗要是也能加入中文分词阵营,会是一个很大...