解决了,是Greta的问题影响到了scws_free_tops,将项目设置改为MFC静态连接就可以了
非常感谢...也在刚开始学习xunsearch xunsearch采用 scws 分词 xunsearch好像集成了 scws 对于分词 xunsearch 可以通过 XSTokenizer 扩展 我想问的是 既然是 集成scws 那么 1.有没有提供scws的api接口,实现短语分词功能 2.是否可以对scws自定义中文...
[quote='hightman' pid='3654' dateline='1280386250'] 其实你可以定时或某种其它方案把你的词库统一生成.XDB文件呀 [/quote] 这样做确实是可以,只是这时候文件就只是一个联系数据库和scws的一个中介,一个很临时的东西。我的意思是想可...
...ss XDB_R::_check_header()里面执行 if ($fstat['size'] != $hdr['fsize']) return false就返回了。请问这说明什么问题呢?[hr] 事实上,$hdr['fsize'] = 13245833, 而$fstat['size']就是dict.xdb文件的大小4497408 ,那为什么$hdr['fsize']会等于13245833呢?
ini设置 [php] [example_attr] index = self tokenizer = split(,) non_bool = yes[/php] XS版本 xs-indexd: xunsearch/1.4.7-dev (index server) 查询结果没有任何变化,结果如下: [php]example_attr:jianyue,baise 45 ... jianyue,baise,qianhuang 207 ... zhongshi,hongse,baise 3...
...charset="utf-8", $suffix = false){ $suffixStr = $suffix ? '…' : ''; $re['utf-8'] = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|[\xe0-\xef][\x80-\xbf]{2}|[\xf0-\xff][\x80-\xbf]{3}/"; $re['gb2312'] = "/[\x01-\x7f]|[\xb0-\xf7][\xa0-\xfe]/"; $re['gbk'] = "/[\x01-\x7f]|[\x81-\xfe][\x40-\xfe]/"; ...
对只要编译一下 scws 扩展就可以了。在 xunsearch-full-xxx 下面有 scws-1.1.8/phpext 在此目录下 phpize ./configure make && make install 即可,以上步骤根据不同用户权限略有不同。
我打印了下611行的$rlen的值,发现在32位linux下,出错的时候$rlen的值已经变成了-774261301 这显然不是一个正常的值。 所以程序会报告fread错误,同时也导致了后面的一系列错误!