...索引量是60W, 搜索时候主要是搜TITLE字段,然后按照几个其它NUMBER字段排了序, 搜的时候 同步search->query($query)了3次, 第1次是主搜索limit(30,$start), 第2次是limit(1,0) 查一下搜出来的最高价, 第3次是limit(1,0) 查一下搜出来的最低...
...似mysql like的效果,但是没有回复。 我自己曾尝试过几个做法,但都失败了 1. 利用xs自带的scws,这个英文明显是根据空格分词的,所以达不到效果 2. 自己写的一元/二元分词器,某些情况下可以正常工作,不过有时会返回一...
...的默认字符集。 * _--import=_ 导入搜索日志文件,每行一个词,每行的数据中可以用\\t(Tab键)分开指定次数,没有次数默认为1。 * _--put=_ 添加、更新搜索日志词汇,词与次数之间用半角冒号分隔,默认为 1 次。 多个词之间...
searchd.log片段,查了十几个error,附近的错误代码都是514: 麻烦了。怀疑内存问题,不行我就换vps了 2012-05-09 12:42:49 worker1[5905] new connection (SOCK:7, IP:127.0.0.1, BURST:1) 2012-05-09 12:42:49 worker1[5905] new connection (SOCK:8, IP:127.0.0.1, BURST:2)...
我举个例子吧 下面是用csws分词的结果,明显csws把email,网址给拆开了,还有标签没有去除,但是中文词是正确的分开了 postgres=# SELECT to_tsvector('zw_simple','pgsql中国社区论坛 http://www.pgsqldb.org:8079 chenaishen@263.net'); ...
正确写法,官方多写了一个T吧,那个代码反正我试验是错误的! [php] $cws->add_dict(ini_get("scws.default.fpath").'/dict.xdb'); $cws->add_dict("./dict_extra.txt", SCWS_XDICT_TXT); [/php] 在说说词分词测试: 我的网址:http://sjz.haojishu.com/tools/222.php...
刚才顺便把前2个功能给实现了,下一版本就可用了。我把 patch 贴上来你可以自己打一下补丁然后重新编译即可。 [code] Index: libscws/scws.c RCS file: /home/cvsroot/scws/libscws/scws.c,v retri...
...样做我估计对优化很有帮助。 选择scws的原因是比较了几个中文分词后,感觉scws是一个不错的分词系统。 xunsearch速度也比较快。安装的过程中也遇到了不少麻烦。主要是自己知道的也太少了。但是最终都解决了。主要还是hightma...
...定义词库。 全局自定义词库 ------------- 这是针对同一个 `xunsearch` 安装实例来讲,该服务端下的所有项目都将共用这个自定义词库。 严格来讲,这是 SCWS 本身就提供的功能,xunsearch 只是做了整合和规范。涉及的相关文件如下 ...
#问题 在全文中搜索长的英文时(10个单词左右,就是一篇文章的英文标题),速度较慢(大部分是0.5秒左右,有时1秒多,有时甚至2秒多),上次与hightman交流,说是配置可能有问题,贴出来大家帮看看,谢谢了! 搜索主要用...