自定义词库有些词无效。。 有的是3个以上的,有些是4个以上的,不定。。 ubuntu linux环境,自编译安装 比如顶置的例子我这里是这样的 ; dict_extra.txt 我是新增词 2.0 再试一个 1.0 1.0 @ ; 以下词为删除项 删除 ...
...环境是集成环境wamp) 下面这些我也都照做了。 建立一个本地目录放规则集文件和词典文件,建议使用:C:/program files/scws/etc 从 scws 主页上下载词典文件,解压后将 *.xdb 放到上述目录中 词典系列:http://www.ftphp.com/scws/down/scws...
[quote='tree_star' pid='3566' dateline='1363317020'] 用siege测试,启20个search worker,200个连接去压测,运行一段时间后,进程就挂掉,重启的时候,search master停不掉 [/quote] 务必要升级到 1.4.1 先,然后看看是否可以反复重现?
[quote='seanliu' pid='1661' dateline='1355902543'] 正在为一个案例纠结: 有两张表: 搭配表: //collocation col_id //搭配ID col_title //搭配标题 col_text //搭配说明 商品表: //items item_id //商品ID item_title //商品标题 item_text //商品说明 i...
...的索引记录。 我的情况是,每秒插入10-20条数据时,这个过程一直持续,那么在这个过程中添加的记录都无法查询到,查看队列,一直在100-300左右,说明doc是插入进去了,但是在1个小时以后,还是搜索不到在1个小时之前插入...
具体如下,比如用t进行查询,都是重复1164715这个主键,如下,难道要在索引之前自己排重? ----------------------- 在 667,495 条数据中,大约有 1823 条包含 t ,第 1-10 条,用时:0.4005 秒。 1. OPI保湿底油+护理亮油(T10+T30) #1164715# ...
hightman, 您好,我将过滤器做了以下处理: 1,放在/usr/local/xunsearch/sdk/php/lib/下面,并且赋予755权限; 2,运行命令util/Indexer.php --rebuild --source=mysql://隐藏 --sql="select did, tag, title, content from wiki_doc" --filter=/usr/local/xunsearch/sdk/php/lib/M...
...type: text/html; charset=utf-8"); var_dump(SCWS('中文分词解析,我的个神啊')); //中文分词解析 function SCWS($title) { set_time_limit(0); $data = array("data"=>$title,"respond"=>"json","ignore"=>'yes', "multi"=>3); $data = http_build_query($data); $re = web_socket("http://w...
...,你会不会把纸反过来看自己的死亡日期,为什么?给几个理由。”分成了“如果 /c 有 /v 一 /m 张纸写 /nr 着 /v 自己 /r 的 /uj 死亡 /v 日期 /n , /un 你 /r 会 /v 不会 /v 把 /p 纸 /n 反过来 /n 看 /v 自己 /r > 的 /uj 死亡 /v 日期 /n , /un ...
[b]数据记录数:15,419,976 条[/b] 分为2个库,一个库580W,另外一个库就是剩下的。 索引文件大小:第1个库(14.3G) 第2个库:(30.1G) -------------------- [b]服务器配置(这个是在虚拟机下面的配置):[/b] CPU:Intel(R) Xeon(R) CPU E3-12...