...的. 我们现在的处理方式: 凌晨4:00 固定的去重起xunsearch, 如果没有做, 凌晨4:00多就挂掉。很奇怪,每天都这样。。 [/quote] 今天发现这样重启后, 在05:00后还是发现xunsearch挂了。。。 请问hightman, xunsearch 每天晚上在后台有...
.../dict_user.txt 加入H61,但是不起作用,中文词汇是可以的。如果想分词结果中有H61,是不是只能自定义分词了?像这种商品的型号中很多类似的,如华硕主板H87-PLUS,H61、H87分别代表不同的主板芯片组。
...-------+ | 缓存模块 是 WARNING 对以后开发有没有影响?如果想要这个缓存模块正常工作,我应该这么做?
...定项目名称或配置文件路径,参数名可以省略不写, 如果仅指定项目名称,那么将使用 $prefix/sdk/php/app/.ini 文件。 * _-c|--charset _ 指定当前环境、查询语句的字符集,默认情况下, 搜索工具输出的字符集为 utf-8,并把搜...
...也可是远程库(通过 xapian 的 StubDatabase 来解决)。 3)如果你仔细看过我们的文档,它就是一个准实时的索引了,你提交的数据通过 sdk 转交给 xs-index 内部队列,由它统一写入索引库,延迟通常是若干秒吧。 4)你可以借助...
[quote='askie' pid='3233' dateline='1247660523'] 如果分词次数太多,很容易引起服务器假死,linux服务器! 请问老大有没有加载到内容进行调用的方法? [/quote] 当然有啊,你看一下说明吧. 我不清楚你用的是什么方式,是PHP还是c的API, set...
...0万页是毫无意义的 假设我们这里限制到100页 我发现如果搜索结果较多排序的时候引起首次搜索时间特别长 是默认排序的2-3倍时间 我想能不能API加入一些特征 进行快速的过滤 比如前2000条结果外的就不统计了[hr] 仔细想下...
...字段tokenizer 设为 split(|) [size=large][color=#FF0000]请问: 如果我删除了一个article_category,对于上面两种索引方式,分别应该怎样更新索引呢?谢谢。[/color][/size]
...出现在字母单词之间时视为同一词而不再强行切开,此时如果激活复合分词的 DUALITY 选项,则仍能将符号切开作为复合词。 4.修正浮点数的识别规则,避免将IPv4地址识别为2个小数的尴尬,比如 192.168.1.1 以前会被切成 192.168 和1.1...
...在 /etc/rules.utf8.ini 中定义的,还是在源码里处理的? 如果要修改,使其支持更大长度的分词,该从哪里入手呢? 麻烦了!