...应该说旧贴子不太可能再发生删除、修改等操作;建议按时间段切割,但不建议分割过多。 在索引数据入库时根据时间判断该对应哪个库名,比如用 db_1, db_2, ... 来区分 而在搜索的时候统一用 addDb 把所有的 db 都添加进支就可...
... 最终索引数目和数据库中的有0.1%内的误差 是由于某个时间点负载较高 估计被抛弃或者重复添加了 首次查询0.3-0.6秒[hr] 我也贴个 e3-1245 16G DDR3 software-raid1 磁盘速度大约150MB/s 360万完全重头建花费3.5小时左右 用bash脚本调用php...
...00页 我发现如果搜索结果较多排序的时候引起首次搜索时间特别长 是默认排序的2-3倍时间 我想能不能API加入一些特征 进行快速的过滤 比如前2000条结果外的就不统计了[hr] 仔细想下 这个需求意义不大 200万个搜索结果的情况...
...用了 value compare (addRange)的所以效率比较慢。建议直接对时间字段建立年份索引 以下为示范代码 $doc->addTerm('time', date('Y', $chrono)); 这样搜索的时候可以默认搜索当前 2年内的只要加上 AND (time:2011 OR time:2010) 效果可能会比 compare 快...
...”不合理; ”租房合同上标明了房租,但是没 有标明租赁时间,房东要涨价,合理吗?“分成“租房/v 合同/n 上标/n 明了/n 房租/n ,/un 但是/c 没有/v 标明/v 租赁/vn 时间/n ,/un 房东/n 要/v 涨价/v ,/un 合理/ad 吗/r ?/un”,其中的...
...就应该采用mem方式,比如搜索引擎的建索引时主要耗费的时间都花费在分词上,反正现在内存也便宜,而且词典不算太大。如果程序偶尔才需要分一下词,那就没必要load到内存里了。 [/quote] 恩,主要是把整个词典load到内存...
...很快啊。 你说的第一次慢是重启WEB后第一次还是隔一段时间分词就会这样? [/quote] 是每隔一段时间啊。 不隔一段时间也会很慢。换了分析的内容后就会慢了。相同的内容过后几次都超快。 [hr] 再测试一次,文本: SCWS 是 Si...
hightman 辛苦~ 第一时间升级到最新版了。我有一个疑问,找了一些文档,没有找到相当的说明,希望你有时间能帮我解答一下。 现在自定义分词,是不是只能在索引的时候进行,我的项目中需要对内容进行自动分词,用于生...
...比较准确的, 当然还是需要大量的数据测试, 以及一段时间的试运行才会有更好的结果。 就是社区稍显冷清。。呵呵 新项目内部命名为super.maria 。 策划了有一段时间了, 功能方面也基本都设计好了 整个项目的基本功能就...
...pe = numeric index = self ; 价格 [price] type = numeric ; 上架时间 [uptime] type = numeric ; 商品类型 [goods_type] tyep = string tokenizer = full ; 商品权重 [weight] type = numeric ; 配送范围 [scope] type = string index = mixed tokenizer = default ; ...