... 16 吨 吊车 , 二手 25 吨 吊车 15 千克 压力机 分词非常准确,基本能满足需求,美中不足的是: 25吨,16千克 不能分成整体的词,如果把25吨放入词库确实也能解决问题,只是现实中可能有5~1000吨,总不能一个一个都放进去,所以还是建...
[quote='hightman' pid='5447' dateline='1387443918'] addRange 后会影响概率计算,count 会有问题 [/quote] 有什么什么方法能得出相对准确的count呢,数据量小时count没有问题,大的时候差别非常大
是什么版本呢,新的版本应该是没有内存泄露了。 越来越大你的监控方式是什么呢?最好能给出较为准确的数据以便判断。
...['word']); [/quote] 就能排序了...但count就不行了....lastCount准确度还是偏低啊
调整了跟包一起的 etc/rules.ini etc/rules.utf8.ini etc/rules_cht.utf8.ini ,让规则语法匹配更加准确。 建议同步更新~~
...采用 numeric 类型 3. 总数是估算的,因为分页越后在越准确一些(特别是在排序+区间的时候委容易偏差,把计数单独调用 ::count 并去除排序)
...必采用 numeric 类型 3. 总数是估算的,因为分页越后在越准确一些(特别是在排序+区间的时候委容易偏差,把计数单独调用 ::count 并去除排序)
...书写的时候不像英语会在词之间 用空格分开,所以如何准确快速的分词一直是中文分词的攻关难点。 本分词法并无太多创新成分,采用的是自己采集的词频词典,并辅以一定的专 有名称,人名,地名,数字年代等规则识别来...
...ge,$start)->search(); $count = $xs->search->getLastCount(); 这时$count不准确,我看过论坛类似的问题,不过没有多的addRange,另外想再问下 $query->addRange('c1',$c1,$c2)->addRange('d1',$d1,$d2)这样写法会不会比上面的效率高?只是这种写法有时比较难写,因为...
...里面搜索再以时间来排序,这种query可能造成结果总数的不准确 解决方案: 其实解决方案很容易,如下代码 $docs=$search->addRange('addtime',$from,null)->search()->getLastCount(); $search->setSort('addtime',false); $docs=$search->addRange('addtime',$from,null)->s...