前300万条好像还速度还不错 第2个300万条明显慢下来了 第3个300万条基本卡住不动,12小时好像才建50万条。 后面还有10个300万条啊,估计是没希望了。
现在要导入 7000W 数据 平均每条100个字符以下 发现10个小时才导入 1400W 感觉速度有点慢了 怎么样可以快点?
...。开始全部采用纯 php 代码编写,功能基本实现了但发现速度太慢,比以前慢5~8倍,而准确率只比前面的第2/3版提升2个百分点,实在很不爽。 先看看演示地址吧:[url=http://www.hightman.cn/demo/scws/v4.php]GBK版[/url](推荐) [url=http://www.h...
1)索引速度的慢其实是相对的,在一个大库里更新比较慢。但你可以变通分库,把最近的做成一个小库用以实时更新,再定期合并索引。 2)1亿条肯定要分库为佳,建议2000万左右一个库。可以联库索引,库也可是远...
[quote='hightman' pid='1580' dateline='1353995127'] 1)索引速度的慢其实是相对的,在一个大库里更新比较慢。但你可以变通分库,把最近的做成一个小库用以实时更新,再定期合并索引。 2)1亿条肯定要分库为佳,建议2000万...
我想对打断的英文做分词,utf-8,scws可以用么?应该下载哪个版本呢?PSCWS4 说是速度慢,不推荐使用,而PSCWS23 仅支持GBK字符集
date 字段可以去掉 index = self,INI的注释最好另一起行写。 搜索这么慢可能是硬盘速度太慢了。你是不是加了排序?
...的问题,有没改进? 2)数据量起步在1亿条左右,检索速度能满足么?如果分库,是联库检索吗? 3)xapian一般应该是定时建索引,能否支持实时建?若不能,有无替代办法? 4)有没有pdf,doc,ppt之类的入库工具? 多...
...排序完全改变了 目前的情况是我导出TXT在创建XDB 分词速度比之前慢了2倍 这个问题很想知道原因T-T XDB->TXT这似乎是一个很难逆转或者是无法逆转的过程 (我只是感觉到导出文件的TXT可能有问题)或者创建的XDB文件有些特...
...不知道有xunsearch,当时公司使用的是zend lucene和scsw分词,速度相当相当慢,查询总数5万条左右的记录要2秒以上。现在想换xunsearch试试