* 数据来源
采集小说书本章节以及章节内容作为源数据,并存储到mysql数据库。100万数据,数据库大小为8.1G。
* 方法
建立索引时间:从数据库中循环读取1000条循环建立索引。当$prefix/tmp/booktest_db.rcv、$prefix/tmp/booktest_db.snd文件都不存在时,
读取索引日志文件$prefix/tmp/indexd.log最后一行booktest记录作为索引建立完成时间;
搜索速度:索引建立完成后,执行7次不同任意关键词的第一次搜索,结果去掉最大和最小值,然后取5次的平均值;
索引大小:获取$prefix/data/booktest/下,db和db_a的目录大小;
* 结论
建立索引时间: 每1万条数据花费时间约为4.14分钟;
搜索速度:100万数据搜索速度在0.5秒左右;
索引大小:索引大小大约为数据大小的3.5倍;
* 环境
操作系统:Ubuntu 10.04.3 LTS 2.6.32-33-server;
PHP:5.3.6;
CPU:Intel(R) Xeon(R) CPU E5504 @ 2.00GHz;
内存大小:7.81G;
* 备注
$prefix表示Xunsearch的安装目录;
建立索引时从数据库中循环读取的执行时间,100万条数据约为2分钟(对结果影响不大,忽略此时间);
测试结果仅供参考;
2. 测试结果图表
数据库大小与索引大小关系

数据库条数与搜索时间

数据库条数与索引建立时间

测试结果数据
