按官方提供的测试数据,索引大小大约为数据大小的3.5倍。 我不是很理解,为什么索引的东西反而比原数据大,而且是3.5倍。 照理说,索引的东西是源数据的精华精简来的,应该小才对?
...据时Xunsearch的性能,包括建立索引时间、搜索速度、索引大小。 建立索引时间: 每1万条数据花费时间约为4.14分钟; 搜索速度:100万数据搜索速度在0.5秒左右; 索引大小:索引大小大约为数据大小的3.5倍; 具体测试步骤...
...据时Xunsearch的性能,包括建立索引时间、搜索速度、索引大小。 建立索引时间: 每1万条数据花费时间约为4.14分钟; 搜索速度:100万数据搜索速度在0.5秒左右; 索引大小:索引大小大约为数据大小的3.5倍; 具体测试步骤...
研究了一下源代码,最终功夫不负有心人,成功的避过了中英文混合,使用字典中的词语分词,我用的是 在调整每次读取数据的大小和缓冲区大小时有不同的情况
...84,但是写入到index的数据不确定 在调整每次读取数据的大小和缓冲区大小时有不同的情况 基本保持在58000以上..大概会有1k左右的误差。 求教原因
... 最终我打算测试2.7亿条的数据库 差不多是600G的xs数据库大小 自动分库能满足不?[hr] 补充下 http://www.xunsearch.com/doc/php/guide/start.changelog 发现1.1开始自动分库了 这样子的情况下 还有没有必要自行分库? 最终我打算测试2.7亿...
我看应用里面的 data/demo 里面有几个文件,但是大小都是相同的,想问下: position.DB postlist.DB record.DB termlist.DB 这几个文件的区别和功能,或者分别存放的是索引数据的什么内容。 谢谢先