搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

1.疑问？为什么索引大小大约为数据大小的3.5倍

发布时间：2012-03-05 13:03 t By ffcz

按官方提供的测试数据，索引大小大约为数据大小的3.5倍。我不是很理解，为什么索引的东西反而比原数据大，而且是3.5倍。照理说，索引的东西是源数据的精华精简来的，应该小才对？

2.RE: 疑问？为什么索引大小大约为数据大小的3.5倍

发布时间：2012-03-06 10:03 t By hightman

全文索引就是空间换时间啊。遵守守恒定律，不可能有真正两全齐美的东西啊

3.RE: 疑问？为什么索引大小大约为数据大小的3.5倍

发布时间：2012-03-06 01:03 t By coo

索引肯定比原来的数据要大的，因为要分词然后存储吧，一个句子可能被分割好多段

4.Xunsearch 性能测试

发布时间：2011-11-04 16:11 t By hpxl

...据时Xunsearch的性能，包括建立索引时间、搜索速度、索引大小。建立索引时间: 每1万条数据花费时间约为4.14分钟; 搜索速度：100万数据搜索速度在0.5秒左右; 索引大小：索引大小大约为数据大小的3.5倍; 具体测试步骤...

5.Xunsearch 性能测试

发布时间：2011-11-04 16:11 t By hpxl

...据时Xunsearch的性能，包括建立索引时间、搜索速度、索引大小。建立索引时间: 每1万条数据花费时间约为4.14分钟; 搜索速度：100万数据搜索速度在0.5秒左右; 索引大小：索引大小大约为数据大小的3.5倍; 具体测试步骤...

6.RE: 如何优化xunsearch

发布时间：2013-07-29 12:07 t By gilroy

研究了一下源代码，最终功夫不负有心人，成功的避过了中英文混合，使用字典中的词语分词，我用的是在调整每次读取数据的大小和缓冲区大小时有不同的情况

... public XSIndex openBuffer(int $size=4) $size int 缓冲区大小, 单位: MB 默认为 4MB {return} XSIndex 返回自身对象以支持串接操作源码: sdk/php/lib/XSIndex.class.php#L362 (显示) public function openBuffer($size = 4){ if ($this->_buf !== '') { ...

8.建立索引不完整问题

发布时间：2012-03-14 16:03 t By 张十三

...84，但是写入到index的数据不确定在调整每次读取数据的大小和缓冲区大小时有不同的情况基本保持在58000以上..大概会有1k左右的误差。求教原因

9.RE: 请问索引分库单个库多大比较好？

更新时间：2012-04-09 19:04 t By Dull

... 最终我打算测试2.7亿条的数据库差不多是600G的xs数据库大小自动分库能满足不？[hr] 补充下 http://www.xunsearch.com/doc/php/guide/start.changelog 发现1.1开始自动分库了这样子的情况下还有没有必要自行分库？最终我打算测试2.7亿...

10.能不能限制进程内存占用或者进程数？

发布时间：2012-04-20 18:04 t By wayne0426

有没办法可以限制它的内存占用大小和进程数量？

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

搜索