搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

41.RE: 怎么分库才能优化好搜索性能？

发布时间：2011-11-07 13:11 t By hightman

...应该说旧贴子不太可能再发生删除、修改等操作；建议按时间段切割，但不建议分割过多。在索引数据入库时根据时间判断该对应哪个库名，比如用 db_1, db_2, ... 来区分而在搜索的时候统一用 addDb 把所有的 db 都添加进支就可...

42.RE: Xunsearch 性能测试

更新时间：2012-04-01 18:04 t By Dull

... 最终索引数目和数据库中的有0.1％内的误差是由于某个时间点负载较高估计被抛弃或者重复添加了首次查询0.3-0.6秒[hr] 我也贴个 e3-1245 16G DDR3 software-raid1 磁盘速度大约150MB/s 360万完全重头建花费3.5小时左右用bash脚本调用php...

43.不知道我这个需求是否合理

更新时间：2012-04-02 00:04 t By Dull

...00页我发现如果搜索结果较多排序的时候引起首次搜索时间特别长是默认排序的2－3倍时间我想能不能API加入一些特征进行快速的过滤比如前2000条结果外的就不统计了[hr] 仔细想下这个需求意义不大 200万个搜索结果的情况...

44.RE: 虎踞龙蟠BBS全文检索正式上线

发布时间：2011-11-25 14:11 t By hightman

...用了 value compare (addRange)的所以效率比较慢。建议直接对时间字段建立年份索引以下为示范代码 $doc->addTerm('time', date('Y', $chrono)); 这样搜索的时候可以默认搜索当前 2年内的只要加上 AND (time:2011 OR time:2010) 效果可能会比 compare 快...

45.RE: 遇到一个分词错误的问题

更新时间：2014-02-27 10:02 t By robinjia

...”不合理; ”租房合同上标明了房租，但是没有标明租赁时间，房东要涨价，合理吗？“分成“租房/v 合同/n 上标/n 明了/n 房租/n ，/un 但是/c 没有/v 标明/v 租赁/vn 时间/n ，/un 房东/n 要/v 涨价/v ，/un 合理/ad 吗/r ？/un”，其中的...

46.RE: daemon server(linux后台程序)和embed(库的形式嵌入程序中)

发布时间：2010-12-10 15:12 t By hightman

...就应该采用mem方式，比如搜索引擎的建索引时主要耗费的时间都花费在分词上，反正现在内存也便宜，而且词典不算太大。如果程序偶尔才需要分一下词，那就没必要load到内存里了。 [/quote] 恩，主要是把整个词典load到内存...

47.RE: scws1.1.8为什么第一次都很慢。

更新时间：2011-10-24 14:10 t By ci169

...很快啊。你说的第一次慢是重启WEB后第一次还是隔一段时间分词就会这样？ [/quote] 是每隔一段时间啊。不隔一段时间也会很慢。换了分析的内容后就会慢了。相同的内容过后几次都超快。 [hr] 再测试一次，文本: SCWS 是 Si...

48.RE: xunsearch-1.4.5 (基于 xapian 和 scws开源中文搜索引擎，高扛压不死锁)

发布时间：2013-03-26 16:03 t By vus520

hightman 辛苦～第一时间升级到最新版了。我有一个疑问，找了一些文档，没有找到相当的说明，希望你有时间能帮我解答一下。现在自定义分词，是不是只能在索引的时候进行，我的项目中需要对内容进行自动分词，用于生...

49.在做一个PHP的项目。部分功能用到scws。大家多多交流

更新时间：2010-05-11 18:05 t By xiaolan

...比较准确的，当然还是需要大量的数据测试，以及一段时间的试运行才会有更好的结果。就是社区稍显冷清。。呵呵新项目内部命名为super.maria 。策划了有一段时间了，功能方面也基本都设计好了整个项目的基本功能就...

...pe = numeric index = self ; 价格 [price] type = numeric ; 上架时间 [uptime] type = numeric ; 商品类型 [goods_type] tyep = string tokenizer = full ; 商品权重 [weight] type = numeric ; 配送范围 [scope] type = string index = mixed tokenizer = default ; ...

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

搜索