http://so.e23.cn 数据量大约为3500万,新闻在50万左右,其它的全部为论坛数据。 新闻一个库,论坛按年份分的库,目前速度感觉可以接受。
非常不错,可以继续琢磨一下如何优化。第二次搜索同一关键词缓存起作用后速度应该能明显变快 此外似乎没有开启拼音相关的功能,个人认为拼音相关的纠错功能还是很实用的
爽哦!本站论坛(discuz 5.5)正式启用其于 libscws+pgsql 构建的健壮级全文检索引擎(计划支持1000万以上贴子) 进入本站论坛,搜索右边的"FullText"即是,实时同步BBS贴子的发布\删除\修改,欢迎提建议。目前直接对dz的代...
[quote='hightman' pid='463' dateline='1327926892'] 非常不错,可以继续琢磨一下如何优化。第二次搜索同一关键词缓存起作用后速度应该能明显变快 此外似乎没有开启拼音相关的功能,个人认为拼音相关的纠错功能还是很实用的 [/quote]...
原来是这样,分库倒是个不错的主意。自己根据条件决定要不要 addDb() 我担心的是通过 value 匹配才导致的慢,比如 addRange() 调用 或 setFacets()
http://bbs.seu.edu.cn/s 整合花了不少时间,因为同时涉及到C和PHP,不过总算弄成了。时间跨度11年,帖子数量2000k。BBS系统用的kbs,典型的高校BBS。 源代码在:https://github.com/zcbenz/sbbs-search
把全文检索的源代码托管到了github https://github.com/zcbenz/sbbs-search 对kbs的修改补丁还没有放上去,没太多时间去整理= = 很喜欢你们这样搞开源项目的公司。
谢谢! 因为刚上线不久,所以使用次数不多 现在搜索是按照年份分库的,每2年分一个库,默认的搜索两年内其实只是加载了最近的两个库。任意时间搜索就是把所有库加载了进去。偶尔出现的搜索慢确实有些奇怪
... 周如火如荼的测试和修正,很高兴如期发布 xunsearch-1.0.0 正式稳定版,这也是 xunsearch 的第一个正式版本。 Xunsearch 是免费开源的专业全文检索解决方案,旨在帮助一般开发者针对既有的海量数据,快速而方便地建立自己的全...