[quote='hightman' pid='463' dateline='1327926892'] 非常不错,可以继续琢磨一下如何优化。第二次搜索同一关键词缓存起作用后速度应该能明显变快 此外似乎没有开启拼音相关的功能,个人认为拼音相关的纠错功能还是很实用的 [/quote]...
http://so.e23.cn 数据量大约为3500万,新闻在50万左右,其它的全部为论坛数据。 新闻一个库,论坛按年份分的库,目前速度感觉可以接受。
非常不错,可以继续琢磨一下如何优化。第二次搜索同一关键词缓存起作用后速度应该能明显变快 此外似乎没有开启拼音相关的功能,个人认为拼音相关的纠错功能还是很实用的
谢谢! 因为刚上线不久,所以使用次数不多 现在搜索是按照年份分库的,每2年分一个库,默认的搜索两年内其实只是加载了最近的两个库。任意时间搜索就是把所有库加载了进去。偶尔出现的搜索慢确实有些奇怪
原来是这样,分库倒是个不错的主意。自己根据条件决定要不要 addDb() 我担心的是通过 value 匹配才导致的慢,比如 addRange() 调用 或 setFacets()
http://bbs.seu.edu.cn/s 整合花了不少时间,因为同时涉及到C和PHP,不过总算弄成了。时间跨度11年,帖子数量2000k。BBS系统用的kbs,典型的高校BBS。 源代码在:https://github.com/zcbenz/sbbs-search
把全文检索的源代码托管到了github https://github.com/zcbenz/sbbs-search 对kbs的修改补丁还没有放上去,没太多时间去整理= = 很喜欢你们这样搞开源项目的公司。
还有一个建议,BBS中很多 \x1b (即 ascii=27 ESC键)的控制符,应该在建索引时给预过滤可能更好。 \033[1;31;44m 这样的格式,用正则过滤掉就好了。此外,我看到了你默认搜索的是 2年内,所以可能效果上采用了 value compare (addRange)的...
非常不错。我把此贴转到案例版面吧。 搜索结果界面还可以让专业美工再美化一下^-^ 我自己在大学时很多时间也泡在 telnet bbs上呢,对这类BBS的感情很特殊,很多电脑技术也是在此基础上学习起来的。 我的论坛也开着,是 Mapl...
新版主页正式上线,同时正式启用 LOGO,欢迎广大用户制作图标返链。 [url=http://www.xunsearch.com][img]http://www.xunsearch.com/img/logo.jpg[/img][/url]