...个中文分词后,感觉scws是一个不错的分词系统。 xunsearch速度也比较快。安装的过程中也遇到了不少麻烦。主要是自己知道的也太少了。但是最终都解决了。主要还是hightman的大力帮忙啊。再次感谢了。 tags提取页面 [url]http://www...
...一代表了搜索结果的响应能力,其二则为二次开发难度、速度。 //还是注释 Xunsearch 采用结构化分层设计,包含后端服务、前端开发包两大部分,层次清晰而不交叉。 其中后端是采用 C/C++ 编写的守护进程,而前端采用最为流行...
http://so.e23.cn 数据量大约为3500万,新闻在50万左右,其它的全部为论坛数据。 新闻一个库,论坛按年份分的库,目前速度感觉可以接受。
前300万条好像还速度还不错 第2个300万条明显慢下来了 第3个300万条基本卡住不动,12小时好像才建50万条。 后面还有10个300万条啊,估计是没希望了。
非常不错,可以继续琢磨一下如何优化。第二次搜索同一关键词缓存起作用后速度应该能明显变快 此外似乎没有开启拼音相关的功能,个人认为拼音相关的纠错功能还是很实用的
我想对打断的英文做分词,utf-8,scws可以用么?应该下载哪个版本呢?PSCWS4 说是速度慢,不推荐使用,而PSCWS23 仅支持GBK字符集
...琢磨一下如何优化。第二次搜索同一关键词缓存起作用后速度应该能明显变快 此外似乎没有开启拼音相关的功能,个人认为拼音相关的纠错功能还是很实用的 [/quote] 是的,没有开启,慢慢完善吧,领导要求急着上线,就先...