...多M,xunsearch索引文件库文件约3G。搜索速度在0.5秒左右!就是搜索[color=#FF4500]英文长字符串不给力[/color]! b,专业词汇搜索 http://www.geneontology.cn/so/search.php 这个词条约16000,手工+python连接mysql导入(数据库约10M,xunsearch索引文...
我的问题也是一样。目前我们网站所有页面都会有使用到xunsearch的查询。不过我发现一个奇怪的现象,就是searchd.log接近1G的时候,就会出现这样的错误。今天刚刚增加了一个自动清理searchd.log的脚本,看看是否会稳定一些。
...不需要词典啊!! [/quote] 我知道英文不需要词典 关键就是这个不需要词典 他的英文分词就没办法控制了,比如我要做计算机专业的分词,其中很多就需要用到一些专业英文单词分词。比如一篇文章是linux相关的我想让“linux...
[quote='hightman' pid='3251' dateline='1359526251'] 这个不能随便改,但可以通过调整源码的编译参数来改。通常不需要这么做啊,实在有必要时你们可以考虑继承XSTokenizerScws 来自己修改它。 [/quote] 感谢,我就是这么干的~
....sh restart ,这个的话就会出现上面描述的问题了。 其实就是用bin/xs-ctl.sh -b inet restart 重启就可以了....
...合作” 分词结果:“谷歌中 宣布 关闭两” Windows 下分词就是正确的 分词结果:“喜讯 谷歌 中国 宣布 将 关闭 两 大 服务 终止 与 天涯 合作” 一般来讲是什么问题导致?因为都比较简单,编译安装都一切顺利,扩展安装也同...
这怎么是BUG呢,本来就是这样。只不过是在你没有任何词典的情况下它才默认加载默认词典。 并不是一开始就自动加载默认词典。。。
汗,看来就是因为“\r”问题。 hightman老兄,你是用那个来判断换行的?\r\n ?[hr] 测试了一下windows下你使用的是“\n”,linux下你是不是使用了"\r\n" ? 汗,本地windows,服务器linux........ 继续测试。。。
...还是更加期望加上直接入字典库的功能。这样更加方便,就是不知道难度如何。因为目前我的词库可能每天都有新的加进去。 PS:我是个有洁癖的代码工人:D:D:D
...给你API你想怎么导入就怎么导入。 [/quote] 我知道啊,就是试了一下,感觉搜索速度还是不够,想看看其他的方案,因为xunsearch是scws+xapian,就想看看有scws+sphinx的方案。 我600多万的数据,4G内存,搜频率高一点的词都是5秒...