...化,距上次更新已经过了10个月,变化还是非常明显的。hightman预计多久会更新一次词库? 最后,我对github上提供的 get_tfidf.php 中get_count函数做了一下更新,其中corpusUrl依然使用的baidu,如下: // 获取语料库中包含该词的文...
...化,距上次更新已经过了10个月,变化还是非常明显的。hightman预计多久会更新一次词库? 最后,我对github上提供的 get_tfidf.php 中get_count函数做了一下更新,其中corpusUrl依然使用的baidu,如下: // 获取语料库中包含该词的文...
分词并不影响一字歌的搜索。只要库内有那个“词”。 比如:陈百强-不.mp3 这样分词的结果是 [color=red]陈百强 陈百 百强 不[/color] 这样搜索”不“,搜索”陈百强“,”陈百“,”百强“都可以搜索到,怎么会不能搜索单字呢...
你这个情况应该是服务端不允许连接,看看有没有开启服务,默认 xs-ctl.sh 是绑定在 127.0.0.1 上的,建议加上 -b inet 启动以便绑定所有IP 计划下个版改把默认改为绑定全部IP
就一条记录怎么会有4M?如果文件 已存在生成是不会覆盖的啊 你描述的并不是很清楚,你用的是PHP的工具还是C的转换工具呢?一个.TXT对应转换成一个.XDB
请仔细看说明,$so->get_result() 并不是一次调用,需要多次调用直到返回FALSE 例子1. 使用类方法分词
这个写法没问题啊。你的索上里也包含了了 status:1 吧,你这个字段的索引是什么样的呢,自己查查吧,不会有这么低级的BUG啦
确定已经是1.4.6了?建议试试手动编译xunsearch-1.4.6,加入 --disable-memory-cache 禁用掉缓存看看