...http://www.hightman.cn/bbs/images/common/back.gif[/img][/url] 单字通常是因为字典没有加载的缘故,看看程序就应该知道字典位置了。 [/quote] 默认放哪里啊?
这是由于 `` 反引号在 shell 中是特殊处理的,代表在命令执行,所以当 PHP 执行时已经被替换为命令结果了。 已在新代码的帮助说明中增加了标注,特别感谢楼主的提示。
...h "你看的书" 和"一件衣服" 代码匹配出来相关度最大的是"你看的书",因为有2个词相同,而按照我们人的字面理解,相似度最大应当是"一件衣服" ,但这个只有1词个相同,所以程序就判断没有2个词相同的相关度大。 这个问...
这是PHP的safe mode 导致的,自己配置好就行了。 命令行测试时乱码大概是编码不对,你可以尝试在命令后加上 -cgbk
下了最新的1.1.3,但是我在windows下winrar解开,里面空的,这个压缩包是不是有问题啊?1.1.2是正常的。呢个对应的ut8的压缩包也不对
IP可能是被当做数字了,这个问题我想我得好好考虑一下呵。 数字可以允许一个点出现,所以出现了这样的情况,
Xapian 里对 facets 的功能实现其实并不是很优雅,效率也一般,相当于增加 matchspy ... 如果是为了分组统计建议直接生成要关词条再用 count() 做估算。
...t相比,那个效率更高 另外,scws对于中英文分词效果不是很好,即文中的中文分得还可以,但对于页面中的英文部分,包括email,url,host这类处理效果比较差,我们目前采用两个分析器配合使用来达到最好的效果,要是scws能处理...
多谢指出。因为开发时是分开的没有压成 XS.php 单独一个文件。 可以考虑在输出XS.php时移除autoload功能
自己做个扫描程序,以文件名为key,内容为body建索引不就好了? xunsearch 本身并不是完整的搜索引擎,它是提供核心组件并附带一些例子