从结果看应该是 scws_set_dict(s, "/usr/local/etc/dict_chs_gbk.xdb", SCWS_XDICT_MEM); 这句话出了问题, 也就是可能词典不正确. 但这个词典目前测试在64位系统下也是可以正常工作的, 检查一下词典的字节数是不是没有下载完整.
[quote='KnightE' pid='334' dateline='1323542477'] 应该尽量通过xs得到id,然后根据id批量从DB/NOSQL取信息,直接从xs取信息不是个好主意。 [/quote] 取信息可以从DB/NOSQL取信息,但是涉及到从XS过滤 就是个问题了
[quote='hightman' pid='361' dateline='1324135150'] tag:XXX [/quote] 其实我的意思是一个记录里面有一个字段是有多个值的,就是类似于sphinx里面的多值属性
...索引不就好了。然后检索 3/1也能检索到分类为9的数据。就是这么简单 否则如果有一千个子类,你这QUERY语句要多长?
tokenizer = full 就是不分词了。但不指定字段时还是会分词,除非你用 XSSearch::addQueryTerm 来构建查询
...字歌的汉字,导入,坏处是要记得更新 题外话,nutch默认就是单字索引,但为了单字要牺牲其他,比如最重要的相关性,你干吗?
这个就是提示文件 找不到,既然 你把 lib 加进 include_path 你不如直接 require_once 'XS.php' BTW:没接触过PHP直接用XS恐怕很难。
你在include/里放的 php 是直接运行的吗?也就是起始目录位置了? 你可以统一只放一个词典位于上层的 etc/ 然后用绝对路径访问词典或在同不的目录用不同的相对路径啊, 像第一个情况是 ../etc/ 第二个应该是 ../../etc