应该是更新索引时,参杂了一些配置文件中未指定的字段导致的,代码已经修复,继续观察几天。 不过,底层在创建或更新索引时,不会忽略配置中没有配置的字段?
你楼上的配置文件 type=id 不应该再指定 index = none啊,ID就包含了索引了,不要冲突
...出编码视为默认编码,即 [XS::defaultCharset]。 如果您需要指定不同编码,请调用 [XSSearch::setCharset] 进行设置。 ~~~ [php] $search->setCharset('gbk'); ~~~ 关于搜索对象的详细用法剖析请阅读后面的专题。 $Id$
找到乱码原因了,不过不知道我这个是不是和他们的一样,我是因为没有指定搜索条件,测试的时候谁会想到是这个问题呢,哎。。。
...。。对商品名分词后不能从使用scws_get_words()函数来提取指定属性的词,假如品牌的属性设置为pp,因为这些纯英文词的词性切分后都为/en。在非法词过滤时也是如此,不能使用scws_has_word()函数来判断是否有指定属性的词,假如非...
...间来回切换。 访问网址: > note: 在线编辑器暂时不支持指定自定义分词器和分词器参数,这个部分需要用户自行手动修改。 $Id$
不是很明白,你说的自动分词??是什么意思 你在配置文件中不要指定 tokenizer 选项就会自动使用 SCWS 分词了。
在另一帖子中回复您的,我猜测是您的 scws 对像字符集没有正确指出,而 php.ini 默认设为 gbk导致,建议显式地指定字符集 $so = scws_new('utf8'); 或在任何 add_dict 之前调用 set_charset
需要指定词典位置,比如: # scws -A -d /hp/opt/scws/dict/default.utf8.xdb:/home/vanni/scws/mydict.txt -c utf8 "相宜本草洗面奶和雅漾舒护活泉水哪个好" 相宜/a 本草/nz 洗面奶/nz 和/c 雅漾/@ 舒护/@ 活泉水/@ 哪个/r 好/a
是不是你的 TXT 文件有问题,比如编码方面。TXT的资源指定成XDB肯定要出错啊