...y 设计的方式问题, 目前无法支持搜索语句单字切分, 但您可以在模糊检索时设为 0 来关闭复合分词
IP可能是被当做数字了,这个问题我想我得好好考虑一下呵。 数字可以允许一个点出现,所以出现了这样的情况,
...scws对于中英文分词效果不是很好,即文中的中文分得还可以,但对于页面中的英文部分,包括email,url,host这类处理效果比较差,我们目前采用两个分析器配合使用来达到最好的效果,要是scws能处理得了像email,host,url和tag之类的分...
...词库中的词还是能用scws_has_word判断出来,而有些却有不可以,尤其是两个字的短词。 为什么呢? 我要怎么做?
...se的排在前面。这条语句example_attr:jianyue AND example_attr:baise可以得到想要的结果,结果如下:[php]47 ... jianyue,hongse,baise 52 ... jianyue,hongse,heise,baise 75 ... jianyue,hongse,baise,qianhuang 132 ... jianyue,hongse,baise,qianhuang[/php] 如果字段的属性太...
...符集一致的,如未指定过则为 [XS::defaultCharset]。 虽然您可以通过 [XSDocument::setCharset] 来强制修改文档的字符集,但不推荐这样做,也没必要这样做。 索引文档 -------- 索引文档是指由用户创建,并用于提交更新到索引库中的文...
... prefix,因此它又会调用内部切词法再次切割。 简单解决可以将这类词,添加到 etc/rules.utf8.ini 中的 [specials] 中作为特殊词,如果词量比较大和不确定,那先用 XSSearch::addQueryTerm 来构造搜索语句。 或者等下一个版本,考虑给 xap...
...,像H大这样做更好。 [/quote] 结构相似的网页的话,也可以做单机程序,或者bat的文件去处理,但是没办法做到H大这样的,增量索引的功能
...可能词典不正确. 但这个词典目前测试在64位系统下也是可以正常工作的, 检查一下词典的字节数是不是没有下载完整. [/quote] 谢谢您的回复,词典是用README中提供的命令生成的 /usr/local/scws/bin/gen_scws_dict -c gbk -i etc/dict_chs_gbk.txt ...