在 demo 中测试 v,n 结果只有 n 的,测试~v,n,vn 结果还是会出现包含这些词性的。 这。。。似乎完全有BUG,稍后查。
...以组成很多词的 得到,做到,想到,跑到,到达…… 过滤的词新增加文本词典,我要一个个词组去过滤,明显很吃力。
建议把这些要过滤的词新增加文本词典,属性设为 ! 即可。或者自己根据词性直接在取得返回值的时候排除它。。 因为你是包含的作法的话,是不是“人们”“人家”“人民”全都要过滤了??这样肯定不合适,所以建议直...
[quote='hightman' pid='6629' dateline='1312967825'] 在 demo 中测试 v,n 结果只有 n 的,测试~v,n,vn 结果还是会出现包含这些词性的。 这。。。似乎完全有BUG,稍后查。 [/quote] 感谢 magike 网友再度来信指出,目前已经在CVS中作了修正,预...
...英文单词可以自动识别切分开,但在关键词提取和非法词过滤时却无法提取出或过滤掉纯英文单词。 比如:我要从一些商品名中提取一些品牌:adidas nike。。。对商品名分词后不能从使用scws_get_words()函数来提取指定属性的词,...
哦,那没有这样的功能,也提取不出这样的规则。建议在自己提取返回词时作判断和过滤吧。
其实在 xunsearch 的世界里,你的情况完全可以这样作。。。。 假设分类字段 catalog ID为 A 下的子分类为 AA,AB,AC ... 那么你给子分类的数据建索引时,加入索引词 A,通过 XSDocument::addTerm 实现。 那么将来搜索 catalog:A 就相当于包...
...英文单词可以自动识别切分开,但在关键词提取和非法词过滤时却无法提取出或过滤掉纯英文单词。 比如:我要从一些商品名中提取一些品牌:adidas nike。。。对商品名分词后不能从使用scws_get_words()函数来提取指定属性的词,...
...存默认即可 search.cc 最大内存128可以改到640M 2、搜索词过滤 如果搜索词不包含任何字母数字汉字,仅仅是特殊符号,则会直接返回所有搜索结果,http://www.xunsearch.com/demo/search.php?q=%21@@&f=_all&s=relevance 可以测试这个看,可以考...