可以添加对词性的判断,以及词性的权重比,应该可以达到你想要的效果~ 例如:在SCWS分析以上三句词性得到: 你/r 给/v 我/r 买/v 的/uj 衣服/n 你/r 看/v 的/uj 书/n 一/m 件/q 衣服/n 以此可以看出,其中匹配的是 你/r 的/uj 衣服/n ...
...66' dateline='1324273957'] 字段多个值是什么意思呢? 这段值可以只有一个,但可以索引多个词汇。 比如你有一个字段叫 date 存的是 2011-11-07 那么你可以在索引的时候通过 $doc->addTerm('date', '2011'); $doc->addTerm('date', '201111'); 这...
...66' dateline='1324273957'] 字段多个值是什么意思呢? 这段值可以只有一个,但可以索引多个词汇。 比如你有一个字段叫 date 存的是 2011-11-07 那么你可以在索引的时候通过 $doc->addTerm('date', '2011'); $doc->addTerm('date', '201111'); 这...
字段多个值是什么意思呢? 这段值可以只有一个,但可以索引多个词汇。 比如你有一个字段叫 date 存的是 2011-11-07 那么你可以在索引的时候通过 $doc->addTerm('date', '2011'); $doc->addTerm('date', '201111'); 这样就可以通过 date:2011 或 date...
建议支持词库里的词可以是纯英文单词,虽然在分词时英文单词可以自动识别切分开,但在关键词提取和非法词过滤时却无法提取出或过滤掉纯英文单词。 比如:我要从一些商品名中提取一些品牌:adidas nike。。。对商品名分词...
网址和EMAIL tsearch都可以配置token的切分方法,可以整个切,也可以分开 html标签 tsearch也有一个tag token可以配置去不去徐
将分辨率数据转换成主表的一个字段,用 XSDocument::addTerm 添加索引或转换成特殊字段采用 split 分词器
1. 应该可以查到,问题大概出在你的 type:电影 上,是否给字段做了正确的索引? 2. 似乎没什么好办法,如果量小你可以把 ff设置为 芬芳、非凡、风范的同义词,但从你的量看这个方法应该不可行。你可以尝试另外做一个索引...
1. 应该可以查到,问题大概出在你的 type:电影 上,是否给字段做了正确的索引? 2. 似乎没什么好办法,如果量小你可以把 ff设置为 芬芳、非凡、风范的同义词,但从你的量看这个方法应该不可行。你可以尝试另外做一个索引...
1、安装时候编辑xunsearch-ver/src index.h 可以适当调低提交数量,比如3000减少为1000 search.h 进程数量可以改高点,初始内存默认即可 search.cc 最大内存128可以改到640M 2、搜索词过滤 如果搜索词不包含任何字母数字汉字,仅仅...