...:(pos=2) OR 货品:(pos=3)))[/code] 但是我有在自定义词库里面添加“迪卡侬” 所以我不希望“迪卡侬”再被切分,而希望是这样: [code]Xapian::Query(((迪卡侬:(pos=1) OR 蓝色:(pos=2) OR 货品:(pos=3)))[/code] 请问怎么解决呀?
...会调用内部切词法再次切割。 简单解决可以将这类词,添加到 etc/rules.utf8.ini 中的 [specials] 中作为特殊词,如果词量比较大和不确定,那先用 XSSearch::addQueryTerm 来构造搜索语句。 或者等下一个版本,考虑给 xapian 打个补丁,对...
...己加了分词吗?还是别的办法~ [/quote] 当时给他建议后添加了自定义词汇,药到病除。。。 [/quote] 谢谢管理员,俺想问下,如果在dict_user.txt里加了词汇,是不是要把索引全部重新建立一遍? 如果这个自定义分词是需要不...
...10 的注释,已不包含它的代码 6) 为独立使用的 .h 文件添加 C++ 的 extern "C" 标记以便直接使用:xdb.h,xdict.h,xtree.h,pool.h,darray.h 最新下载地址:[url]http://www.ftphp.com/scws/download.php[/url] 演示地址:[url]http://www.ftphp.com/scws/demo.ph...
[quote='benq81' pid='1380' dateline='1351136388'] 我看楼主现在的搜索挺准确的啊,是自己加了分词吗?还是别的办法~ [/quote] 当时给他建议后添加了自定义词汇,药到病除。。。
如题 ,比如我在dict_user文件里添加abc10000,查看分词的时候,它还是会分成abc +10000,这样就达不到效果了、、、
我说您写错的实例是说的,您添加自定义词库那里,您多写了一个t,[hr] 您说的我都检查了,没有错,但是就是分词不对,我下的都是您最新版本的,您自己看看是不是词库提供错了呢?分词真的不对。
...hit] type = string [keywords] type = string [sendtime] type = numeric 在添加索引时,文档中有说会自动转码,所以所有字段都不需要用iconv将gbk转为utf-8就可以正常使用。sendtime在数据库中是时间戳(int型,需要排序),按文档中使用numeric,搜索...
添加一个规则集如下: [b]:type = prefix :line = yes :tf = 3.5 :idf = 2.0 :attr = nz :include = chnum1,chnum2 :znum = 1,2,3 百分 百分之[/b] 分词的时候出现以下问题: 词:百分六 识别正确 词:百分六十 识别失败,只能识别出”百分“...
不明白你说的。同义词是基于分词后的结果制作的。 如果你的索引先前制作,后面再添加自定义词,那么当然无效了。你要重建索引