因为我的项目是电商网站,所以我自定义了一个词库,把我自己的品牌、商品类目名字给加进去了。 我希望是这样的搜索结果,比如搜索“迪卡侬蓝色货品”: 现在是这样的: [code]Xapian::Query(((迪卡侬:(pos=1) SYNONYM (迪卡:(po...
@FIXME: 先记录一下,这是因为你既是自定义分词器又指定了 non_bool 参与权重计算。 那么 SDK 端先按自定义分词器拆分重新组合成查询语句,发送到 xapian 解析器时由于不是 boolean prefix,因此它又会调用内部切词法再次切割。 简...
...'1351136388'] 我看楼主现在的搜索挺准确的啊,是自己加了分词吗?还是别的办法~ [/quote] 当时给他建议后添加了自定义词汇,药到病除。。。 [/quote] 谢谢管理员,俺想问下,如果在dict_user.txt里加了词汇,是不是要把索引全...
...用开源协议 New BSD License 发布新版本 2) 深度优化复合分词中的 SCWS_MULTISHORT 选项,更为合理有效,符合全文检索的需求 3) 测试脚本自动加载当前目录下的 dict_user.txt 文本词典 4) 修正 scws.c 中 __PARSE_XATTR__ 宏的 BUG 导致 scws...
[quote='benq81' pid='1380' dateline='1351136388'] 我看楼主现在的搜索挺准确的啊,是自己加了分词吗?还是别的办法~ [/quote] 当时给他建议后添加了自定义词汇,药到病除。。。
如题 ,比如我在dict_user文件里添加abc10000,查看分词的时候,它还是会分成abc +10000,这样就达不到效果了、、、
我说您写错的实例是说的,您添加自定义词库那里,您多写了一个t,[hr] 您说的我都检查了,没有错,但是就是分词不对,我下的都是您最新版本的,您自己看看是不是词库提供错了呢?分词真的不对。
...sw,但是不知道有xunsearch,当时公司使用的是zend lucene和scsw分词,速度相当相当慢,查询总数5万条左右的记录要2秒以上。现在想换xunsearch试试
... = nz :include = chnum1,chnum2 :znum = 1,2,3 百分 百分之[/b] 分词的时候出现以下问题: 词:百分六 识别正确 词:百分六十 识别失败,只能识别出”百分“和”六十“,无法识别为:”百分六十“ 词:百分六五 识别失败,结...
不明白你说的。同义词是基于分词后的结果制作的。 如果你的索引先前制作,后面再添加自定义词,那么当然无效了。你要重建索引