搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

71.RE: addRange后count不准确

发布时间：2014-05-05 16:05 t By yuangu125

这个统计的我也是不准，不明白什么原因，数字可能还好，这个中文搜索，精确匹配的，就是怪怪的。

72.RE: 求助关于无效字符的Exception问题

发布时间：2013-09-25 16:09 t By hightman

项目名，库名必须是字母数字和下划线，不能有别的字符

73.RE: 怎样才能字母数字汉字组合按照词典分成一个词语呢？

更新时间：2013-07-03 16:07 t By shuyinglee

我这个是简单的改动，就是注释掉了一段代码 [code] diff -ur scws-1.2.1/libscws/scws.c scws-1.2.1.changed/libscws/scws.c --- scws-1.2.1/libscws/scws.c 2013-01-11 10:39:28.000000000 +0800 +++ scws-1.2.1.changed/libscws/scws.c 2013-07-03 10:38:49.409846632 +0800 @@ -60,6 +60,9 @@ s->...

74.英文可以自定义词性吗？

发布时间：2013-08-30 05:08 t By mynoname

通常英文是不需要分词的，但很多时候词性是需要的，比如nike，dior这类品牌英文。目前默认词性都是en，有什么办法可否自定义词典来改变他的词性。还有个问题，就是纯数字的词性为什么是en呢，不是m? 望赐教。

75.RE: 如何让分词不把“1000元”分成两个词？

发布时间：2013-07-30 11:07 t By hightman

这个你还是在切分结果中再处理吧，把数字和量词重新合成

76.图片搜索的一些疑问

更新时间：2014-02-16 17:02 t By Mr.

...= none cutlen = 0 weight = 0 phrase = no non_bool = no [hash_64];纯数字的图片hash值长度是固定的64位整数非唯一但相同的值比较多 type = string;应该不能用numeric类型吧？ index = self tokenizer = none;要实现匹配一个64位数值是完全相等的不...

77.RE: 词典格式疑问？

发布时间：2010-12-10 15:12 t By hightman

抱歉，这里没有讲清楚，英文，数字本身不需要设置会自动根据词界切割。这里说的是那些中英混合的特殊词汇，限制了夹带的字母只能1个或2个字符。比如：我有很多Q币，这里Q币你如果设为词，它可以被切出。再比如：我...

78.一个字段是string型，搜不全结果，怎么处理

发布时间：2013-01-06 17:01 t By lyling8888

字段数字基本上是11,11001,11002等，搜索11，11001和11002等搜不到，怎么处理。想实现 mysql like 11% 功能 index=both

79.RE: 请问一下，xdb与txt词库那个读取效率更高

发布时间：2013-06-29 22:06 t By hightman

后者是什么意思，举例说明一下吧。SCWS处理英文是按普通单词和数字的规则来做

80.RE: 发现有几种情况会导致分词不准确？

发布时间：2011-09-17 01:09 t By hightman

这个是最新一期的更新修改的，当数字、字母连续3个以上时就不作为混杂元素了，会将它们切开。起初是因为 iso9001 没有切词导致搜索 iso 或 9001均搜索不到

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索