搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

11.RE: 怎么去掉英文数字超过2个会被切分的限制

发布时间：2013-12-27 10:12 t By hightman

目前没办法。因为我们认为3个字母以上独立成词完全没问题了

12.RE: SCWS 能否添加 “中文＋英文”和“中文＋数字”自定义词

发布时间：2012-08-30 12:08 t By hightman

支持是支持的，但数字字母最多只支持2位。你说的情况其实切分成“斯巴鲁+WRX”并不会有多大问题吧。像 Q币 QQ空间　这样的都是可以支持成词的。

13.我对切词尝试做了下功能修改

更新时间：2013-12-27 20:12 t By linqingtao

...} } else { // fix me 这个地方是前面有字母或数字的切词 // MAX_ALNUM_CUT是中英文混合的最多多少个数字或字母就作为一个单独的词 // 原代码默认是2 修改为了一个宏 // 这部分处理的是开头有数字...

14.RE: 对于分词的一些困惑

发布时间：2010-10-13 17:10 t By hightman

由于分词规则开头会先进行中英文粗分，那时就强行把数字、字母与多字节的汉字拆分开。只有夹在汉字中间的1～2个数字或字终才被允许和汉字组合，比如“T恤” ”Q币“ 这种。假设你的词典里有”北海36“，被分的句子是...

15.RE: 求助关于无效字符的Exception问题

发布时间：2013-09-25 16:09 t By hightman

项目名，库名必须是字母数字和下划线，不能有别的字符

16.RE: 怎样才能字母数字汉字组合按照词典分成一个词语呢？

更新时间：2013-07-03 16:07 t By shuyinglee

我这个是简单的改动，就是注释掉了一段代码 [code] diff -ur scws-1.2.1/libscws/scws.c scws-1.2.1.changed/libscws/scws.c --- scws-1.2.1/libscws/scws.c 2013-01-11 10:39:28.000000000 +0800 +++ scws-1.2.1.changed/libscws/scws.c 2013-07-03 10:38:49.409846632 +0800 @@ -60,6 +60,9 @@ s->...

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

搜索

11.RE: 怎么去掉英文数字超过2个会被切分的限制

12.RE: SCWS 能否添加 “中文＋英文”和“中文＋数字”自定义词

13.我对切词尝试做了下功能修改

14.RE: 对于分词的一些困惑

15.RE: 求助关于无效字符的Exception问题

16.RE: 怎样才能字母数字汉字组合按照词典分成一个词语呢？

17.RE: 三个问题需要求教

18.scws-1.1.6 发布

19.RE: 词典格式疑问？

20.RE: 发现有几种情况会导致分词不准确？

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索