搜索

大约有 51 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0036秒)

31.这个不值得算不算问题 highlight函数

发布时间:2012-04-12 02:04 t By Dull

如包含单字母e m 则报错 其实我觉得这个很好修正的 可以把标签临时使用绝对不冲突的字符串 如ascii中的控制符号 之后做个replace体会下就可以了 这种关键字还是有实际使用的 比如 e book

32.RE: 怎么去掉英文数字超过2个会被切分的限制

发布时间:2013-12-27 10:12 t By hightman

目前没办法。因为我们认为3个字母以上独立成词完全没问题了

33.RE: 自定义的 txt 字典 有关问题 求助

发布时间:2010-04-10 01:04 t By hightman

最长的词16个汉字,250个英文字母。 应该是你的词典做错了,比如字符集不匹配之类。生成词典要严格按照字段区分开,字段之间用区分,这说都有相关的说明,按说明操作应当没有问题。

34.RE: SCWS不支持英文和中英文混合分词吗?

发布时间:2010-08-27 10:08 t By hightman

除中文外其余的只按标点符号或空格切分,无缝连在一起的单词字母是不支持的。

35.RE: 发现有几种情况会导致分词不准确?

发布时间:2011-09-17 01:09 t By hightman

这个是最新一期的更新修改的,当数字、字母连续3个以上时就不作为混杂元素了,会将它们切开。 起初是因为 iso9001 没有切词导致搜索 iso 或 9001均搜索不到

36.同义词搜索

...中做了一些个特殊处理: - **统一小写** 统一转换为小写字母进行存储,不支持必须保留大写字母的同义词。 - **同根词支持** 英语同一个单词有多种不同的形式,如:单复数、过去式和现在分词等。 而它们要传送的其实是同...

37.RE: SCWS 能否添加 “中文+英文”和“中文+数字”自定义词

发布时间:2012-08-30 12:08 t By hightman

支持是支持的,但数字字母最多只支持2位。 你说的情况其实切分成“斯巴鲁+WRX”并不会有多大问题吧。 像 Q币 QQ空间 这样的都是可以支持成词的。

38.RE: 对于分词的一些困惑

发布时间:2010-10-13 17:10 t By hightman

...分词规则开头会先进行中英文粗分,那时就强行把数字、字母与多字节的汉字拆分开。 只有夹在汉字中间的1~2个数字或字终才被允许和汉字组合,比如“T恤” ”Q币“ 这种。 假设你的词典里有”北海36“,被分的句子是 “...

39.libscws 段错误的 bug 修正

发布时间:2007-07-05 09:07 t By hightman

...出来的词有可能超过 255 字,如全部连续的双字节数字或字母.超过 255 字后 这里的 j 将变得不正确可能导致 item-> 指向 NULL , 故加入以下红色部分判断. [code] static void _scws_mset_word(scws_t s, int i, int j) { word_t item; item = s->wma...

40.RE: [2012] SCWS-1.2.0 发布,BSD协议、支持自定义词库、PHP5.4

发布时间:2012-05-03 20:05 t By ttff

版主您好,我在自定义词表里加了一些数字+字母的词,如pm2.5,101大楼这样。 使用的时候发现无法正常分出来,我看到新版是加了一些强制拆分的功能,但是对自定义词表里的词,也是强制拆分的码?

  • 时间不限
  • 按相关性排序