搜索

大约有 20 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0990秒)

1.RE: SCWS 能否添加 “中文+英文”和“中文数字”自定义词

更新时间:2012-09-03 11:09 t By hightman

scws源码中写死的…… 超过2个字符的英文数字都在第一步被预处理了,所以想要改这个恐怕了也会比较麻烦。

2.RE: SCWS 能否添加 “中文+英文”和“中文数字”自定义词

发布时间:2012-08-30 12:08 t By hightman

支持是支持的,但数字字母最多只支持2位。 你说的情况其实切分成“斯巴鲁+WRX”并不会有多大问题吧。 像 Q币 QQ空间 这样的都是可以支持成词的。

3.RE: SCWS 能否添加 “中文+英文”和“中文数字”自定义词

发布时间:2012-11-13 00:11 t By yxlwfds

这确实是个问题 有没有折中的办法?

4.RE: SCWS 能否添加 “中文+英文”和“中文数字”自定义词

发布时间:2013-07-24 14:07 t By ccxxcc

hightman 可以考虑以后设置个配置项,在一定范围内让用户改配置

5.RE: SCWS 能否添加 “中文+英文”和“中文数字”自定义词

发布时间:2012-08-30 20:08 t By xiaofeng

[quote='hightman' pid='1078' dateline='1346301119'] 支持是支持的,但数字字母最多只支持2位。 你说的情况其实切分成“斯巴鲁+WRX”并不会有多大问题吧。 像 Q币 QQ空间 这样的都是可以支持成词的。 [/quote] 感谢hightman 的回复。 ...

6.SCWS 能否添加 “中文+英文”和“中文数字”自定义词

更新时间:2012-08-27 20:08 t By xiaofeng

hightman,你好! 因为项目需要从下述字符串中,分别提取:[color=#006400]斯巴鲁WRX[/color],[color=#006400]斯巴鲁200[/color] 这2个词 “斯巴鲁WRX和斯巴鲁200的区别,保养费用如何” 我试用了下面2种方法,均没有达到想要的结果,希望hi...

7.为什么只打印出里面的数字中文直接不分词

发布时间:2013-04-12 23:04 t By xiaodai

用pscws4分词,为什么只打印出里面的数字中文直接不分词打印,网页编码是utf8 function get_tags_arr($title){ require 'pscws4/pscws4.class.php'; $pscws = new PSCWS4(); $pscws->set_dict('scws/dict.utf8.xdb'); $pscws->set_rule('scws/rules.utf8.ini'); $pscws->set_ign...

8.分词 对于 词库 里有宝马x6 分词 为宝马和马x6 分词有问题 词库 里 只能添加 宝马 不能宝马x6 (中文 英文和数字在一起 存在分词问题)

发布时间:2013-07-04 16:07 t By louyefeiwu

分词 对于 词库 里有宝马x6 分词 为宝马和马x6 分词有问题 词库 里 只能添加 宝马 不能宝马x6 (中文 英文和数字在一起 存在分词问题) #解析后的 QUERY 语句:Xapian::Query((奥迪a6:(pos=1) SYNONYM (奥迪:(pos=89) AND 迪A6:(pos=90))))

10.RE: 怎样才能 字母数字汉字组合 按照词典分成一个词语呢?

发布时间:2013-07-03 14:07 t By hightman

其实SCWS内部是允许最多2个非中文字符夹杂中文成词的,超过2个的就无效了。 比如”Q币“,”T恤“这种是支持的。像你这么长的编号支持通用性不强。。

12
  • 时间不限
  • 按相关性排序