搜索

大约有 51 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0056秒)

11.RE: 怎样才能 字母数字汉字组合 按照词典分成一个词语呢?

发布时间:2013-07-03 14:07 t By hightman

其实SCWS内部是允许最多2个非中文字符夹杂中文成词的,超过2个的就无效了。 比如”Q币“,”T恤“这种是支持的。像你这么长的编号支持通用性不强。。

12.怎样才能 字母数字汉字组合 按照词典分成一个词语呢?

发布时间:2013-07-02 17:07 t By shuyinglee

我在字典里面添加了 "HYC888仪表" 这个词,但是非词的结果却是 "HYC" "888" "仪表" 这三个词语; 确认词典中没有这三个单独的词语; 我的应用中这样的词语很多很多,希望能够整词匹配。 我看了 前面的一个帖子,说要修改...

13.单个字母或单个字就截掉不出现了?

发布时间:2014-01-09 08:01 t By gardennet

...好 AB“,这里的AB就出现,怎么设置可以取消单文字或单字母被截的限制

14.RE: 怎样才能 字母数字汉字组合 按照词典分成一个词语呢?

更新时间:2013-07-03 11:07 t By shuyinglee

昨天弄了一晚上, 因为我是写php的对C语言不熟系,研究了一下源代码,最终功夫不负有心人,成功的避过了中英文混合,使用字典中的词语分词,我用的是 scws-1.2.1.tar.bz2 这个版本,因为不能发附件,如果大家需要联系我: Ema...

15.拼音搜索时遇到的问题

更新时间:2012-12-26 12:12 t By HiLinz

...求通过遥控器在电视上输入一个影片名中关键词的拼音首字母就可以搜索到一些影片,如输入ff 可搜索到 “那样芬芳”、“非凡英雄”、“强者风范”等影片。我采用的方法是把影片名通过分词后再取其各关键词的首字母,如...

16.词典格式疑问?

发布时间:2010-12-10 00:12 t By lauxinz

...由4个字段组成,依次为“词语"(由中文字或[b]3个以下的字母合成[/b]), "TF", "IDF", "词性", 字段时间用空格或制表符分开,数量不限,可自行对齐以美化。[/quote] “词语"为什么会有3个字母的限制呢?,比如词语“java”。这个限...

17.RE: 分词初试,结果不对

更新时间:2010-09-16 17:09 t By xiaowang19

...现了奇怪的问题,我在原来的测试文本后面随便加了两个字母,分词又不对了。我继续增加字母,有时候对,有时候不对。(GBK版本)

18.英文与数字组合词分词错误

发布时间:2014-04-20 16:04 t By tenjin

scws分词时出现这样的情况,英文字母与数字组合分词时,若词的前面或后面有标点符号,则英文字母和数字将会被拆分开,不知道是什么原因?有没有解决的办法? ./scws -c utf8 -i mp3 mp3 +--[scws(scws-cli/1.2.2)]----------+ | TextLen: 3...

19.RE: SCWS 能否添加 “中文+英文”和“中文+数字”自定义词

发布时间:2012-08-30 20:08 t By xiaofeng

...hightman' pid='1078' dateline='1346301119'] 支持是支持的,但数字字母最多只支持2位。 你说的情况其实切分成“斯巴鲁+WRX”并不会有多大问题吧。 像 Q币 QQ空间 这样的都是可以支持成词的。 [/quote] 感谢hightman 的回复。 因为...

20.RE: 英文模糊搜索问题

发布时间:2013-07-31 15:07 t By homingway

...搜索和空格不冲突吧。你单词内模糊就行了,比如按3个字母为单位建立? [/quote] 非常感谢! 我刚试了下,针对我的需求来说,对于人物英文名以3个字母为单位建立索引的确可以达到很好的效果,中文名以一个汉字为单位...

  • 时间不限
  • 按相关性排序