搜索

大约有 105 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1956秒)

21.请问SCWS可以做英文分词么?

发布时间:2014-11-18 14:11 t By angelhater

我想对打断的英文做分词,utf-8,scws可以用么?应该下载哪个版本呢?PSCWS4 说是速度慢,不推荐使用,而PSCWS23 仅支持GBK字符集

22.英文与数字组合词分词错误

发布时间:2014-04-20 16:04 t By tenjin

scws分词时出现这样的情况,英文字母与数字组合分词时,若词的前面或后面有标点符号,则英文字母和数字将会被拆分开,不知道是什么原因?有没有解决的办法? ./scws -c utf8 -i mp3 mp3 +--[scws(scws-cli/1.2.2)]----------+ | TextLen: 3...

23.对于英文处理使用的TF值的疑问

发布时间:2010-06-02 19:06 t By baobao

学习中看到,程序对于英文字串的处理时,定义TF的值为 = 2.5×log(#wlen),词长的自然对数的2.5倍。有什么实际意义么? 为什么是这个值呢?

24.RE: 第四版遇到()和中英文混合分词的问题。

更新时间:2009-06-14 03:06 t By JamesKG

...遇到相同的問題。 不過我數字可以,但是[color=#0000CD]英文[/color]不能。 我是使用[color=#FF0000]繁體字庫[/color]。 版本是:php_scws.dll(2)/Windows/PHP 5.2.x [php] [/php] 結果在下面: [code] 原始文字:這個文件是為了測試...

25.RE: 英文数字组合字符串分词问题

发布时间:2014-05-14 11:05 t By soarb

[quote='hpxl' pid='7811' dateline='1400033006'] sdk/php/app/demo.ini配置 [id] type = id [/quote] 是scws-1.2.2 的如何让它支持自已定义的英文词库? 像http://bbs.xunsearch.com/showthread.php?tid=3088 这样修改代码吗?

26.RE: SCWS 能否添加 “中文+英文”和“中文+数字”自定义词

更新时间:2012-09-03 11:09 t By hightman

scws源码中写死的…… 超过2个字符的英文数字都在第一步被预处理了,所以想要改这个恐怕了也会比较麻烦。

27.RE: 英文可否实现这样的搜索

发布时间:2012-04-30 22:04 t By ykjsw

知道了,要自定义分词,用二元分词应该可以把。

28.RE: hm老大,英文词典的问题

发布时间:2012-03-29 12:03 t By hightman

scws目前支持带空格的词恐怕有困难

29.RE: 关于中英文混合切词

发布时间:2012-04-02 14:04 t By hightman

中英混合的词目前最多只支持2个字母

30.RE: 关于中英文混合切词

发布时间:2012-04-02 14:04 t By hightman

中英混合的词目前最多只支持2个字母

  • 时间不限
  • 按相关性排序