搜索

大约有 30 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0055秒)

1.建议用户能设置数字分词

发布时间:2013-06-18 10:06 t By yestar

比如我要搜索 E14188m 这个词的时候,能搜索到。 但是当我要搜索 E1418的时候却无法搜索到。希望能够配置数字当做字符串

2.RE: 建议用户能设置数字分词

更新时间:2013-06-18 14:06 t By hightman

这是分词的策略问题,这种情况可以自定义分词器来补充。。。 将你的词复制到 [url]http://www.xunsearch.com/scws/demo/v4.php[/url] 进行实测,分割结果为: E14188m E14188 14188 14188m 那么搜索以上4个词都是可以搜索到的,至于你从中提取 e...

3.为什么只打印出里面的数字,中文直接分词

发布时间:2013-04-12 23:04 t By xiaodai

用pscws4分词,为什么只打印出里面的数字,中文直接分词打印,网页编码是utf8 function get_tags_arr($title){ require 'pscws4/pscws4.class.php'; $pscws = new PSCWS4(); $pscws->set_dict('scws/dict.utf8.xdb'); $pscws->set_rule('scws/rules.utf8.ini'); $pscws->set_ign...

4.数字汉字混合分词的困扰

发布时间:2014-04-20 17:04 t By 漫步云海

带阿拉伯数字的节日 如”51劳动节“ 只能分出”劳动节“,只要数字在前面就识别出来,同时也很奇怪如果这些数字大于百位数 如”2014劳动节“ 就能分出2014和劳动节,最终想要”61儿童节“=61+儿童节 的效果,大神求助。。...

5.发现有几种情况会导致分词准确?

发布时间:2011-09-15 14:09 t By 逆雪寒

scws分词正确的情况 1、中文夹杂连续两个以上英文或数字(例如:程jj序ii员e 正常,程jjj序ii员e 正常) 2、英文数字组合中,同时含有连续一个以上英文或数字的组合(例如:w1156k 正常,w16ky正常) 3、含有任意一个...

6.RE: 英文与数字组合词分词错误

发布时间:2014-04-23 10:04 t By tenjin

C++版本和官网演示分词一致。 ".mp3",在线演示切分成". mp3",C++版本 1.22切分为". mp 3";

7.英文与数字组合词分词错误

发布时间:2014-04-20 16:04 t By tenjin

scws分词时出现这样的情况,英文字母与数字组合分词时,若词的前面或后面有标点符号,则英文字母和数字将会被拆分开,知道是什么原因?有没有解决的办法? ./scws -c utf8 -i mp3 mp3 +--[scws(scws-cli/1.2.2)]----------+ | TextLen: 3...

8.英文数字组合字符串分词问题,已结贴。

更新时间:2014-05-14 10:05 t By hpxl

华硕主板H61-PLUS,想分词结果中包含H61。 通过 [url=http://www.xunsearch.com/scws/demo/v48.php]http://www.xunsearch.com/scws/demo/v48.php[/url] 得到的结果为“华硕/主板/H/61/-/PLUS”。尝试过自定义词库,$prefix/data/项目名称/dict_user.txt 加入H61,但是...

9.对于分词的一些困惑

更新时间:2010-10-13 17:10 t By 逆雪寒

...呢。[hr] 经过测试,还发现。 加载任何字典和规则。 数字是照样能给分词出来的。。似乎默认就把一窜数字就是一个词 这样来分[hr] 那如果是这样就麻烦了。。怎么能解决 中文+数字 结合的词呢?

10.RE: 怎样才能 字母数字汉字组合 按照词典分成一个词语呢?

更新时间:2013-07-03 11:07 t By shuyinglee

昨天弄了一晚上, 因为我是写php的对C语言熟系,研究了一下源代码,最终功夫负有心人,成功的避过了中英文混合,使用字典中的词语分词,我用的是 scws-1.2.1.tar.bz2 这个版本,因为能发附件,如果大家需要联系我: Ema...

123
  • 时间不限
  • 按相关性排序