搜索

大约有 30 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1972秒)

11.英文数字组合字符串分词问题,已结贴。

更新时间:2014-05-14 10:05 t By hpxl

...$prefix/data/项目名称/dict_user.txt 加入H61,但是不起作用,中文词汇是可以的。如果想分词结果中有H61,是不是只能自定义分词了?像这种商品的型号中很多类似的,如华硕主板H87-PLUS,H61、H87分别代表不同的主板芯片组。

12.对于分词的一些困惑

更新时间:2010-10-13 17:10 t By 逆雪寒

...词 这样来分[hr] 那如果是这样就麻烦了。。怎么能解决 中文+数字 结合的词呢?

13.一个疑问……

发布时间:2007-11-28 22:11 t By 逍遥小妖

... 对于一个页面来说,通常含有数字、英文、英文标点、中文标点、中文等文字要素(可阅读部分,HTML已过滤),视情况而定,搜索引擎还有可能抓出含有乱码的片段。 但是SCWS分词时似乎要求字符串中只能有中文中文标点,...

14.发现有几种情况会导致分词不准确?

发布时间:2011-09-15 14:09 t By 逆雪寒

scws分词不正确的情况 1、中文夹杂连续两个以上英文或数字(例如:程jj序ii员e 正常,程jjj序ii员e 不正常) 2、英文数字组合中,同时含有连续一个以上英文或数字的组合(例如:w1156k 正常,w16ky不正常) 3、含有任意一个...

15.关于 SCWS 简易中文分词系统

更新时间:2013-01-10 16:01 t By hightman

SCWS 全称是 Simple Chinese Words Segmentation 即简易中文分词系统。 [url=http://www.xunsearch.com/scws][b][size=5][color=#FFA500]2010/01, scws-1.1.0 发布,支持加载文本词典,下载及介绍请进项目站点 http://www.xunsearch.com/scws[/color][/size][/b][/url] [url=http://w...

16.RE: addRange后count不准确

发布时间:2014-05-05 16:05 t By yuangu125

这个统计的我也是不准,不明白什么原因,数字可能还好,这个中文搜索,精确匹配的,就是怪怪的。

17.我对切词尝试做了下功能修改

更新时间:2013-12-27 20:12 t By linqingtao

...int i; // mb + single-byte. allowd: alpha+num + 中文 if (!SCWS_IS_ALNUM(ch)) break; pflag &= ~PFLAG_VALID; // 夹在中文间的英文数...

18.第四版遇到()和中英文混合分词的问题。

发布时间:2008-01-03 11:01 t By kts2tt

...出来。 而且 六灯夜视D502 这样的名称 也只能分出 中文, 英文和数字没有被分出来,是为什么?请教高手。 我用的是SCWS 扩展 PHP 5.2.x 版二进制文件!

19.scws-1.0.0 正式发布 (含php扩展及2文本词典)

更新时间:2010-01-29 13:01 t By hightman

...明节选] SCWS 是 Simple Chinese Words Segmentation 的缩写(简易中文分词系统)。 它是一套基于词频词典的机械中文分词引擎,它能将一整段的汉字基本正确的 切分成词,因为词是汉语的基本语素单位,而书写的时候不像英语会在词...

20.RE: 请问一下,xdb与txt词库那个读取效率更高

更新时间:2013-06-29 23:06 t By 阿弟2013

...明显csws把email,网址给拆开了,还有标签没有去除,但是中文词是正确的分开了 postgres=# SELECT to_tsvector('zw_simple','pgsql中国社区论坛 http://www.pgsqldb.org:8079 chenaishen@263.net'); to_tsve...

123
  • 时间不限
  • 按相关性排序