搜索

大约有 168 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0061秒)

121.RE: SCWS不支持英文和中英文混合分词吗?

发布时间:2010-08-27 10:08 t By hightman

中文外其余的只按标点符号或空格切分,无缝连在一起的单词字母是不支持的。

122.问个弱智的问题,不知道会不会收到回复?

发布时间:2011-09-19 13:09 t By strongfinger

用了网上的演示,这个分词系统挺好用的.但是本人是PHP新手,使用win7平台,hightman大侠提供的好像是一个中文分词引擎,不知道怎么直接在我的php空间上激活。请问我自己要怎么实现演示页面的显示效果呢?

123.咨询SCWS准确率是如何计算出来的

发布时间:2013-10-08 17:10 t By tiankong

我想咨询一个问题。SCWS官网简介上指出,SCWS中文分词系统(Simple Chinese Word Segmentation)经小范围测试准确率在 90% ~ 95% 之间。 上面的准确率是如何计算出来的呢?或者有其他类似的标准测试工具吗?谢谢!

124.对于分词的一些困惑

更新时间:2010-10-13 17:10 t By 逆雪寒

...词 这样来分[hr] 那如果是这样就麻烦了。。怎么能解决 中文+数字 结合的词呢?

125.搜索建议和纠错

...速度过快或各种原因都很容易造成一两个字母出错。对于中文来说,古代就动不动 出现同音”通假字“,绝大多数现代人也使用拼音输入法,加上方言口音,乱用同音字现象非常普遍。 所以系统在综合分析索引库内的词汇、用...

126.发现有几种情况会导致分词不准确?

发布时间:2011-09-15 14:09 t By 逆雪寒

scws分词不正确的情况 1、中文夹杂连续两个以上英文或数字(例如:程jj序ii员e 正常,程jjj序ii员e 不正常) 2、英文数字组合中,同时含有连续一个以上英文或数字的组合(例如:w1156k 正常,w16ky不正常) 3、含有任意一个...

127.xunsearch-1.4.1 (xapian+scws 开源搜索引擎,修正搜索进程死锁)

发布时间:2013-02-21 11:02 t By hightman

...采用 C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅...

128.第四版遇到()和中英文混合分词的问题。

发布时间:2008-01-03 11:01 t By kts2tt

...出来。 而且 六灯夜视D502 这样的名称 也只能分出 中文, 英文和数字没有被分出来,是为什么?请教高手。 我用的是SCWS 扩展 PHP 5.2.x 版二进制文件!

129.RE: [HELP]xunsearch安装好了,搜索没有结果集。。。

发布时间:2011-10-26 15:10 t By vist2007

...供scws的api接口,实现短语分词功能 2.是否可以对scws自定义中文词典,方便扩展

130.修正utf-8版make_xdb_file.php的错误

发布时间:2011-06-09 09:06 t By itlong

...GBK dictionary 到80行,这是不参对utf-8字符处理的,不能对中文(中英混合)字符进行mb_substr($word, 0, $len)切分,[u]mb_substr($word, 0, $len)切分中文会是乱码的。[/u] 所以要人为添加字符串处理涵数,针对utf-8。 [php] function msubstr($str, $s...

  • 时间不限
  • 按相关性排序