搜索

大约有 90 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1019秒)

71.php(utf8编码)PSCWS v4.0 是目前最新的版本吗?

发布时间:2013-05-22 21:05 t By zouhc

...? 求推荐和指点,谢谢了! [color=#006400]PHP版简易中文分词第四版(PSCWS v4.0) - 分词核心类库代码[/color]

72.咨询SCWS准确率是如何计算出来的

发布时间:2013-10-08 17:10 t By tiankong

我想咨询一个问题。SCWS官网简介上指出,SCWS中文分词系统(Simple Chinese Word Segmentation)经小范围测试准确率在 90% ~ 95% 之间。 上面的准确率是如何计算出来的呢?或者有其他类似的标准测试工具吗?谢谢!

73.xunsearch-1.4.1 (xapian+scws 开源搜索引擎,修正搜索进程死锁)

发布时间:2013-02-21 11:02 t By hightman

...采用 C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅...

74.修正utf-8版make_xdb_file.php的错误

发布时间:2011-06-09 09:06 t By itlong

...GBK dictionary 到80行,这是不参对utf-8字符处理的,不能对中文(中英混合)字符进行mb_substr($word, 0, $len)切分,[u]mb_substr($word, 0, $len)切分中文会是乱码的。[/u] 所以要人为添加字符串处理涵数,针对utf-8。 [php] function msubstr($str, $s...

75.请问一下,xdb与txt词库那个读取效率更高

发布时间:2013-06-29 21:06 t By 阿弟2013

...高 另外,scws对于中英文分词效果不是很好,即文中的中文分得还可以,但对于页面中的英文部分,包括email,url,host这类处理效果比较差,我们目前采用两个分析器配合使用来达到最好的效果,要是scws能处理得了像email,host,url...

76.最新的主要变动

...rScws 接受参数作为复合等级 - 升级 libevent 到 2.x 版 - 修正中文 stopwords 不生效的问题 - 取消恼人的 NODB(S#506) 错误提示 - 新增获取文档匹配词表的接口 [XSSearch::setRequireMatchedTerm] 版本 1.4.7 (2013-7-30) ---------------------- - 优化安装脚本...

77.请教分词结果的问题

发布时间:2010-05-10 12:05 t By xiaolan

...好的项目。。 -________- 。。 最近有个PHP项目需要用到中文分词。。辗转很久来到了这里。。 在本机安装也很顺利,。 不过。。编码用的UTF8 按照文档里面的demo也自己做个小东西。。试试。。。 然后。。 $words = scws_get_w...

78.使用SCWS的libscws C源码,测试分词不成功

发布时间:2014-01-02 18:01 t By banderuilq

...载了SCWS的源码,使用其中的libscws; 2,并下载了 [简体中文(UTF-8) (3.9MB,28万词,2013/01/08更新)] scws-dict-chs-utf8.tar.bz2。 3,使用示例代码: #include #include #define SCWS_PREFIX "/usr/local/scws" main() { scws_t s; scws_res_t res, cur...

79.求助:演示的源码在本地和演示上分词测试结果不同【已解决】

更新时间:2013-07-02 21:07 t By jjyang

...学校的监控记录一一让亲属过目。   正反面分别用中文、日文写的遗书只有一页笔记本纸,遗书内容透露了自己对生活失去勇气,监控记录显示事发当晚小倩一个人慢慢地走向窗口,轻轻地把包放在一旁,脱去了鞋子,并...

80.SCWS-php扩展的说明及用法

发布时间:2007-06-07 18:06 t By hightman

...据设定好的选项切割后以数组形式返回每一个词汇。它为中文而编写,支持 gbk 和 utf-8 字符集,适当的修改词典后也可以支持非中文的多字节语言切词(如日文、韩文等)。除分词外,还提供一个简单的关键词汇统计功能,它内...

  • 时间不限
  • 按相关性排序