搜索

大约有 83 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1981秒)

31.关于 SCWS 简易中文分词系统

更新时间:2013-01-10 16:01 t By hightman

...om/scws][b][size=5][color=#FFA500]2010/01, scws-1.1.0 发布,支持加载文本词典,下载及介绍请进项目站点 http://www.xunsearch.com/scws[/color][/size][/b][/url] [url=http://www.xunsearch.com/scws][b]2008/12, scws-1.0.1 发布[/b][/url] [url=http://bbs.xunsearch.com/showthread.php?...

32.RE:1236

发布时间:2007-07-26 17:07 t By phaeton

楼主,我也在研究自动分类,觉得你的文本分类准确度很高啊,能不能把这个程序也包装一下,做出接口和库来,在这里共享一下

33.RE:1272

发布时间:2008-10-11 10:10 t By piaofen

哇塞,你那个是什么字典啊?有格式的。 Hightman 老大的字典好像不能用文本打开吧。貌似是二进制的

34.RE: 分词不对

发布时间:2010-04-26 13:04 t By hightman

多谢汇报,根据词典机械分词存在一定的误分率。 因为该词典从互联网信息为主要语料进行取值,故可能存在一些错误,只要将词典中的 年高 词频调低即可。 若不方便改词典可以加一个文本词典,并将 年高 词频减低。

35.RE: 分词不对

更新时间:2010-04-30 13:04 t By hightman

呃确实存在,这都跟这个词库有关系,是互联网上整理的词库,像“法上”居然是专有名词而且权重很高。。。 可以考虑删除“法上”这个错误的词,外挂一个文本词典把“法上”标记为删除或设成更低权重及词性

36.RE: “讨薪”这个词无法取到

发布时间:2010-10-13 17:10 t By hightman

可能因为词库中没有这个词,建议通过外挂一个文本型的扩展词典来解决。参见置顶贴子的说明!

37.RE: 请教如何才能方便的编辑字典文件..

发布时间:2011-09-14 11:09 t By hightman

已经很方便啊,支持文本词典。

38.关于gen-scws-dict 操作方法

发布时间:2011-06-26 20:06 t By hit

这个如何使用的说... 能否写一个简单的添加文本文件输出db文件和设置字符集utf8的例子... 多谢...

39.RE: 扩展安装问题求助,谢谢

发布时间:2009-05-26 09:05 t By hightman

XDB不可轻易修改, 需要借助工具转换纯文本为xdb, 添加和修改词不太方便 还有二楼的代码是手册里的讲解,并不是要你抄进去. scws_get_tops() 返回的 attr 带有乱码是因为 windows 的 dll 较早所以才会有这样的BUG, 问题不大

40.RE: 关于自建字典问题

发布时间:2013-09-02 02:09 t By gwgwgw

备注,我下载的版本是1.22的 现在的版本还能载入文本文件(txt)么 ,我在调试的过程中发现add_dict() 函数载入xdb文件没有问题,但是载入txt文件就报错,望回答。 备注:老版本的如1.17还有下载么

  • 时间不限
  • 按相关性排序