搜索

大约有 5 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0030秒)

1.RE: 中文分组粗分方法

发布时间:2010-05-27 11:05 t By hightman

TF就是词频,也就是这个词在各种语料中出现的机权重。(越经常出现的越高) IDF是逆词频,也就是说这个词更重要(因为罕见一些);具体参见:http://baike.baidu.com/view/1228847.html 并没有很固定的算法,SCWS中的tf/idf均...

2.RE: [特别发布] 纯PHP编写的xdb词典导入导出工具!!

更新时间:2009-07-26 12:07 t By hightman

...附件处下载) 而对于其中的 TF / IDF 则相应的表示该词的词频系统以及逆词频(表示词重要性), 你可以参考现有的词造一个系数. 而词性标注请看这篇: http://www.hightman.cn/bbs/showthread.php?tid=42

3.[特别发布] 纯PHP编写的xdb词典导入导出工具!!

发布时间:2009-07-01 17:07 t By hightman

...表示注释,每条记录由 word、TF、IDF、Attr组成,其中TF是词频系数,IDF是逆词频系数 而Attr是北大标注法的词性,这四个字段之间用\t隔开。 --- hightman 特别制作于 2009.7.1 下载地址:http://www.ftphp.com/scws 或 www.hightman.cn/bbs ...

4.自定义 SCWS 词库

...格或制表符(\t)分隔 - 字段含义依次表示 “词语”,“词频(TF)”,“逆词频(IDF)”,“词性(ATTR)” - 后面三个字段如果省略依次使用 scws 的默认值 - 特殊词性 `!` 可用于表示删除该词 - 自定义词典优先于内置词典加载和使...

5.RE: [特别发布] 纯PHP编写的xdb词典导入导出工具!!

更新时间:2009-07-27 09:07 t By etbobhwang

...附件处下载) 而对于其中的 TF / IDF 则相应的表示该词的词频系统以及逆词频(表示词重要性), 你可以参考现有的词造一个系数. 而词性标注请看这篇: http://www.hightman.cn/bbs/showthread.php?tid=42 [/quote] 謝謝 ! 那 TF/IDF 事實上...

  • 时间不限
  • 按相关性排序