搜索

大约有 48 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0051秒)

21.RE: 中文分组粗分方法

发布时间:2010-05-26 19:05 t By baobao

...具,把字典解压。得出了关于的词的字段 WORD TF IDF ATTR 当机立断 14.01 8.10 i WORD ATTR我都能理解。 上贴说的逐字分词后 计算权重的时候使用IDF,貌似就是类似基于字典的最大概率方式来定义权重,或者说是对于...

22.新手問題

更新时间:2010-07-29 13:07 t By user1000

1. 請問idf怎麼算呀?這有什麼意思? 2. send_text之後,PHP中怎麼看到tf呢?[hr] 请问xdb里的tf idf是那来的计数据呢?

23.RE: 中文分组粗分方法

发布时间:2010-05-27 11:05 t By hightman

...在各种语料中出现的机率权重。(越经常出现的越高) IDF是逆词频率,也就是说这个词更重要(因为罕见一些);具体参见:http://baike.baidu.com/view/1228847.html 并没有很固定的算法,SCWS中的tf/idf均经过特殊加工处理了

24.RE: 自定义的 txt 字典 有关问题 求助

发布时间:2010-04-09 15:04 t By hightman

...个属性对分词效果有一定影响的,TF主要用于词的切分,IDF用于统计,词性就用在取TOP时过滤或标注上。 最好是基于现有的词典去补充,你重建一个的话数据又都没有效果可能会比较差。SCWS主页上有一个TF/IDF计算器,你可以...

25.Undefined index: part 的提示

发布时间:2011-02-09 23:02 t By hit

...Undefined index: tf in Putdata.php on line 141 Notice: Undefined index: idf in Putdata.php on line 141 Notice: Undefined index: attr in Putdata.php on line 141 140:if ($v['part']) $flag |= 0x02; 141:$data = pack('ffCa3', $v['tf'], $v['idf'], $flag, $v['attr']); 为什么会出现这...

26.[特别发布] 纯PHP编写的xdb词典导入导出工具!!

发布时间:2009-07-01 17:07 t By hightman

...,每行一条记录,#开头表示注释,每条记录由 word、TFIDF、Attr组成,其中TF是词频系数,IDF是逆词频率系数 而Attr是北大标注法的词性,这四个字段之间用\t隔开。 --- hightman 特别制作于 2009.7.1 下载地址:http://www.ftphp.com/...

27.规则集

发布时间:2011-11-10 01:11 t By clearchen

不太了解这个规则集的写法,请高手给讲解一下,谢谢 比如这个 [areaname2] :type = suffix :znum = 2 :exclude = noname,symbol,alpha,chnum2 :tf = 4.5 :idf = 3.0 :attr = ns :line = yes 东路 西路 支路 街道 南路 北路 分别是指什么意思呢?

28.PSCWS23 词典文件如何制作

发布时间:2011-11-28 11:11 t By alicar

PSCWS23 词典文件如何制作 xdb导入导出工具导出信息如下 ---------------------------------- # WORD TF IDF ATTR ---------------------------------- 除了表头,一个都没导出。。。。。。

29.关于词频的解释

发布时间:2013-04-12 10:04 t By jasonniu

请问下 我分了一个句子“小明从前门进来” 分成了 小明+从前+门+进来 请问该怎么调整“从前”和“前门”的词频才能正确的分出这句话呢? 还有那个TF-IDF两个权值是什么意思 怎么用

30.词典格式疑问?

发布时间:2010-12-10 00:12 t By lauxinz

...次为“词语"(由中文字或[b]3个以下的字母合成[/b]), "TF", "IDF", "词性", 字段时间用空格或制表符分开,数量不限,可自行对齐以美化。[/quote] “词语"为什么会有3个字母的限制呢?,比如词语“java”。这个限制是不是已经废弃...

12345
  • 时间不限
  • 按相关性排序