搜索

大约有 20 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.4871秒)

1.RE: 中文分组粗分方法

发布时间:2010-05-26 19:05 t By baobao

...用您发布的工具,把字典解压。得出了关于的词的字段 WORD TF IDF ATTR 当机立断 14.01 8.10 i WORD ATTR我都能理解。 上贴说的逐字分词后 计算权重的时候使用IDF,貌似就是类似基于字典的最大概率方式来定义权重,...

2.SCWS - rules.ini 规则集配置文件

发布时间:2007-06-07 20:06 t By hightman

...r ; $Id: rules.ini,v 1.3 2007/06/07 08:37:07 hightman Exp $ ; ; special word, 特殊词汇 ; [special] C++ .NET C# R&B S.H.E P&B ; ; nostats ; [nostats] about all also an and any are as at be but by both can for from have here if in is it no not of on or...

3.自定义词典产生的故障

更新时间:2012-04-29 20:04 t By yunxiaoad2

...了乱码: array(3) { ["off"]=> int(0) ["attr"]=> string(3) "@�" ["word"]=> string(15) "重庆鸡公煲" } array(3) { ["off"]=> int(0) ["attr"]=> string(3) "ns�" ["word"]=> string(6) "重庆" } array(3) { ["off"]=> int(6) ["attr"]=> string(3) "n�" ["word"]=> string(6) "鸡公" } array(3) ...

4.载入txt词典所出现的BUG

更新时间:2011-08-09 12:08 t By 999

a.txt文档内容: # WORD TF IDF ATTR 印第安那 13.30 15.98 ns 印第安那州 12.72 11.56 ns 印第安那波利斯 12.31 12.68 ns [php] $txt = '我名字叫印第安那,我的家乡是印第安那州的印第安那波利斯!'; $so = scws_open(); scws_set_charset($so, 'gbk'); s...

5.[特别发布] 纯PHP编写的xdb词典导入导出工具!!

发布时间:2009-07-01 17:07 t By hightman

...件的说明,每行一条记录,#开头表示注释,每条记录由 wordTFIDFAttr组成,其中TF是词频系数,IDF是逆词频率系数 而Attr是北大标注法的词性,这四个字段之间用\t隔开。 --- hightman 特别制作于 2009.7.1 下载地址:http://ww...

6.PSCWS23 词典文件如何制作

发布时间:2011-11-28 11:11 t By alicar

PSCWS23 词典文件如何制作 xdb导入导出工具导出信息如下 ---------------------------------- # WORD TF IDF ATTR ---------------------------------- 除了表头,一个都没导出。。。。。。

7.xdb导入导出工具,导出的词典是空白的

发布时间:2014-01-08 21:01 t By ty371361218

导出的可视词典里面只有“# WORD TF IDF ATTR”这几个字符,其他都是空白

8.RE: 自定义的 txt 字典 有关问题 求助

发布时间:2010-04-08 09:04 t By lerado

我想问一下,自定义的词典里,只有word,没有其它TFIDFAttr可以吗?能生成吗。 因为我试了直接加载TXT的太慢了,想转换成XDB。

9.RE: [特别发布] 纯PHP编写的xdb词典导入导出工具!!

发布时间:2010-03-29 17:03 t By sdzhxl

最近在做个项目,用到了分词,找了一下,发现这个,很好. 遇到一个问题, 命令导出xdb到txt,只导出了这个 # WORD TF IDF ATTR 请问这是咋回事

10.RE: 在php cli 下测试自定义字典的更新问题

发布时间:2010-10-13 10:10 t By 逆雪寒

... 1.0 tq ------- Array ( [0] => Array ( [word] => 精武英雄 [off] => 0 [len] => 12 [idf] => 1 [attr] => tf ) ) 字典变了。读出来没变

12
  • 时间不限
  • 按相关性排序