搜索

大约有 30 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0987秒)

1.老大看看 做词典的时候总是 报 发现不了 tf idf

发布时间:2010-03-15 11:03 t By sblig

make_xdb_file.php [color=#FF0000]原[/color] for ($k = 0; $k < 0x40; $k++) { if (!isset($rec[$k])) continue; $cnt = 0; printf("Inserting [%02d/64] ... ", $k); foreach ($rec[$k] as $w => $v) { $flag = (isset($v['tf']) ? 0x01 : 0); if ($part) $flag |= 0x02; $data = pack('ffCa3', ...

2.使用SCWS的libscws C源码,测试分词不成功

发布时间:2014-01-02 18:01 t By banderuilq

...set_charset(s, "utf8"); scws_set_dict(s, "/usr/local/scws/etc/dict.utf8.xdb", SCWS_XDICT_XDB); scws_set_rule(s, "/usr/local/scws/etc/rules.utf8.ini"); scws_send_text(s, text, strlen(text)); while (res = cur = scws_get_result(s)) { while (cur != NULL) { printf("WORD:...

3.使用自定义词库的时候,部分词会丢失

更新时间:2014-04-18 17:04 t By tianly

使用的版本是SCWS-1.2.2 我用自己的词库替换了dict.utf8.xdb,然后尝试分词“朝鲜近日播放的一个纪录片中,发现”,发现“纪录片中”在分词结果中丢失了 Array ( [word] => 朝鲜 [off] => 0 [len] => 6 [idf] => 0 [attr] => @ ) Array ( [word] => 近...

4.SCWS-1.1.9 没法分中文?

发布时间:2012-01-07 12:01 t By hejone

... scws_set_charset(s, "gbk"); scws_set_dict(s, "/usr/local/scws/etc/dict.xdb", SCWS_XDICT_XDB); scws_set_rule(s, "/usr/local/scws/etc/rules.ini"); scws_send_text(s, text, strlen(text)); while (res = cur = scws_get_result(s)) { while (cur != NULL) { printf("Word: %.*s...

5.[特别发布] 纯PHP编写的xdb词典导入导出工具!!

发布时间:2009-07-01 17:07 t By hightman

纯PHP编写的xdb词典(SCWS - http://www.ftphp.com/scws 所采用)导入导出工具!! 1. 词典导出:dump_xdb_file.php 在命令行模式下运行 php dump_xdb_file.php [存入的文本文件] 第二参数省略则直接输出到标准输出。 2. 词典生成:make_xdb_f...

6.RE: 老大看看 做词典的时候总是 报 发现不了 tf idf

更新时间:2010-03-15 19:03 t By hightman

是你的.txt文件不规范吗,为什么会报不存在['tf'] & ['idf'] 啊 phptool for xdb 有最新版啊,建议下载最新的:http://www.ftphp.com/scws/download.php#xtools

7.RE: 求TF/IDF算法(官方的计算器没有作用)

发布时间:2013-05-22 13:05 t By hightman

...更新后的修改时间由于某些原因比/tmp目录下生成的临时xdb还要旧,所以就不会更新。 你查查吧

8.xdb导入导出工具,导出的词典是空白的

发布时间:2014-01-08 21:01 t By ty371361218

导出的可视词典里面只有“# WORD TF IDF ATTR”这几个字符,其他都是空白

9.RE: 冒昧的问一下——怎么用tf和idf来计算权重?

发布时间:2012-02-22 18:02 t By vanni

... 3 舒护 4 活泉水 # scws -A -d /hp/opt/scws/dict/default.utf8.xdb:/home/vanni/scws/mydict.txt -c utf8 "相宜本草洗面奶和雅漾舒护活泉水哪个好" 相宜/a 本草/nz 洗面奶/nz 和/c 雅漾/@ 舒护/@ 活泉水/@ 哪个/r 好/a 雅漾 、舒护、 活泉水 都能...

10.RE: [特别发布] 纯PHP编写的xdb词典导入导出工具!!

发布时间:2010-03-29 17:03 t By sdzhxl

最近在做个项目,用到了分词,找了一下,发现这个,很好. 遇到一个问题, 命令导出xdb到txt,只导出了这个 # WORD TF IDF ATTR 请问这是咋回事

123
  • 时间不限
  • 按相关性排序