搜索

大约有 40 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0055秒)

11.特苦恼,今天想给xdb加词使劲报错。感谢帮忙看看

更新时间:2013-08-24 01:08 t By 一只死菜鸟

...。ERROR: output xdb file exists:后面是文件名 是从网站上面下载XDB导入导出工具 起初我以为是我改的txt格式不对还是怎么的 后来我直接将xdb导出成txt,如下 php E:\www\dump_xdb_file.php E:\www\dict.xdb E:\www\1.txt 成功导出之后,不做任...

12.扩展安装问题求助,谢谢

更新时间:2009-05-25 15:05 t By pardis_xiong

...麻烦你下啦。 我的网站是gb2312的,但是从 scws 主页上下载词典文件有好几个,dict.utf8.xdb,dict.xdb和dict_cht.utf8.xdb,我可以把这几个都装到etc文件夹里么?还有那几个ini文件也是一样的问题。 我已经在php.ini中这样配置了: exte...

13.RE: Windows7 分词准确率极低

发布时间:2010-12-31 10:12 t By hightman

$hdr['fsize'] 是从 XDB 的头部 unpack 出来的,可能 xdb 文件损坏了,PSCWS4的XDB文件必须和SCWS一样,从 www.ftphp.com/scws/ 下载

14.RE: 为何导出txt,里面内容不动在创建XDB之后速度变慢很多很多

更新时间:2011-03-13 02:03 t By hit

...dll c调用的那种 于是就这样我用小工具创建的XDB比官方下载的分词速度慢 演示版的那个分词 0.06s 用我创建的XDB就到 0.09-0.1s了 我觉得比较奇怪~~ 一切都是按说明操作的 还有xdb没有增加新的词语和减少词语用的官方XDB导出...

15.[特别发布] 纯PHP编写的xdb词典导入导出工具!!

发布时间:2009-07-01 17:07 t By hightman

...个字段之间用\t隔开。 --- hightman 特别制作于 2009.7.1 下载地址:http://www.ftphp.com/scws 或 www.hightman.cn/bbs 的 scws 版

16.RE: 官方和提供的下载不一样,并且官方实例还写了错误代码

发布时间:2010-07-14 17:07 t By hightman

1. 多一个T是哪儿,我没看明白。 2. 你的错误是因为你用错误词了,48.php 是针对UTF-8的,而你调用了gbk的词典,把你的词典语句改为 dict.utf8.xdb 即可 3. dict_extra.txt 也必须是UTF-8编码 4. 删除词条,因为陈凯歌其实可能是因为人...

17.[求助]如何转换pre版本的xdb为txt格式

发布时间:2007-12-25 17:12 t By hackson

...新版本的xdb词库不兼容,能否麻烦提供一个txt格式的词库下载?多谢指教。 p.s. 感谢hightman坛主为开源事业所做出的杰出努力,现在网上发布的种种分词工具,绝大部分都只提供了控件或者插件而不直接提供源代码和分词词库...

18.RE: 关于自建字典问题

发布时间:2013-09-02 02:09 t By gwgwgw

备注,我下载的版本是1.22的 现在的版本还能载入文本文件(txt)么 ,我在调试的过程中发现add_dict() 函数载入xdb文件没有问题,但是载入txt文件就报错,望回答。 备注:老版本的如1.17还有下载

19.RE: 官方和提供的下载不一样,并且官方实例还写了错误代码

更新时间:2010-07-14 21:07 t By sulwan

...里呢? 上边指定的词库也是UTF8啊 您能否提供完整实例下载呢,直接查看您源码就是乱码,我要右键选择编码,完后复制的![hr] extension = scws.so scws.default.charset = utf8 scws.default.fpath = /usr/local/scws/etc

20.RE: [特别发布] 纯PHP编写的xdb词典导入导出工具!!

更新时间:2009-07-26 12:07 t By hightman

...的. 我发一份我这边正确导出的词库吧.(你可以从附件处下载) 而对于其中的 TF / IDF 则相应的表示该词的词频率系统以及逆词频率(表示词重要性), 你可以参考现有的词造一个系数. 而词性标注请看这篇: http://www.hightman.cn/bbs/sho...

1234
  • 时间不限
  • 按相关性排序