搜索

大约有 120 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1963秒)

81.发一个稳定复现的问题

更新时间:2014-03-03 15:03 t By getwe

... printf("Usage : %s dict rule\n",argv[0]); return -1; } sc...

82.RE: 二元分词问题

更新时间:2011-11-15 11:11 t By hightman

需要 NEAR 位置信息的话,目前只能用内置的 scws 分词 scws 目前不能自定义词库,你必须把词库转换成 dict.utf8.xdb 一个统一的词库放进 $prefix/etc/ 才可以

83.RE:1262

发布时间:2008-01-14 21:01 t By xueron

1楼附件里面包含了libscws源码和gbk的dict.xdb和rules.ini,所以比较大

84.ubuntu 64位无法分词

发布时间:2013-11-05 12:11 t By luopuya

ubuntu13.04是用amd64.iso在虚拟机里安装的 分词几乎都是un 而在另一个32位ubuntu上则正常 字典是完好的的xdb 顺便问下有无txt格式的字典下载,用scws_gen_dict生成不知道行否

85.自定义词库怎么控制(字母+数字)组合的个数

发布时间:2012-08-27 16:08 t By kill-all999

...滤方案。 $sh = scws_open(); scws_set_charset($sh, 'utf8'); scws_set_dict($sh, './dict.txt', SCWS_XDICT_TXT); scws_set_rule($sh, './rules.ini');//文件内容为空 $cutword = $_POST['cutword']; scws_send_text($sh, $cutword); $rs = scws_get_tops($sh, 5); 另:我使用工具把默认...

86.RE: 关于词典中的词性标注

发布时间:2009-08-05 06:08 t By akira

...回應的是自己在合併過程中,碰到的情況。 在個別將 dict_chs(t).utf8.xdb 導出,倒入資料庫處理時發現,有重複的字詞,這部份不多: chs 部份 : 禎, 银朱, 集科, 负电, 那霸, 无名肿毒, 燏, 无业, 安徽日报, 威兴我荣, 医疗器械...

87.RE: 搜索问题

更新时间:2012-10-25 13:10 t By hightman

...概有几种办法: 1. 你把词典删除就可以搜索单字了。etc/dict.utf8.xdb ... 2. 或者要强制检索单还可以考虑修改C代码的部分,修改 src/import.h #define DEFAULT_SCWS_MULTI 3 把 3 改为 15 然后重新编译并重建索引就可以了 3...

88.RE: 官方和提供的下载不一样,并且官方实例还写了错误代码

发布时间:2010-07-14 17:07 t By hightman

...针对UTF-8的,而你调用了gbk的词典,把你的词典语句改为 dict.utf8.xdb 即可 3. dict_extra.txt 也必须是UTF-8编码 4. 删除词条,因为陈凯歌其实可能是因为人名关系导致切成词,可能会不受词典影响 5. 如果你非要用gbk 源码中 set_charse...

89.RE: 关于自建字典问题

发布时间:2013-09-02 02:09 t By gwgwgw

备注,我下载的版本是1.22的 现在的版本还能载入文本文件(txt)么 ,我在调试的过程中发现add_dict() 函数载入xdb文件没有问题,但是载入txt文件就报错,望回答。 备注:老版本的如1.17还有下载么

90.RE: 集成包怎么用自定义词库?

发布时间:2011-09-20 15:09 t By hightman

词库在 $prefix/etc/dict.utf8.xdb 您用制作好的 scws 词库支替换它即可,词库生成办法要看看 scws 的帮助,此外字符集必须是 UTF-8

  • 时间不限
  • 按相关性排序