搜索

大约有 278 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.2918秒)

221.RE: [2010] SCWS-1.1.3 发布,支持文本词典实现自定义词库啦!!

更新时间:2010-11-13 10:11 t By snakeyasin

[quote='hightman' pid='3425' dateline='1264745243'] 2010年,scws 长了一岁,加上了翘首以盼的删减词库功能,该功能通过变通的办法解决,并非直接修改核心词库。下面详细介绍一下 scws-1.1.0 的更新日志及用法举例(示例以PHP扩展语言为例)...

222.RE: scws分词不起作用了

发布时间:2012-02-22 18:02 t By vanni

需要指定词典位置,比如: # scws -A -d /hp/opt/scws/dict/default.utf8.xdb:/home/vanni/scws/mydict.txt -c utf8 "相宜本草洗面奶和雅漾舒护活泉水哪个好" 相宜/a 本草/nz 洗面奶/nz 和/c 雅漾/@ 舒护/@ 活泉水/@ 哪个/r 好/a

223.RE: 自定义词库用不了。非常不解啊。。

发布时间:2011-10-23 23:10 t By ci169

[quote='hightman' pid='7092' dateline='1319384262'] 如果你还需要原来的词典,请在 add_dict 前加 set_dict(ini_get('scws.default.fpath').'/dict.utf8.xdb'); [/quote] 是的。这没问题了。是那txt编码问题。不是utf8的话就不行的。 scws我是用utf8。

224.RE: 关于gen-scws-dict 操作方法

发布时间:2011-06-30 13:06 t By hit

[quote='hightman' pid='6577' dateline='1309234009'] 文本词典格式,文档多处有提到吧 每行记录包含以下字段 \t\t\t 工具 用法可以 ./gen-scws-dict -h 查看 [/quote] -h 看过.. 不太明白命令规则..

225.RE: 自定义的 txt 字典 有关问题 求助

发布时间:2010-04-09 15:04 t By lerado

我刚才用统一的词性生成了一个词典,但同一个文件, 生成的大小怎么不同呢, 第一次: 积分 20.0 20.0 @ 中间我是用一个空格格开的,生成后有4M, 第二次: 积分 20.0 20.0 @ 用的是原dict.xdb导出txt后的格式,生成后有10M, ...

226.RE: scws1.1.8为什么第一次都很慢。

发布时间:2011-10-23 23:10 t By hightman

什么方式运行的? 是不是词典的原因啊,用了自定义吗

227.“枪王之王”分词不是很满意!

发布时间:2010-09-10 14:09 t By johnbaby

...没有预期的结果。 还望版主提示一二。怎么在自定义词典中设置”四个词“的语句的分词! 非常感谢!!

228.RE: [2010] SCWS-1.1.3 发布,支持文本词典实现自定义词库啦!!

发布时间:2012-11-06 22:11 t By umland

[quote='snakeyasin' pid='3834' dateline='1289616234'] [quote='hightman' pid='3425' dateline='1264745243'] 2010年,scws 长了一岁,加上了翘首以盼的删减词库功能,该功能通过变通的办法解决,并非直接修改核心词库。下面详细介绍一下 scws-1.1.0 的更新...

229.RE: 对于分词的一些困惑

发布时间:2010-10-13 17:10 t By hightman

...允许和汉字组合,比如“T恤” ”Q币“ 这种。 假设你的词典里有”北海36“,被分的句子是 “北海36度”,那么“北海36”是可以成功切分的。 原因就在于最多允许夹在汉字之间的只有2个字符~~ 这个粗分规则是为了加速...

230.想手动指定一些不进行分词的词语

发布时间:2013-07-23 16:07 t By seagg

...操作,才能使得这个词不被分开 我看到有用户自定义词典 dict_user.txt 我在里面写了: 米兔车贴 1.0 1.0 ! 但还是被分了 还看到一个stopwords.txt的文件,但将米兔车贴放到里面了也还是会被分 。。。

  • 时间不限
  • 按相关性排序