搜索

大约有 9 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0071秒)

1.定义词典产生的故障

更新时间:2012-04-29 20:04 t By yunxiaoad2

定义了dict_user.txt 出现奇怪现象,所有词性都变成了string(3),而且还出现了乱码: array(3) { ["off"]=> int(0) ["attr"]=> string(3) "@�" ["word"]=> string(15) "重庆鸡公煲" } array(3) { ["off"]=> int(0) ["attr"]=> string(3) "ns�" ["word"]=> string(6) "重庆" ...

2.英文可以定义词性吗?

发布时间:2013-08-30 05:08 t By mynoname

通常英文是不需要分词的,但很多时候词性是需要的,比如nike,dior这类品牌英文。 目前默认词性都是en,有什么办法可否定义词典来改变他的词性。 还有个问题,就是纯数字的词性为什么是en呢,不是m? 望赐教。

3.RE: 定义的 txt 字典 有关问题 求助

发布时间:2010-04-09 15:04 t By lerado

我刚才用统一的词性生成了一个词典,但同一个文件, 生成的大小怎么不同呢, 第一次: 积分 20.0 20.0 @ 中间我是用一个空格格开的,生成后有4M, 第二次: 积分 20.0 20.0 @ 用的是原dict.xdb导出txt后的格式,生成后有10M, ...

4.RE: 定义的 txt 字典 有关问题 求助

发布时间:2010-04-09 15:04 t By hightman

那个属性对分词效果有一定影响的,TF主要用于词的切分,IDF用于统计,词性就用在取TOP时过滤或标注上。 最好是基于现有的词典去补充,你重建一个的话数据又都没有效果可能会比较差。SCWS主页上有一个TF/IDF计算器,你可...

5.RE: [2010] SCWS-1.1.3 发布,支持文本词典实现定义词库啦!!

更新时间:2010-11-13 10:11 t By snakeyasin

...才行。 -- [color]新功能用法示例[/color] (php为例) -- 1. 定义词库,含新增核心库不存在的词汇及删除核心库存在词汇的功能 1) 创建相应字符集的词库文件 dict_extra.txt 2) TF/IDF 参考值查询,为方便大家我作了一个工具...

6.RE: [2010] SCWS-1.1.3 发布,支持文本词典实现定义词库啦!!

发布时间:2012-11-06 22:11 t By umland

...才行。 -- [color]新功能用法示例[/color] (php为例) -- 1. 定义词库,含新增核心库不存在的词汇及删除核心库存在词汇的功能 1) 创建相应字符集的词库文件 dict_extra.txt 2) TF/IDF 参考值查询,为方便大家我作了一个工具...

7.“有空间”的分词有问题和扩充词典

更新时间:2013-05-18 14:05 t By lyjkensou

...但实际结果是“有空 间” 即使通过scws_add_dict()添加了定义的txt字典(里面只包含“空间 11.82 12.38”一行),仍然分不出“空间”这个词。 还有如何设置才能识别出网址和邮箱等格式? 另外关于scws-gen-dict,按照github上的...

8.RE: 搜索的log

发布时间:2012-04-05 10:04 t By hightman

...现在新版 1.3.1 提供了 scws 接口,只要把这些黑词加到定义词典,并取一个独特的词性,那么就可以用 XSTokenizerScws::hasWord() 的功能来判断是否包含黑词?

9.[2013] SCWS-1.2.2 发布,BSD协议、支持定义词库、PHP5.4

更新时间:2013-07-11 21:07 t By hightman

...才行。 -- [color]新功能用法示例[/color] (php为例) -- 1. 定义词库,含新增核心库不存在的词汇及删除核心库存在词汇的功能 1) 创建相应字符集的词库文件 dict_extra.txt 2) TF/IDF 参考值查询,为方便大家我作了一个工具...

  • 时间不限
  • 按相关性排序