搜索

大约有 70 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.2914秒)

41.关于扩展词库的问题

发布时间:2012-12-10 15:12 t By timeage

...分词选项] 最短词 二元 重要单字 全部单字 加入定义词库后结果为: 阿斯顿 阿斯 斯顿 阿 斯 顿 发 斯蒂芬 斯蒂 蒂芬 斯 蒂 芬 [b]罗铭 罗 铭 罗[/b] 大大 大 大 罗 我的定义词典为: 铭罗 1 0 n 罗铭 1 0 n 我...

42.RE: 定义词库用不了。非常不解啊。。

发布时间:2011-10-23 23:10 t By ci169

[quote='hightman' pid='7092' dateline='1319384262'] 如果你还需要原来的词典,请在 add_dict 前加 set_dict(ini_get('scws.default.fpath').'/dict.utf8.xdb'); [/quote] 是的。这没问题了。是那txt编码问题。不是utf8的话就不行的。 scws我是用utf8。

43.RE: 定义的 txt 字典 有关问题 求助

发布时间:2010-04-09 15:04 t By lerado

我刚才用统一的词性生成了一个词典,但同一个文件, 生成的大小怎么不同呢, 第一次: 积分 20.0 20.0 @ 中间我是用一个空格格开的,生成后有4M, 第二次: 积分 20.0 20.0 @ 用的是原dict.xdb导出txt后的格式,生成后有10M, ...

44.RE: 定义的 txt 字典 有关问题 求助

发布时间:2010-04-09 15:04 t By hightman

那个属性对分词效果有一定影响的,TF主要用于词的切分,IDF用于统计,词性就用在取TOP时过滤或标注上。 最好是基于现有的词典去补充,你重建一个的话数据又都没有效果可能会比较差。SCWS主页上有一个TF/IDF计算器,你可...

45.1.1.2的 定义字典无法使用

更新时间:2010-05-23 01:05 t By 逆雪寒

... centos5 scws 1.1.2 php 以扩展形式安装 . 如果我不显式的定义 $so->add_dict(ini_get("scws.default.fpath") . '/dict.utf8.xdb'); $so->set_rule(ini_get('scws.default.fpath') . '/rules.utf8.ini'); 那么就分词正常. 这个是第一个问题. 第二个问题就是,定...

46.RE: 建议search.log把dict_user.txt的定义词也加入

发布时间:2012-05-14 11:05 t By hightman

search.log 的生成是有一些规则判断和调整的,并不是如你所说的。定义词典也会纳入考虑,但过于复杂的搜索语句是不会记录的。

47.RE: [2012] SCWS-1.2.0 发布,BSD协议、支持定义词库、PHP5.4

更新时间:2012-03-31 11:03 t By hightman

txt词库其实也是转换成XDB再调用的,不用担心性能。 你合并词典很简单啊,把 dict.utf8.xdb 导出来嘛

48.RE: [HELP]xunsearch安装好了,搜索没有结果集。。。

发布时间:2011-10-27 16:10 t By hightman

...提供scws的api接口,实现短语分词功能 2.是否可以对scws定义中文词典,方便扩展 [/quote] 目前没有直接支持定义词典,而是直接读取 dict.utf8.xdb 你己改词也必须转换成这个词典文件才能用。 词典转换关于SCWS的网站上有。

49.RE: [2012] SCWS-1.2.0 发布,BSD协议、支持定义词库、PHP5.4

发布时间:2012-04-01 14:04 t By gnhao

[quote='hightman' pid='8876' dateline='1333164684'] txt词库其实也是转换成XDB再调用的,不用担心性能。 你合并词典很简单啊,把 dict.utf8.xdb 导出来嘛 [/quote] 谢谢hm。还是更加期望加上直接入字典库的功能。这样更加方便,就是不知...

50.“枪王之王”分词不是很满意!

发布时间:2010-09-10 14:09 t By johnbaby

...王“作为关键字。而我己的系统是不查询单字的。在定义字典中又不知如何操作。毕竟感觉三个字的词在定义字典中起了作用。而四个字的却没有预期的结果。 还望版主提示一二。怎么在定义词典中设置”四个词“...

  • 时间不限
  • 按相关性排序