搜索

大约有 76 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0984秒)

41.RE: 请教为什么我这个无法分割成功啊?

发布时间:2011-07-06 23:07 t By hightman

词典没配好吧 有没有在 ini_get('scws.default.fpath') 下面放置词典和规则集文件呢?

42.RE: 添加自定义词库的问题

发布时间:2011-06-11 12:06 t By hightman

...会加载默认词库了。这并不算BUG吧。 这是给懒人设定的规则,当你试图设置词典时那就完全交给你决定,而不是系统强制无论如何都先加载默认词典。

43.RE: 请问一下,xdb与txt词库那个读取效率更高

发布时间:2013-06-29 22:06 t By hightman

后者是什么意思,举例说明一下吧。SCWS处理英文是按普通单词和数字的规则来做

44.对于分词的一些困惑

更新时间:2010-10-13 17:10 t By 逆雪寒

...么就不行呢。[hr] 经过测试,还发现。 不加载任何字典和规则。 数字是照样能给分词出来的。。似乎默认就把一窜数字就是一个词 这样来分[hr] 那如果是这样就麻烦了。。怎么能解决 中文+数字 结合的词呢?

45.INI 配置文件工具

...以直接查看、 可以直接修改。但其中还是有一些约定的规则和限制,为了更方便用户,我们打算提供 这样的工具辅助用户创建、修改配置文件。 INI 在线编辑工具 (WEB 版) ----------------------- 为方便新手初次接触 `xunsearch` 时的...

46.RE: 关于gen-scws-dict 操作方法

发布时间:2011-06-30 13:06 t By hit

[quote='hightman' pid='6577' dateline='1309234009'] 文本词典格式,文档多处有提到吧 每行记录包含以下字段 \t\t\t 工具 用法可以 ./gen-scws-dict -h 查看 [/quote] -h 看过.. 不太明白命令规则..

47.刚翻译了一下这个倒java上

更新时间:2011-02-22 10:02 t By mudie

... 1.词性参与权重计算导致的问题挺多,这点是不是考虑规则权重调整一下? 2.可能是考虑性能问题,采取的局部寻优的办法也导致了一些问题,是不是考虑全局寻优,或者长一些范围内寻优?

48.RE: 中文分组粗分方法

发布时间:2010-05-26 14:05 t By hightman

...体进行计算权重,看哪个情况最优。 此外还有根据rules规则匹配。 简单举个例子: “开放下载” 1. 开/放下/载 2. 开放/下载 根据词典中的tdf进行一个运算得出概率而采取最高的那种

49.RE: SCWS - 比如我要加入关键词 65Mn这种专业词怎么做

发布时间:2012-08-20 20:08 t By jason

[specials] 里面配置吗 我加了P++ 可以 搞成“65Mn”就不行 还是要单独设置个规则吗? 谢谢 hightman 同学

50.RE: 我想过滤由‘人’‘得’‘到’‘直’ 这几个字组成的关键字

发布时间:2010-05-31 16:05 t By hightman

哦,那没有这样的功能,也提取不出这样的规则。建议在自己提取返回词时作判断和过滤吧。

  • 时间不限
  • 按相关性排序