搜索

大约有 29 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0057秒)

11.RE: “枪王之王”分词不是很满意!

发布时间:2010-09-13 01:09 t By hightman

枪王你的作法是对的,“王之王”是自动识别人名的原因。 山楂树之恋,想分成”山楂树“+”树之恋“目前是没有办法做到了~毕竟复合分也没办法把一个字拆到2个词里。

12.scws-1.1.6 发布

更新时间:2011-04-20 15:04 t By hightman

...母单词之间时视为同一词而不再强行切开,此时如果激活复合分词的 DUALITY 选项,则仍能将符号切开作为复合词。 4.修正浮点数的识别规则,避免将IPv4地址识别为2个小数的尴尬,比如 192.168.1.1 以前会被切成 192.168 和1.1 2个数字...

13.XSIndex.scwsMulti

scwsMulti 属性 (自版本 v1.4.7 起可用) public int getScwsMulti()public XSIndex setScwsMulti(int $level) 获取当前索引库的分词复合等级

14.RE: 中英混合问题

发布时间:2012-10-22 10:10 t By hightman

这是开启了复合分词的效果。

15.RE: 自定义词库如何使用?

发布时间:2013-05-13 15:05 t By hightman

这个是内置的一个复合分词功能。你要关闭这个功能可以在搜索时: $xs->search->setScwsMulti(0);

16.RE: scws与多线程

发布时间:2010-12-08 14:12 t By hightman

...是共用的(主要用于保存切词中那些是否忽略符号,是否复合分词等的设置)

17.RE: XSTokenizerScws的一个使用问题

发布时间:2013-01-30 14:01 t By hightman

...,只是因为二元结合法所以scws自动将其合成为一个词。 复合分词是对原本是词的长词情况处理的,比如”中国“可以切成”中“+”国“+”中国“ 你的问题必须是 [code] $tk = $tokenizer->setDuality(false)->setIgnore(true)->setMulti(11)->getR...

18.最新的主要变动

...:USERCASE - 改进自定义分词器 XSTokenizerScws 接受参数作为复合等级 - 升级 libevent 到 2.x 版 - 修正中文 stopwords 不生效的问题 - 取消恼人的 NODB(S#506) 错误提示 - 新增获取文档匹配词表的接口 [XSSearch::setRequireMatchedTerm] 版本 1.4.7 (2013-7...

19.RE: XSTokenizerScws的一个使用问题

发布时间:2013-02-02 13:02 t By tisswb

...,只是因为二元结合法所以scws自动将其合成为一个词。 复合分词是对原本是词的长词情况处理的,比如”中国“可以切成”中“+”国“+”中国“ 你的问题必须是 [code] $tk = $tokenizer->setDuality(false)->setIgnore(true)->setMulti(11)-...

20.XSTokenizerScws

...nore() 设置忽略标点符号 XSTokenizerScws setMulti() 设置复合分词选项 XSTokenizerScws 方法明细 __construct() 方法 public void __construct(string $arg=NULL) $arg string 复合等级参数,默认不指定 源码: sdk/php/lib/XSTokenizer.clas...

123
  • 时间不限
  • 按相关性排序