void scws_set_multi(scws_t s, int mode); 描述:设定分词执行时是否执行针对长词复合切分。(例如:中国人->中国+人+中国人)。参数 mode 表示复合分词法的级别,取值为 1 ~ 15。mode 设定值,1~15。[b]按位与[/b]的 1|2|4|8 依次表示 短词|二...
setMulti() 方法 public XSTokenizerScws setMulti(int $mode=3) $mode int 复合选项, 值范围 0~15 默认为值为 3, 可使用常量组合: SCWS_MULTI_SHORT|SCWS_MULTI_DUALITY|SCWS_MULTI_ZMAIN|SCWS_MULTI_ZALL {return} XSTokenizerScws 返回对象本身以支持串接操...
setDict() 方法 public XSTokenizerScws setDict(string $fpath, int $mode=NULL) $fpath string 服务端的词典路径 $mode int 词典类型, 常量: SCWS_XDICT_XDB|SCWS_XDICT_TXT|SCWS_XDICT_MEM {return} XSTokenizerScws 返回对象本身以支持串接操作 源...
addDict() 方法 public XSTokenizerScws addDict(string $fpath, int $mode=NULL) $fpath string 服务端的词典路径 $mode int 词典类型, 常量: SCWS_XDICT_XDB|SCWS_XDICT_TXT|SCWS_XDICT_MEM {return} XSTokenizerScws 返回对象本身以支持串接操作 源...
这个不能随便改,但可以通过调整源码的编译参数来改。通常不需要这么做啊,实在有必要时你们可以考虑继承XSTokenizerScws 来自己修改它。
[quote='hightman' pid='3251' dateline='1359526251'] 这个不能随便改,但可以通过调整源码的编译参数来改。通常不需要这么做啊,实在有必要时你们可以考虑继承XSTokenizerScws 来自己修改它。 [/quote] 感谢,我就是这么干的~
[quote='hightman' pid='562' dateline='1330199583'] 不会的啊,默认就是-M3呀 [/quote] 如何设置成其他的值呀 最近的一个项目需要全部的单字 在项目的ini里,tokenizer = default 如果是3的话 不知到如何改成11 是否是使用xlen(1) 来设置?这个xl...
Hi Hightman, 您好! 非常感谢您做的scws分词和xunsearch系统, 最近我们在做网站的搜寻服务, 考察了coreseek, sphinx-for-chinese 和 xunsearch 这三个系统, 觉得还是 xunsearch 比较适合, 因为词典制作和查询的方式都较另外二者灵活. 在今天做...