...确使用开源协议 New BSD License 发布新版本 2) 深度优化复合分词中的 SCWS_MULTISHORT 选项,更为合理有效,符合全文检索的需求 3) 测试脚本自动加载当前目录下的 dict_user.txt 文本词典 4) 修正 scws.c 中 __PARSE_XATTR__ 宏的 BUG 导...
...cws_t s, int mode); 描述:设定分词执行时是否执行针对长词复合切分。(例如:中国人->中国+人+中国人)。参数 mode 表示复合分词法的级别,取值为 1 ~ 15。mode 设定值,1~15。[b]按位与[/b]的 1|2|4|8 依次表示 短词|二元|主要单字|全...
...:USERCASE - 改进自定义分词器 XSTokenizerScws 接受参数作为复合等级 - 升级 libevent 到 2.x 版 - 修正中文 stopwords 不生效的问题 - 取消恼人的 NODB(S#506) 错误提示 - 新增获取文档匹配词表的接口 [XSSearch::setRequireMatchedTerm] 版本 1.4.7 (2013-7...
...如 ABCDEF => AB + ABCD + ABCDEF - scws([3]) 表示采用指定参数为复合等级的 scws 分词,(若无特殊复合需求,无需指定) ~~~ tokenizer = default ~~~ > note: 小括号内的值表示参数,中括号表示省略后的默认值,实际编写请勿照抄中...
...都较另外二者灵活. 在今天做测试时, 有遇到一个关于复合分词问题, 类似于"官方網站"这样的词汇, 默认配置下是作为单一词划出, 于是搜索"網站"时不可见. 如果设定-M 为 3 (0011) 可以解决这个问题, 但是在xunsearch中未找到此选...
...;[/b][/color] [b]描述:[/b]设定分词执行时是否执行针对长词复合切分。(例如:中国人->中国+人+中国人)。 参数 mode 表示复合分词法的级别,取值由下面几个常量异或组合: SCWS_MULTI_SHORT | SCWS_MULTI_DUALITY | SCWS_MULTI_ZMAIN | SCWS_MULTI_ZA...
...方法 public void __construct(string $arg=NULL) $arg string 复合等级参数,默认不指定 源码: sdk/php/lib/XSTokenizer.class.php#L188 (显示) public function __construct($arg = null){ if (self::$_server === null) { $xs = XS::getLastXS(); if ($xs === nu...
...nore() 设置忽略标点符号 XSTokenizerScws setMulti() 设置复合分词选项 XSTokenizerScws 方法明细 __construct() 方法 public void __construct(string $arg=NULL) $arg string 复合等级参数,默认不指定 源码: sdk/php/lib/XSTokenizer.clas...
...:USERCASE 3. 改进自定义分词器 XSTokenizerScws 接受参数作为复合等级 4. 升级 libevent 到 2.x 版 5. 修正中文 stopwords 不生效的问题 6. 取消恼人的 NODB(S#506) 错误提示 7. 新增获取文档匹配词表的接口 XSSearch::setRequireMatchedTerm 官方网...
...应指令 XSServer scwsMulti int 获取当前索引库的分词复合等级 XSIndex socket mixed 获取连接资源描述符 XSServer xs XS 服务端关联的 XS 对象 XSServer Protected 属性 隐去继承来的属性 名称类型描述定义于...