... XSTokenizer 自定义字段词法分析器接口 XSTokenizerFull 内置整值分词器 XSTokenizerNone 内置空分词器 XSTokenizerScws SCWS - 分词器(与搜索服务端通讯) XSTokenizerSplit 内置的分割分词器 XSTokenizerXlen 内置的定长分词器 ...
tokenizer 分词器 默认为 default 采用内置的功能强大的 scws 分词,适合绝大多数字符串字段。也可以指定自定义分词器,格式为 name 或 name(arg) 两种形式,其中 name 是分词器名称,arg 则是传递给分词器构造函数的参数。自定义分词...
自定义分词器 `Xunsearch` 默认内置了功能强大的 [SCWS][1] 分词系统,也附加提供了一些简单常见的分词规则, 但考虑到用户的个性需求,特意提供了自定义分词器的功能。 > note: 自定义分词器存在一个缺陷,它不支持存...
...ex = none ~~~ #### tokenizer 分词器 默认为 default 采用内置的功能强大的 scws 分词,适合绝大多数字符串字段。也可以指定自定义分词器, 格式为 name 或 name(arg) 两种形式,其中 name 是分词器名称,arg 则是传递给分词器构...
...r 版本 1.0.0 源代码 sdk/php/lib/XSTokenizer.class.php 内置空分词器 Public 方法 隐去继承来的方法 名称描述定义于 getTokens() XSTokenizerNone 方法明细 getTokens() 方法 public void getTokens($value, $doc=NULL) ...
...r 版本 1.0.0 源代码 sdk/php/lib/XSTokenizer.class.php 内置整值分词器 Public 方法 隐去继承来的方法 名称描述定义于 getTokens() XSTokenizerFull 方法明细 getTokens() 方法 public void getTokens($value, $doc=NUL...
...izer::DFL);} 判断当前字段的索引是否为布尔型 目前只有内置分词器支持语法型索引, 自 1.0.1 版本起把非索引字段也视为布尔便于判断
...引分词器默认为 scws,这也是我们开发的开源分词系统, 内置的词库基本上能满足绝大多数应用。但总有例外,这也就是即将说的如何自定义词库。 全局自定义词库 ------------- 这是针对同一个 `xunsearch` 安装实例来讲,该服务...
...r 版本 1.0.0 源代码 sdk/php/lib/XSTokenizer.class.php 内置的分割分词器 Public 方法 隐去继承来的方法 名称描述定义于 __construct() XSTokenizerSplit getTokens() XSTokenizerSplit 方法明细 __construct() 方...
...r 版本 1.0.0 源代码 sdk/php/lib/XSTokenizer.class.php 内置的定长分词器 Public 方法 隐去继承来的方法 名称描述定义于 __construct() XSTokenizerXlen getTokens() XSTokenizerXlen 方法明细 __construct() 方法 ...