XSTokenizer 分词接口 [XSTokenizer] 是搜索字段的分词接口定义,整个接口只要求实现一个方法 [XSTokenizer::getTokens], 自定义分词器用于 INI 配置文件中的 `tokenizer` 选项。 关于自定义分词器的详细用法剖析请阅读后面...
... 编写自定义分词器 -------------- 自定义分词器必须实现 [XSTokenizer] 接口。假定您要编写一个名为 `xyz` 的分词器,则您要编写的代码 文件为 `XSTokenizerXyz.class.php`,请将文件统一放入 `$prefix/sdk/php/lib` 目录。 通常来讲,您只需要...
...词。每个自定义分词功能单独使用一个 文件名,命名为 `XSTokenizerXyz.class.php`,其中 `Xyz` 是您自己的分词名称,文件统一 放入 `$prefix/sdk/php/lib` 目录,分词类名即为 `XSTokenizerXyz`,该类必须实现 [XSTokenizer] 接口。 字段设计 -------...
...,通常以 `XS` 对象的属性方式出现,参见 [XS::search]。 * [XSTokenizer] 自定义字段词法分析器接口。 类对象中的魔术属性 ---------------- 通过 PHP 对象中的 __get 和 __set 技巧,我们针对所有 [XSComponent] 的子类实现了对象的模拟属性。 ...
... php 扩展。从 `1.3.1` 版本起,`Xunsearch` 的 PHP-SDK 中加入 [XSTokenizerScws] 类,可通过搜索服务端执行分词功能。 用法简单说明 ---------- 这儿只做简单介绍和示范,更多详细的用法请点击阅读类参考手册 [XSTokenizerScws]。 #### 创建分...
...数的参数。 自定义分词器需要在 lib/ 目录下编写名为 XSTokenizerName 的分词类并实现接口 XSTokenizer, 内置支持的分词器有以下几种: - full 表示本字段的值整体作为一个检索词,像各种 *ID* 都适合这种情况 - none 表示本字...