...网上也查了一些资料,貌似没找到什么好的方案 class XSTokenizerUnary implements XSTokenizer { private $length = 1; // 默认切分长度 public function __construct($arg = null){ if ($arg !== null && $arg !== '') $this->length = $arg; } public function getToken...
...词。每个自定义分词功能单独使用一个 文件名,命名为 `XSTokenizerXyz.class.php`,其中 `Xyz` 是您自己的分词名称,文件统一 放入 `$prefix/sdk/php/lib` 目录,分词类名即为 `XSTokenizerXyz`,该类必须实现 [XSTokenizer] 接口。 字段设计 -------...
...,通常以 `XS` 对象的属性方式出现,参见 [XS::search]。 * [XSTokenizer] 自定义字段词法分析器接口。 类对象中的魔术属性 ---------------- 通过 PHP 对象中的 __get 和 __set 技巧,我们针对所有 [XSComponent] 的子类实现了对象的模拟属性。 ...
... 2011-09-16 hightman: PHP-SDK: 添加一些 PHPUnit 测试代码并修正 XSTokenizerSplit 参数解析 bug * 2011-09-16 hightman: PHP-SDK: 调整 XSTokenizer 支持在搜索语句中执行自定义分词 * 2011-09-16 hightman: 修正安装脚本 setup.sh 中 'read -e' 的兼容问题
... php 扩展。从 `1.3.1` 版本起,`Xunsearch` 的 PHP-SDK 中加入 [XSTokenizerScws] 类,可通过搜索服务端执行分词功能。 用法简单说明 ---------- 这儿只做简单介绍和示范,更多详细的用法请点击阅读类参考手册 [XSTokenizerScws]。 #### 创建分...
... // tokenizer if ($this->type !== self::TYPE_ID && $this->tokenizer !== XSTokenizer::DFL) { $str .= "tokenizer = " . $this->tokenizer . "\n"; } // cutlen if ($this->cutlen > 0 && !($this->cutlen === 300 && $this->type === self::TYPE_BODY)) { $str .= "cutlen = " . $this->cut...
...数的参数。 自定义分词器需要在 lib/ 目录下编写名为 XSTokenizerName 的分词类并实现接口 XSTokenizer, 内置支持的分词器有以下几种: - full 表示本字段的值整体作为一个检索词,像各种 *ID* 都适合这种情况 - none 表示本字...