setDict() 方法 public XSTokenizerScws setDict(string $fpath, int $mode=NULL) $fpath string 服务端的词典路径 $mode int 词典类型, 常量: SCWS_XDICT_XDB|SCWS_XDICT_TXT|SCWS_XDICT_MEM {return} XSTokenizerScws 返回对象本身以支持串接操作 源...
...off:词在文本中的位置,attr:词性,word:词] 源码: sdk/php/lib/XSTokenizer.class.php#L339 (显示) public function getResult($text){ $words = array(); $text = $this->applySetting($text); $cmd = new XSCommand(XS_CMD_SEARCH_SCWS_GET, XS_CMD_SCWS_GET_RESULT, 0, $text); $res = s...
addDict() 方法 public XSTokenizerScws addDict(string $fpath, int $mode=NULL) $fpath string 服务端的词典路径 $mode int 词典类型, 常量: SCWS_XDICT_XDB|SCWS_XDICT_TXT|SCWS_XDICT_MEM {return} XSTokenizerScws 返回对象本身以支持串接操作 源...
...词。每个自定义分词功能单独使用一个 文件名,命名为 `XSTokenizerXyz.class.php`,其中 `Xyz` 是您自己的分词名称,文件统一 放入 `$prefix/sdk/php/lib` 目录,分词类名即为 `XSTokenizerXyz`,该类必须实现 [XSTokenizer] 接口。 字段设计 -------...
...单位。 最后贴出我的代码给有需要的人: [php] class XSTokenizerUnary implements XSTokenizer { private $length = 1; // 默认切分长度 public function __construct($arg = null){ if ($arg !== null && $arg !== '') $this->length = $arg; } public function getTok...
...汇是包含 [times:次数,attr:词性,word:词] 源码: sdk/php/lib/XSTokenizer.class.php#L361 (显示) public function getTops($text, $limit = 10, $xattr = ''){ $words = array(); $text = $this->applySetting($text); $cmd = new XSCommand(XS_CMD_SEARCH_SCWS_GET, XS_CMD_SCWS_GET_TOPS, $l...
...网上也查了一些资料,貌似没找到什么好的方案 class XSTokenizerUnary implements XSTokenizer { private $length = 1; // 默认切分长度 public function __construct($arg = null){ if ($arg !== null && $arg !== '') $this->length = $arg; } public function getToken...
...,通常以 `XS` 对象的属性方式出现,参见 [XS::search]。 * [XSTokenizer] 自定义字段词法分析器接口。 类对象中的魔术属性 ---------------- 通过 PHP 对象中的 __get 和 __set 技巧,我们针对所有 [XSComponent] 的子类实现了对象的模拟属性。 ...
... // tokenizer if ($this->type !== self::TYPE_ID && $this->tokenizer !== XSTokenizer::DFL) { $str .= "tokenizer = " . $this->tokenizer . "\n"; } // cutlen if ($this->cutlen > 0 && !($this->cutlen === 300 && $this->type === self::TYPE_BODY)) { $str .= "cutlen = " . $this->cut...