...'; $words = $tokenizer->getResult($text); print_r($words); ~~~ ### 提取重要词汇 调用 [XSToenizerScws::getTops] 可以简单提取重要词汇,它支持三个参数, 返回的词汇数组元素和分词结果类似,只是把 *off* 替换为 *times* 表示这个词在文本中出现...
... $res = self::$_server->getRespond(); } return $words;} 获取重要词统计结果
... getTokens() XSTokenizer 接口 XSTokenizerScws getTops() 获取重要词统计结果 XSTokenizerScws getVersion() 获取 scws 版本号 XSTokenizerScws hasWord() 判断是否包含指定词性的词 XSTokenizerScws setCharset() 设置字符集 XSTokenizerScws ...
...种不同的表达方式。因此,**同义词** 是全文检索中非常重要和必要的一项基础功能。从 `1.3.0` 版本起,`Xunsearch` 开始提供同义搜索搜索功能。 什么是同义词搜索 --------------- 为了更好的提升用户搜索体验,我们希望用户在搜...
...------- - 项目配置是一个 `Xunsearch` 项目的核心灵魂,非常重要,通常保存为 .ini 文件 - 以分号开头的行表示注释,空行直接被忽略不起任何作用 - 中括号包围的每个分区均为字段配置,字段个数根据项目的实际需求设定 - 每个项...
...句的分词复合等级 复合等级是 scws 分词粒度控制的一个重要参数, 是长词细分处理依据, 默认为 3, 值范围 0~15 注意: 这个设置仅直对本次搜索有效, 仅对设置之后的 setQuery 起作用, 由于 query 设计的方式问题, 目前无法支持搜索语...
...库的分词复合等级 复合等级是 scws 分词粒度控制的一个重要参数, 是长词细分处理依据, 默认为 3, 值范围 0~15 注意: 这个设置仅直对当前索引库有效, 多次调用设置值被覆盖仅最后那次设置有效, 而且仅对设置之后提交的索引数据...