...#### 创建分词对象 ~~~ [php] $xs = new XS(...); // 必须先创建一个 xs 实例,否则会抛出异常 $tokenizer = new XSTokenizerScws; // 直接创建实例 ~~~ ### 获取分词结果 调用 [XSTokenizerScws::getResult] 对参数指定的文本字符串执行分词, 并返回词汇...
...的默认字符集。 * _--import=_ 导入搜索日志文件,每行一个词,每行的数据中可以用\\t(Tab键)分开指定次数,没有次数默认为1。 * _--put=_ 添加、更新搜索日志词汇,词与次数之间用半角冒号分隔,默认为 1 次。 多个词之间...
...置文件详解 基础说明 ------- - 项目配置是一个 `Xunsearch` 项目的核心灵魂,非常重要,通常保存为 .ini 文件 - 以分号开头的行表示注释,空行直接被忽略不起任何作用 - 中括号包围的每个分区均为字段配置,字段个数...
...设置各种检索功能的返回数量最大上限,默认值均为 10 个。 对于普通搜索模式,还支持用 _--limit=offset,num_ 来同时指定偏移量和上限。 * _-d|--db _ 指定要搜索的数据库名称,默认是名为 db 的库, 多个库之间用逗号分隔。...
...定义词库。 全局自定义词库 ------------- 这是针对同一个 `xunsearch` 安装实例来讲,该服务端下的所有项目都将共用这个自定义词库。 严格来讲,这是 SCWS 本身就提供的功能,xunsearch 只是做了整合和规范。涉及的相关文件如下 ...
同义词搜索 人类语言文化丰富,同一个意思有无数种不同的表达方式。因此,**同义词** 是全文检索中非常重要和必要的一项基础功能。从 `1.3.0` 版本起,`Xunsearch` 开始提供同义搜索搜索功能。 什么是同义词搜索 ------...
...附加提供了一些简单常见的分词规则, 但考虑到用户的个性需求,特意提供了自定义分词器的功能。 > note: 自定义分词器存在一个缺陷,它不支持存储位置信息,也就是不能按短语检索、以及 `NEAR` 之类的 > 语法检索。相当于...
...arch::setFacets] 方法来指定需要分面的字段, 该方法接受两个参数,第一参数为要分面的字段名称(多个字段请用数组作参数), 第二参数是可选的布尔类型,true 表示需要准确统计,默认 false 则为估算。 执行搜索之后再调用 [X...
...此基础上开发您自己的全文检索。 在此简要介绍以下几个文件: - lib/XS.php 入口文件,所有搜索功能必须包含此文件 - lib/XS.class.php 未合并带注释的入口文件,会自动加载其它 .class.php 文件 - util/RequireCheck...
...打算搜索的短语或关键词列出来即可,建议用空格连接多个词;在此基础上还支持字段搜索、 布尔搜索、精确搜索、相邻位置搜索等。 典型搜索语句 ----------- 正如上面所讲,仅仅用空格把搜索词、名子连接起来的方式最为常...