...引分词器默认为 scws,这也是我们开发的开源分词系统, 内置的词库基本上能满足绝大多数应用。但总有例外,这也就是即将说的如何自定义词库。 全局自定义词库 ------------- 这是针对同一个 `xunsearch` 安装实例来讲,该服务...
...们必须对它进行索引,而它也不需要分词,所以分词器用内置的 `full`。 - `tid` 内容也是数字的主题ID,我们暂不考虑按主题搜索,所以不需要索引,也没有排序等要求,所以 只要当作普通字段存储下来即可。 - `first` 用 1/0 不...
为了便于用户在安装完 `Xunsearch` 后可以通过服务端内置的 scws[1] 实现分词, 而不需要另外再安装 scws 的 php 扩展。从 `1.3.1` 版本起,`Xunsearch` 的 PHP-SDK 中加入 [XSTokenizerScws] 类,可通过搜索服务端执行分词功能。 用法简...
自定义分词器 `Xunsearch` 默认内置了功能强大的 [SCWS][1] 分词系统,也附加提供了一些简单常见的分词规则, 但考虑到用户的个性需求,特意提供了自定义分词器的功能。 > note: 自定义分词器存在一个缺陷,它不支持存...
...节省大量宝贵时间。 运行脚本工具的 --help 选项可查看内置的帮助和说明,输出文字编码强制为 UTF-8。 ~~~ $prefix/sdk/php/util/SearchSkel.php --help ~~~ 主要参数和选项 ------------- 要使用本工具,必须先指定的项目名称或配置文件,它...
...ex = none ~~~ #### tokenizer 分词器 默认为 default 采用内置的功能强大的 scws 分词,适合绝大多数字符串字段。也可以指定自定义分词器, 格式为 name 或 name(arg) 两种形式,其中 name 是分词器名称,arg 则是传递给分词器构...
...前期测试比较和纠错。 运行脚本工具的 --help 选项可查看内置的帮助和说明,如乱码可在选项后加入 -c gbk 试试。 ~~~ $prefix/sdk/php/util/Quest.php --help ~~~ 主要参数和选项 ------------- 和索引工具类似,使用前必须先指定的项目名称...
...可借助本工具处理。 运行脚本工具的 --help 选项可查看内置的帮助和说明,如乱码可在选项后加入 -c gbk 试试。 ~~~ $prefix/sdk/php/util/Logger.php --help ~~~ 主要参数和选项 ------------- 要使用日志工具,必须先指定的项目名称或配置...
...emo $search = $xs->search; // 获取 搜索对象 ~~~ > info: 搜索对象内置了字符集智能转换,如果您使用的字符集和项目默认的字符集 [XS::defaultCharset] > 不一致,请调用 [XSSearch::setCharset] 在开始其它搜索前设置正确的字符集。 典型搜索做...
...可以自定义数据源。 运行脚本工具的 --help 选项可查看内置的帮助和说明,如乱码可在选项后加入 -c gbk 试试。 ~~~ $prefix/sdk/php/util/Indexer.php --help ~~~ 主要参数和选项 ------------- 要使用索引工具,必须先指定的项目名称或配置...