自定义分词器 `Xunsearch` 默认内置了功能强大的 [SCWS][1] 分词系统,也附加提供了一些简单常见的分词规则, 但考虑到用户的个性需求,特意提供了自定义分词器的功能。 > note: 自定义分词器存在一个缺陷,它不支持存...
自定义 SCWS 词库 如之前所说,我们所有的索引分词器默认为 scws,这也是我们开发的开源分词系统, 内置的词库基本上能满足绝大多数应用。但总有例外,这也就是即将说的如何自定义词库。 全局自定义词库 -----...
...词接口 [XSTokenizer] 是搜索字段的分词接口定义,整个接口只要求实现一个方法 [XSTokenizer::getTokens], 自定义分词器用于 INI 配置文件中的 `tokenizer` 选项。 关于自定义分词器的详细用法剖析请阅读后面的[专题](ini.t...
...的项目配置 ini 文件统一放入 `$prefix/sdk/php/app` 目录。 自定义或扩展的类库请统一放入 `$prefix/sdk/php/lib` 以便 `XS` 进行 `autoload`。 保留字 ----- 所有 `Xunsearch PHP-SDK` 的系统类库定义时均以 `XS` 开头,为避免冲突,请自行编写 代码...
...创建,字段名建议和您的实际数据库字段一致。 1. ### 定义字段 每个字段用一个区段配置来表示,中括号内的名字即为字段名。每个项目包含若干个字段, 具体由项目搜索需求决定,并不需要一味的与实际源数据库 (如 ...
...进优化代码兼容性 - 增加用户案例文档:USERCASE - 改进自定义分词器 XSTokenizerScws 接受参数作为复合等级 - 升级 libevent 到 2.x 版 - 修正中文 stopwords 不生效的问题 - 取消恼人的 NODB(S#506) 错误提示 - 新增获取文档匹配词表的接口 [XSS...
...切换。 访问网址: > note: 在线编辑器暂时不支持指定自定义分词器和分词器参数,这个部分需要用户自行手动修改。 $Id$
...endor/hightman/xunsearch/app // 如有必要,请通过常量 XS_APP_ROOT 定义 define ('XS_APP_ROOT', '/path/to/ini') // 创建 XS 对象,关于项目配置文件请参见官网 $xs = new \XS('demo'); // 后面的代码就和官网上的指南一致了 ``` ### Yii-1.x 用法 这是对 xunse...