搜索

大约有 10 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0063秒)

1.自定义分词

自定义分词 `Xunsearch` 默认内置了功能强大的 [SCWS][1] 分词系统,也附加提供了一些简单常见的分词规则, 但考虑到用户的个性需求,特意提供了自定义分词的功能。 > note: 自定义分词存在一个缺陷,它不支持存...

2.XSTokenizer 分词接口

XSTokenizer 分词接口 [XSTokenizer] 是搜索字段的分词接口定义,整个接口只要求实现一个方法 [XSTokenizer::getTokens], 自定义分词用于 INI 配置文件中的 `tokenizer` 选项。 关于自定义分词的详细用法剖析请阅读后面...

3.项目配置文件详解

..., 请将关联记录转换为搜索项目的新字段并设置对应的分词规则。字段设计很重要, 请仔细根据需求创建,字段名建议和您的实际数据库字段一致。 1. ### 定义字段 每个字段用一个区段配置来表示,中括号内的名字即为字...

4.INI 配置文件工具

...。 访问网址: > note: 在线编辑暂时不支持指定自定义分词分词参数,这个部分需要用户自行手动修改。 $Id$

5.在 Xunsearch 使用 SCWS

...在安装完 `Xunsearch` 后可以通过服务端内置的 scws[1] 实现分词, 而不需要另外再安装 scws 的 php 扩展。从 `1.3.1` 版本起,`Xunsearch` 的 PHP-SDK 中加入 [XSTokenizerScws] 类,可通过搜索服务端执行分词功能。 用法简单说明 ---------- 这...

6.最新的主要变动

...化代码兼容性 - 增加用户案例文档:USERCASE - 改进自定义分词 XSTokenizerScws 接受参数作为复合等级 - 升级 libevent 到 2.x 版 - 修正中文 stopwords 不生效的问题 - 取消恼人的 NODB(S#506) 错误提示 - 新增获取文档匹配词表的接口 [XSSearch:...

7.编写第一个配置文件

...为了按版块检索,我们必须对它进行索引,而它也不需要分词,所以分词用内置的 `full`。 - `tid` 内容也是数字的主题ID,我们暂不考虑按主题搜索,所以不需要索引,也没有排序等要求,所以 只要当作普通字段存储下来即可...

8.自定义 SCWS 词库

...定义 SCWS 词库 如之前所说,我们所有的索引分词默认为 scws,这也是我们开发的开源分词系统, 内置的词库基本上能满足绝大多数应用。但总有例外,这也就是即将说的如何自定义词库。 全局自定义词库 --------...

9.删除文档

...引词**删除而不是该字段的值,索引词是指该字段值经过分词处理后得到的词汇。 对于索引方式为 `mixed` 的,如需删除,请把字段名设为类型为 `body` 的字段的名称。 ~~~ [php] $index->del('abc', 'subject'); // 删除字段 subject 上带有索...

10.构建搜索语句

...部默认采用 `AND` 规则, 也就是说要求列出来的关键词(分词之后)全部匹配,如果您通过 [XSSearch::setFuzzy] 开启了模糊匹配,那么相当于采用 `OR` 规则,只要其中一个关键词匹配即可。 刚刚说的这种搜索的是索引数据库的“混...

  • 时间不限
  • 按相关性排序