搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

1.XSTokenizer 分词接口

XSTokenizer 分词接口 [XSTokenizer] 是搜索字段的分词接口定义，整个接口只要求实现一个方法 [XSTokenizer::getTokens]，自定义分词器用于 INI 配置文件中的 `tokenizer` 选项。关于自定义分词器的详细用法剖析请阅读后面...

2.自定义分词器

自定义分词器 `Xunsearch` 默认内置了功能强大的 [SCWS][1] 分词系统，也附加提供了一些简单常见的分词规则，但考虑到用户的个性需求，特意提供了自定义分词器的功能。 > note: 自定义分词器存在一个缺陷，它不支持存...

3.开发规范

...，请自行编写代码和定义时不要也以 `XS` 开头。自定义分词 --------- Xunsearch 在项目配置时支持针对某些字段自定义分词。每个自定义分词功能单独使用一个文件名，命名为 `XSTokenizerXyz.class.php`，其中 `Xyz` 是您自己的分词名称...

4.项目配置文件详解

...，请将关联记录转换为搜索项目的新字段并设置对应的分词规则。字段设计很重要，请仔细根据需求创建，字段名建议和您的实际数据库字段一致。 1. ### 定义字段每个字段用一个区段配置来表示，中括号内的名字即为字...

5.最新的主要变动

...化代码兼容性 - 增加用户案例文档：USERCASE - 改进自定义分词器 XSTokenizerScws 接受参数作为复合等级 - 升级 libevent 到 2.x 版 - 修正中文 stopwords 不生效的问题 - 取消恼人的 NODB(S#506) 错误提示 - 新增获取文档匹配词表的接口 [XSSearch:...

6.同义词搜索

...一个单词有多种不同的形式，如：单复数、过去式和现在分词等。而它们要传送的其实是同一种涵义。因此，对于纯英文的同义词记录会自动进行词根处理。词根记录保存为大写字母 Z 开头的记录。例如：设置 `find` 是 _s...

7.Xunsearch SDK for PHP

...Search(); $index = $db->getIndex(); // 如有必要，还可以获得 scws 分词对象 $scws = $db->getScws(); ``` #### 使用 xunsearch DebugPanel 为便于调试，还提供了一个 `hightman\xunsearch\DebugPanel` 对象，可以集成到 debug 模块中，可在调试工具条和面板中显...

开源免费、高性能、多功能、简单易用的全文检索技术方案 !