... 有关热门搜索的深度挖掘 -------------------- 搜索日志也是一个完整的索引库,可以进行更深入的分析。由于涉及的知识和基础较为复杂, 这块内容这儿暂时略过。 $Id$
...] 开启了模糊匹配,那么相当于采用 `OR` 规则,只要其中一个关键词匹配即可。 刚刚说的这种搜索的是索引数据库的“混合区”,即类型为 `body` 的字段以及索引方式为 `mixed` 或 `both` 的字段。如果某个字段的索引方式为 `self` ...
同义词搜索 人类语言文化丰富,同一个意思有无数种不同的表达方式。因此,**同义词** 是全文检索中非常重要和必要的一项基础功能。从 `1.3.0` 版本起,`Xunsearch` 开始提供同义搜索搜索功能。 什么是同义词搜索 ------...
...目的默认字符集。 * _--import=_ 导入搜索日志文件,每行一个词,每行的数据中可以用\\t(Tab键)分开指定次数,没有次数默认为1。 * _--put=_ 添加、更新搜索日志词汇,词与次数之间用半角冒号分隔,默认为 1 次。 多个词之...
... #### 创建分词对象 ~~~ [php] $xs = new XS(...); // 必须先创建一个 xs 实例,否则会抛出异常 $tokenizer = new XSTokenizerScws; // 直接创建实例 ~~~ ### 获取分词结果 调用 [XSTokenizerScws::getResult] 对参数指定的文本字符串执行分词, 并返回词汇...
...在综合分析索引库内的词汇、用户搜索日志基础上建立了一个庞大的纠错体系,支持英文拼写 纠错、中文同音字纠错、拼音转换等。 使用这些功能都非常简单,直接调用 [XSSearch::getCorrectedQuery] 即可,该方法接受搜索语句 作为...
...一致。 > > 此外删除操作和[添加文档](index.add)一样,也是一个异步行为。 $Id$
...配置文件详解 基础说明 ------- - 项目配置是一个 `Xunsearch` 项目的核心灵魂,非常重要,通常保存为 .ini 文件 - 以分号开头的行表示注释,空行直接被忽略不起任何作用 - 中括号包围的每个分区均为字段配置,字段个...
...自定义词库。 全局自定义词库 ------------- 这是针对同一个 `xunsearch` 安装实例来讲,该服务端下的所有项目都将共用这个自定义词库。 严格来讲,这是 SCWS 本身就提供的功能,xunsearch 只是做了整合和规范。涉及的相关文件如...
编写第一个配置文件 `Xunsearch` 的配置文件是纯文本的 `INI` 格式,用任何文本编辑器均可编写,在 `Unix` 类型的系统下推荐 用 `vi`,而 `Windows` 下可以用记事本或 `EditPlus` 进行编写。我们也正在计划不久的将来制作一...