...rset _ 指定当前环境、数据源的字符集,默认情况下, 索引工具输出的字符集为 utf-8,并把数据源字符集视为项目的默认字符集。 * _--import=_ 导入搜索日志文件,每行一个词,每行的数据中可以用\\t(Tab键)分开指定次数,没...
索引概述 什么是索引? ---------- 索引在 `Xunsearch` 中泛指用于检索的数据库文件总称。每一次检索数据均为访问和读取 索引文件,每一次更新数据则是对索引文件的修改。 `Xunsearch` 每个搜索项目的索引数据是分开单独存...
...进一些显示效果 - 搜索日志记录时排除具有明显特征的搜索引擎爬虫 版本 1.4.0 (2013-1-22) ---------------------- - 升级整合最新的 xapian-1.2.13、scws-1.2.1 - 新增支持项目自定义词库,[参见文档](index.dict) - 改进网络 IO 读取,优化搜索内...
搜索概述 在索引库建立完成后,现在开始学习使用搜索功能,这也是最核心的部分。 如何开始使用搜索? --------------- 在 `PHP-SDK` 中,搜索功能由类型为 [XSSearch] 的对象所维护。在 [XS] 项目中,通过读取 [XS::search] 属性...
...,我们在这个章节,借助辅助工具 带您体验一下搜索和索引的操作。这里可能有很多内容您尚不熟悉,请不必感到惶恐, 只要跟着说明完成操作即可,后面还有大量章节对各项进行深入讲解。 > note: 这些例子中的命令、代码均...
...索的深度挖掘 -------------------- 搜索日志也是一个完整的索引库,可以进行更深入的分析。由于涉及的知识和基础较为复杂, 这块内容这儿暂时略过。 $Id$
...口音,乱用同音字现象非常普遍。 所以系统在综合分析索引库内的词汇、用户搜索日志基础上建立了一个庞大的纠错体系,支持英文拼写 纠错、中文同音字纠错、拼音转换等。 使用这些功能都非常简单,直接调用 [XSSearch::getC...
索引管理器 `Indexer` 作为索引管理工具,提供了批量索引导入、清空索引、刷新索引队列、日志等各项功能, 导入索引支持数据源包括:`csv, json, mysql, sqlite` 等,也可以自定义数据源。 运行脚本工具的 --help 选项可查...
...运行,搜索测试工具 - util/Indexer.php 命令行运行,索引管理工具 - util/SearchSkel.php 命令行运行,根据配置文件生成搜索骨架代码 - util/xs 命令行工具统一入口 在开始编写您的代码前强烈建议执行 util/Requ...