关于 Xunsearch PHP-SDK Xunsearch (中文名:迅搜)是一套免费开源的专业中文全文检索解决方案,简单易用而且 功能强大、性能卓越能轻松处理海量数据的全文检索。它包含后端索引、搜索服务程序和前端 脚本语...
...速度过快或各种原因都很容易造成一两个字母出错。对于中文来说,古代就动不动 出现同音”通假字“,绝大多数现代人也使用拼音输入法,加上方言口音,乱用同音字现象非常普遍。 所以系统在综合分析索引库内的词汇、用...
...录 ~~~ > note: 如果您删除时指定的主键或字段索引词包含中文字符,则它的编码必须与整个项目的 > 默认字符集 [XS::defaultCharset] 一致。 > > 此外删除操作和[添加文档](index.add)一样,也是一个异步行为。 $Id$
... > tip: 独立词汇的意思对于英文来说就是一个单词,对于中文来说必须是 `scws` 词库中的一个词。 > _Xunsearch_ 的同义词不同于 _Xapian_,会智能进行字段匹配和转换,您只需维护通用词库。 英文同义词的特殊处理 ------------------ ...
...rScws 接受参数作为复合等级 - 升级 libevent 到 2.x 版 - 修正中文 stopwords 不生效的问题 - 取消恼人的 NODB(S#506) 错误提示 - 新增获取文档匹配词表的接口 [XSSearch::setRequireMatchedTerm] 版本 1.4.7 (2013-7-30) ---------------------- - 优化安装脚本...
...是 `UTF-8` 的系统内部会 自动进行转换,但要求 `PHP` 带有中文转码扩展 ([iconv][1] 或 [mbstring][2]) ~~~ [php] $doc = new XSDocument; // 使用默认字符集 $doc = new XSDocument('gbk'); // 指定文档为 GBK 编码 $doc = new XSDocument($data); // 数组 $data 为初始...
...,分词器当然选用 `full`。 - `author` 作者名字检索,考虑中文名支持,所以建议这个字段保留使用默认内置的 `scws` 分词器。 由于希望在默认不指明字段的情况下也能检索作者字段,所以它的过索引方式应为 `both`。 - `authorid` 作...
...3. $prefix/sdk/php/util/RequiredCheck.php -c gbk ~~~ 运行结果输出的中文编码默认为 `UTF-8` ,如果您使用 `GBK` 环境请在运行命令最后加上 `-c GBK` 。 运行结果会给出一个可视化的表格说明检测结果,并在最终给出检测结论,告诉您是否符合...