写得非常不错。但我要说明的的: 1.命令行默认是UTF-8输出,乱码可以试试加上 -c gbk 2.过滤器用法是这样的你可以自命名一个过滤器,而不是去修改系统的过滤器,比如你在 /usr/local/xunsearch/sdk/php/lib/ 创建文件 XSTestFilter.php...
因为这个讲述起来比较复杂,而且多数用不到,所以一直缺这个文档。 rules.ini 是一个规则,比如像姓名或路名或章节数字之类,可以规定某些字凑在一起就视为整体,可以规定某些字开头或某些字结尾的N个字组成词组,基本...
最新将 xunsearch 文档组织编译为 chm 格式方便大家下载离线浏览。 内容包含 API 文档、权威指南、关于 xunsearch 三大部分。 下载地址:[url]http://www.xunsearch.com/download/xs_php_manual.chm[/url] 效果见附件。 [attachment=1]
1. 全文检索,此次全文搭配数据库进行。测试中大概有 45万篇文章,约900万个词(是分好的词不是字)。 检索效果还不错,如果纯单词进行检索效果相当好。长句略慢。。。。 [url=http://www.dot66.net/search2.php]http://www.dot66.net/...
[quote='hightman' pid='7360' dateline='1398062695'] 安装 zlib-dev [/quote] 老大 顺便再问一个问题啊 1:我要做同义词搜索 文档我找了N久 不知道在哪里开启 2:同义词库是不是要自己去做啊?官方有木有词库啊?或者一键导入 3:开启...
感谢您的详细报告。 第一段错误,是XS本身引起的,目前最新版已经修正了这个问题,是一些NOTICE级别的错误,如果不方便重新安装建议先强制忽略 notice 错误,可以在 lib/XS.php 开头加一句 error_reporting(E_ALL ^ E_NOTICE); 第二,你...
1. 你的词典只有“再试一个”这个词,当然就只有它了 2. scws_new/scws_free 是C 里的函数,在PHP中是 scws_open/scws_close 建议在PHP中用对象方式使用 scws 即 $so = scws_new(); $so->set_charset('gbk'); $so->set_dict(...
TF/IDF值不会导致用不到分词,只是靠在一起时需要消岐才用得到。你自定义词典用不了要查查是什么别的原因。 通常问题: 1.词典写的字符集不对,比如把GBK当UTF-8了 2.词典更新后的修改时间由于某些原因比/tmp目录下生成的临...
首先多谢选择使用 xunsearch ,像你这样的站是比较典型的,方便的话可以留下网址。 搜索性能 0.5 秒应该是首次检索,第二次检索同样的关键词缓存应该会起作用。 再说一下如何分库 像你这样的贴子,应该说旧贴子不太可能...
[quote='hightman' pid='121' dateline='1319514186'] Indexer.php 你可以在 sql 语句中指定 offset 和 limit --sql="select * from cdb_posts limit 999999999999 offset 5000000" 类似这样,OFFSET 不能单用必须配合 limit [/quote] 呵呵 原来如此 非常感谢,数据已经导...