...tman, 您好,我将过滤器做了以下处理: 1,放在/usr/local/xunsearch/sdk/php/lib/下面,并且赋予755权限; 2,运行命令util/Indexer.php --rebuild --source=mysql://隐藏 --sql="select did, tag, title, content from wiki_doc" --filter=/usr/local/xunsearch/sdk/php/lib/MyBlo...
在xunsearch缓存仅仅用于缓存ini文件,所以基本上不需要用到memcached这样重型需要TCP连接的开销。 因为一台服务器上你也不会开多少个搜索项目啊,就算没有缓存问题也不大。 目前自动支持apc\eacc\xcache
自己做个扫描程序,以文件名为key,内容为body建索引不就好了? xunsearch 本身并不是完整的搜索引擎,它是提供核心组件并附带一些例子
你根本没有安装服务端?Xunsearch 是2部分组成的。目前服务端不支持在 windows 上运行
...外,你所说的最大颗粒分词是指最长匹配吗?分词在 scws/xunsearch 结合时作了很多特殊处理,保障查全率和准确率。 比如“管理制度” 解析为 “管理制度” OR “管理 AND 制度”
确认是用xunsearch二次开发的,效果做得不错: [url]http://www.761.com/search/?q=%D5%E3%BD%AD[/url]
其实我们提供的搜索方案是提供API的,简单来说就是你可以通过API维护数据。至于如何同步完全取决于你的作法和设计,至于JOIN也一样,这个本身不是XUNSEARCH的功能 但我们提供的辅助工具 Indexer.php 也支持 JOIN语句和多表导入。
呵,不用这么麻烦,可以在服务器上直接解压 packages/xunsearch-1.4.7.tar.bz2 然后,修改、编译即可。
这个xunsearch暂时还没有提供这项功能,但可以先变通的如下方式处理: 在提取API后面自己再简单加个判断?现在新版 1.3.1 提供了 scws 接口,只要把这些黑词加到自定义词典,并取一个独特的词性,那么就可以用 XSTokenizerScws::has...