[quote='hightman' pid='705' dateline='1333591381'] 自己做个扫描程序,以文件名为key,内容为body建索引不就好了? xunsearch 本身并不是完整的搜索引擎,它是提供核心组件并附带一些例子 [/quote] 如果是页面结构相似的网页,像H大这...
无效过滤器是不是因为你没把文件放到 sdk/php/lib/ 目录?还有你命令行指定的过滤器也注意大小写。
要放到lib目录吗?我是用的--filter=/usr/local/xun.../MyBlogFilter的绝对路径呢。 我回头试下放在lib目录下,谢谢了!
比如你的过滤器名字为 test 那么文件名 /usr/local/sdk/php/lib/XSTestFilter.php 内容 class XSTestFilter implements XSFilter { }
[quote='hightman' pid='705' dateline='1333591381'] 自己做个扫描程序,以文件名为key,内容为body建索引不就好了? xunsearch 本身并不是完整的搜索引擎,它是提供核心组件并附带一些例子 [/quote] 问题是如果是扫描程序,并不能做到实...
hightman, 您好,我将过滤器做了以下处理: 1,放在/usr/local/xunsearch/sdk/php/lib/下面,并且赋予755权限; 2,运行命令util/Indexer.php --rebuild --source=mysql://隐藏 --sql="select did, tag, title, content from wiki_doc" --filter=/usr/local/xunsearch/sdk/php/lib/M...
另类解决方法: 直接修改XSDataSource.class.php 文件最后一个函数。 public function process($data, $cs=false) { //echo "\n----- DEBUG DATA INFO -----\n"; //print_r(str_replace('--', '', $data['content'])); $data['content']=str_replace("", '', $data['content']...
...ess($data, $cs =false) { $data['content'] = $this->filterHtml($data['content']); return $data; } public function filterHtml($str) { $str=eregi_replace("", '', $str); $str=str_replace(" ", '', $str); $str=str_rep...
.... "What's the big difference?" [URL=http://www.mosaicrocks.com/tomsoutlet.html]Toms Outlet[/URL] "I don't have [the bills]. They indicated at the beginning of session that they would get them done early," Dayton said. "It's obviously their prerogative. It's just less time to May 23." And he certai...
...quanji/%25E8%2583%25B4%25E4%25BD%2593_%25E5%2591%25BB%25E5%2590%259F_page1.html]http://www.wuxiaxiaoshuo.org/quanji/%25E8%2583%25B4%25E4%25BD%2593_%25E5%2591%25BB%25E5%2590%259F_page1.html[/url]