...码是utf8 function get_tags_arr($title){ require 'pscws4/pscws4.class.php'; $pscws = new PSCWS4(); $pscws->set_dict('scws/dict.utf8.xdb'); $pscws->set_rule('scws/rules.utf8.ini'); $pscws->set_ignore(true); $pscws->send_text($title); $words = $pscws->get_tops(10); $tags = array(); foreac...
...commits/1.4.6[/url] CHM手册:[url]http://www.xunsearch.com/download/xs_php_manual.chm[/url] Xunsearch 是免费开源的专业全文检索解决方案,旨在帮助一般开发者针对既有的海量数据,快速而方便地建立自己的全文搜索引擎。全文检索可以帮助您...
...dict.xdb转换成txt呢?我找到了您发布的scws-v23里面的mk_txt.php,但是好像和新版本的xdb词库不兼容,能否麻烦提供一个txt格式的词库下载?多谢指教。 p.s. 感谢hightman坛主为开源事业所做出的杰出努力,现在网上发布的种种分词...
..."a vnii a"; function get_tags_arr($title){ require 'pscws4/pscws4.class.php'; $cws = new PSCWS4('utf8'); $cws -> set_charset('utf-8'); $cws->set_dict('dict.utf8.xdb'); $cws->set_rule('pscws4/etc/rules.utf8.ini'); $cws->send_text($title); $words = $cws->get_tops(10); $cws->close(); ...
...后,就可以正常导入。 我输入命令符的时候 util/Indexer.php --source=json cusabio_cn_fix /var/www/fix/file1.txt -c gbk 报错误为 WARNING: invalid line #1 - Empty array INFO: reach end of the file, total lines: 1 Íê³ÉË÷Òýµ¼È룺³É¹¦ 0 Ìõ£¬Ê§°Ü 0 Ì...
...时候,分词结果不对,不明其中原因。 DEMO:http://www.ftphp.com/scws/demo/v48.php 输入的文本也是官方DEMO一样的,分词结果如下: ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 陈凯歌 并 不 是 《 无 极 》 的 唯 一 著 作 权人 , 一 部 电...
...加上您的连接,这是做人的基本,我墓前是用的是centos+php+python+c+ImageMagick++Scws+sphinx+memcached 应该也算是个典型案例了,我的网站流量不大,但是地接很大,搜索一直是我很头疼的,线下客户都是搜索找东西,对于索引要求比较...
另类解决方法: 直接修改XSDataSource.class.php 文件最后一个函数。 public function process($data, $cs=false) { //echo "\n----- DEBUG DATA INFO -----\n"; //print_r(str_replace('--', '', $data['content'])); $data['content']=str_replace("", '', $data['content']...
...前尚未提供直接导出的工具(将来可能提供) windows版的php_Scws.dll因缺省编译环境和经验本人未能编译, 以前都是由网友bin友情编译... 如果您的词汇是属于通用的词汇, 您可以将词表发到论坛里, 我会集中统一更新词典
... 是不是你创建的XDB文件没有调用相应的optimize方法 ? php里有一个 $xdb->Optimize(); 这是在创建文件后必须调用的,即使不调用,效率也不会像你描述的这么慢吧。 [/quote] 有运行优化函数~ 系统是XP (啪 APACHE 然后用的PSCWS4...