PHP5.3.8 SCWS-1.2.0 scws_get_tops 函数的第二个参数无效! demo: scws_get_tops($sh, 5); //输出后仍然是9个关键词。
...tu安装时:./setup.sh 错误提示:[code]Configuring xapian-core-scws ... ----- checking for library containing zlibVersion... -lz checking for uuid/uuid.h... no checking for uuid.h... no configure: error: Neither uuid/uuid.h nor uuid.h found - required for brass, chert and flint (you...
1,下载了SCWS的源码,使用其中的libscws; 2,并下载了 [简体中文(UTF-8) (3.9MB,28万词,2013/01/08更新)] scws-dict-chs-utf8.tar.bz2。 3,使用示例代码: #include #include #define SCWS_PREFIX "/usr/local/scws" main() { scws_t s; scws_res_t r...
现在才发现,scws的源码里有很多地方都没有检测malloc是否成功,如scws.c:1527行附近的下面两行, top = (scws_top_t) malloc(sizeof(struct scws_topword)); top->weight = cur->idf; 182行的下面两行 res = (scws_res_t) malloc(sizeof(struct scws_result)); \ res->off...
[php] header("Content-type: text/html; charset=utf-8"); var_dump(SCWS('中文分词解析,我的个神啊')); //中文分词解析 function SCWS($title) { set_time_limit(0); $data = array("data"=>$title,"respond"=>"json","ignore"=>'yes', "multi"=>3); $data = http_build_query($data); $r...
...外的字典前,必须显式调用原词典。 如: 通常: $so = scws_new(); $so->add_dict(LIB_DIR.'/scws/phptool/dels.txt', SCWS_XDICT_TXT); $so->send_text($str); $sk = $so->get_result(); 这样,会得不到增加词库的效果, 必须: $so = scws_new(); $so->add_dict(LI...
...存在于词库中的字词,对于你这个情况,你可以修改 libscws/scws.c 第 680 行把 attr_un 改为 attr_en 即可,如果需要严格一点可以先判断一下 ch 是否为字母, 如以下: strcpy(wmap[i][i]->attr, SCWS_IS_ALPHA(txt[start-1]) ? attr_e...
请仔细看说明,$so->get_result() 并不是一次调用,需要多次调用直到返回FALSE 例子1. 使用类方法分词