...的set_dict之后加上 scws_add_dict(s, 'path/to/this_ad_dict.txt', SCWS_XDICT_TXT); 这样使文本词典生效. 其中词典格式为 词 tf idf attr (当attr为!表示删除该词) [code] 市廛 1 1 ! 河华 1 1 ! 阳道 1 1 ! 道南路 4 2 nz 小白兔 4 2 n [/code] 以下我是根据你的...
...现该问题了? 但是如果资源使用txt文本,参数使用SCWS_XDICT_XDB,也不会有问题。 图片在附件中! [hr] 因为我这边是将scws的源码直接加入到我的C++工程代码中的,所以可以直接看到递归堆栈溢出的地方。在这边给开发者看看...
...(); scws_set_charset($sh, 'utf8'); scws_set_dict($sh, './dict.txt', SCWS_XDICT_TXT); scws_set_rule($sh, './rules.ini');//文件内容为空 $cutword = $_POST['cutword']; scws_send_text($sh, $cutword); $rs = scws_get_tops($sh, 5); 另:我使用工具把默认的.xdb转化成.txt后在使...
...跟踪已经发现bug所在,稍后会发布1.1.1版本。 bug位地 xdict.h 中的(这是1.1.0起新加的功能,所以1.0.x的版本无此bug) #define SCWS_WORD_MALLOCED 0x100 只要将 0x100 改变 0x80 即可,因为 struct scws_word 中定义的 flag 为 unsigned char 即 8bit, 容不...
...cws_st 结构,不保证这类拷贝结果会有用。 typedef struct { xdict_t d; rule_t r; unsigned char *mblen; unsigned int mode; unsigned char *txt; int len; int off; scws_res_t res0; scws_res_t res1; word_t **wmap; struct scws_zchar *zmap; } scws_st, *scws_t; struct scws...
...ath") . '/dict.utf8.xdb'); $so->add_dict("/usr/myapp/dict_extra.txt",SCWS_XDICT_TXT); $so->set_rule(ini_get('scws.default.fpath') . '/rules.utf8.ini'); 结果分词无效果.好像是加载不到词库一样...试了很多次.都不行. 路径和权限我确定没有错误. 所以来求救...
...lse, $multi = 3) { this -> cws -> addDict('/res/category/dict_1.txt',SCWS_XDICT_TXT); var_dump($this -> cws ->hasWord("新增词","n")); $this -> cws -> setduality($duality); $this -> cws -> setignore($ignore); $this -> cws -> setmulti($multi); $re=$this -> cws -> getresult($string); var_dum...
...d/dict.txt'); scws_set_dict($sh, 'E:/luxilang/tool/keword/dict.txt', SCWS_XDICT_TXT); //scws_set_rule($sh, 'E:/luxilang/tool/keword/rules.ini'); $text = "陆喜郎健康房间陆喜预警雷达太阳能朗你 太阳能 ac dc转换器 智能城市未来好的发展abb压力变送器看看"; scws_...
...\rules.utf8.ini'); $so->add_dict('D:\php\www\htdocs\dict_extra.txt', SCWS_XDICT_TXT); hm你好。 上边的代码的确可以自定义词库,现在的scws能否直接把词加入核心词库了啊?比如直接加进dict.utf8.xdb'?而不是这种方式 因为目前的词库比较大。用...
...$so = scws_new(); $so->set_charset('utf8'); $so->set_dict('words.txt',SCWS_XDICT_TXT); $so->set_ignore(true); $so->send_text("GMhello指导员"); echo ''; while ($tmp = $so->get_result()) { var_dump($tmp); } $so->close(); 在words.txt只定义如下内容 GM 1.0 1.0 * hello指导员 1.0 1.0 * 而...