请高人演示Linux下scws_get_tops的调用方法。 谢谢。 搜索了整个论坛。没有找到结果。
参见 phpext/php_scws.c 中的 PHP_FUNCTION(scws_get_tops); 吧 这个用法有说明里有提到啊,就是返回一个链表结构,依次遍历取出就好了,大概如下: scws_t s; scws_top_t top, cur; char *text = "测试说明文字"; s = scws_new(); scws_set_charset(s, "utf8"); scw...
[quote='hightman' pid='6608' dateline='1311994562'] 参见 phpext/php_scws.c 中的 PHP_FUNCTION(scws_get_tops); 吧 这个用法有说明里有提到啊,就是返回一个链表结构,依次遍历取出就好了,大概如下: scws_t s; scws_top_t top, cur; char *text = "测试说...
...'utf8'); $xattr = 'Ng,n,nr,ns,nt,nz,vn'; $limit = 5; // 这里没有调用 set_dict 和 set_rule 系统会自动试调用 ini 中指定路径下的词典和规则文件 $scws->send_text("这里没有调用 set_dict 和 set_rule 系统会自动试调用 ini"); $list = $scws->get_tops(3...
... // 建立分词类对像, 参数为字符集, 默认为 gbk, 可在后面调用 set_charset 改变 $pscws = new PSCWS4('utf-8'); $pscws->set_ignore('yes'); $pscws->set_dict('E:/scws/etc/dict.utf8.xdb'); $pscws->set_rule('E:/scws/etc/rules_cht.utf8.ini'); // 分词调用 send_text() 将待...
...词性列表中即可。 2. 两个函数均应在 scws_send_text 之后调用,scws_has_word 用于判断文本中是否包含 xattr 词性的词汇,常用于脏词判断,将脏词统一设为一个词性。 3. scws_get_words 返回词性属于 xattr 的词汇列表,返回顺序为词...
...词性列表中即可。 2. 两个函数均应在 scws_send_text 之后调用,scws_has_word 用于判断文本中是否包含 xattr 词性的词汇,常用于脏词判断,将脏词统一设为一个词性。 3. scws_get_words 返回词性属于 xattr 的词汇列表,返回顺序为词...
请仔细看说明,$so->get_result() 并不是一次调用,需要多次调用直到返回FALSE 例子1. 使用类方法分词
...词性列表中即可。 2. 两个函数均应在 scws_send_text 之后调用,scws_has_word 用于判断文本中是否包含 xattr 词性的词汇,常用于脏词判断,将脏词统一设为一个词性。 3. scws_get_words 返回词性属于 xattr 的词汇列表,返回顺序为词...
楼上你的情况是因为你对API使用不正确, scws_get_result 应该循环调用 while ($words = scws_get_result($sh)) { foreach ($words as $word) { print_r($word); } } 此外, 繁体词库很不完善, 缺词太多而且有一些词也不正确