...tp://www.ftphp.com/scws/api.php",0,$data); if(!$re) { return array('words'=>array()); } return json_decode($re); } [/php] 分词结果: 中文 分词 解析 我 的 个 神啊 具体返回的json 见下面. 我想设置到 不要一个字的词,...
...ops(s,1000,NULL); 而下面判断却没有包含这个词 if( scws_has_word(s,"*")) //"*"用NULL代替也不行 另外我用函数scws_set_ignore(s,1),怎么去不掉文本中的空格等特殊字符[hr] 我用的版本是scws-1.1.2
你可以正常分词试试,然后打印一下词的 attr 属性到底是不是* 号 我估计是不是你自定义词典先于默认词典加载,导致attr属性被覆盖了?
... while (cur) { printf("Word: %.*s/%s (IDF = %4.2f)\n", cur->len, text+cur->off, cur->attr, cur->idf); printf("length: %d\n", cur->len); cur = cur->next; } scws_free...
这个不能随便改,但可以通过调整源码的编译参数来改。通常不需要这么做啊,实在有必要时你们可以考虑继承XSTokenizerScws 来自己修改它。
...调试后发现错误发生在scws_free_tops函数中的 [code]free(cur->word)[/code] 请问这种错误可能的原因?应该向什么方向解决呢? 我在scws_free_tops中添加了一些调试代码 [code]void scws_free_tops(scws_top_t tops) { scws_top_t cur; int len; int b; w...
... = scws_get_result(s)) { while (cur != NULL) { printf("Word: %.*s/%s (IDF = %4.2f)\n", cur->len, text+cur->off, cur->attr, cur->idf); cur = cur->next; } scws_free_result(res); } scws_free(s); } [/php] 结果如下: $ ./test Word: Hello/en...