...ws_t s, const char *text, int len); scws_res_t __declspec(dllexport) scws_get_result(scws_t s); void __declspec(dllexport) scws_free_result(scws_res_t result); scws_top_t __declspec(dllexport) scws_get_tops(scws_t s, int limit, char *xattr); void __declspec(dllexport) scws_free_tops(scws_top_t...
如果你还需要原来的词典,请在 add_dict 前加 set_dict(ini_get('scws.default.fpath').'/dict.utf8.xdb');
...调用 ini 中指定路径下的词典和规则文件 $so->add_dict(ini_get("scws.default.fpath") . '/dict.utf8.xdb'); $so->add_dict("/usr/myapp/dict_extra.txt",SCWS_XDICT_TXT); $so->set_rule(ini_get('scws.default.fpath') . '/rules.utf8.ini'); // $so->set_duality(0); $so->set_ignore(0); $...
XDB不可轻易修改, 需要借助工具转换纯文本为xdb, 添加和修改词不太方便 还有二楼的代码是手册里的讲解,并不是要你抄进去. scws_get_tops() 返回的 attr 带有乱码是因为 windows 的 dll 较早所以才会有这样的BUG, 问题不大
...纪录片中,发现"); //获取分词结果,如果提取高频词用get_tops方法 while ($words = $so->get_result()) { foreach ($words as $word) { print_r($word); } } $so->close();
词典没配好吧 有没有在 ini_get('scws.default.fpath') 下面放置词典和规则集文件呢?
... (显示) public function __isset($name){ return method_exists($this, 'get' . $name);} 魔术方法 __isset 判断模拟属性是否存在并可读取
请仔细看说明,$so->get_result() 并不是一次调用,需要多次调用直到返回FALSE 例子1. 使用类方法分词