你编译的SCWS.SO和所用的PHP不是同一个版本。。。重新用对应配套的 phpize php-config 吧,如果你的系统有默认装的早先的php 请在 ./configure 中明确的用 --with-php-config=.... 指定真正在用的PHP-CONFIG
...提取API后面自己再简单加个判断?现在新版 1.3.1 提供了 scws 接口,只要把这些黑词加到自定义词典,并取一个独特的词性,那么就可以用 XSTokenizerScws::hasWord() 的功能来判断是否包含黑词?
有没有含有简体中文的gbk规则集文件啊。我在http://www.ftphp.com/scws/download.php#dll处下的文件包括rules.ini rules.utf8.ini rules_cht.utf8.ini 这三个文件,这貌似没有gbk的规则文件吧?但是pscws23只能用gbk。请问这怎么办
可否说一下是怎么调试的,第2个方式可能是编译器优先级的问题? 希望可以准确复现 php_scws.dll 在WIN32平台下加载TXT会出现问题吗?
把 libscws/xdict.h 另存为 ansi 就可以了,我打包的是 utf-8 ,真是诡异。scws.c 就没事
...及词性的权重比,应该可以达到你想要的效果~ 例如:在SCWS分析以上三句词性得到: 你/r 给/v 我/r 买/v 的/uj 衣服/n 你/r 看/v 的/uj 书/n 一/m 件/q 衣服/n 以此可以看出,其中匹配的是 你/r 的/uj 衣服/n 这时,你增大 /n的权重就...
http://www.ftphp.com/scws/demo/v4.php 在这可以查分词结果 用附带的工具 util/Quest.php 加上 --show-query 可以看实际拆分的语句,这样你就明了了。