...词性切分后都为/en。在非法词过滤时也是如此,不能使用scws_has_word()函数来判断是否有指定属性的词,假如非法词属性为*,非法的英文单词切分后属性为/en。 另外有两个模糊的地方: (1)词库中词性'#'含义不明确,文档说:# :...
...它核心库中存在该词也视为无效。 2. [libscws] 新增 int scws_has_word(const char *xattr); 和 scws_top_t scws_get_words(const char *xattr); 两个函数 1. 参数 xattr 和 scws_get_tops 的参数是一样的,指定词性,多个词性之间用逗号(,)分隔,若以 ~ 开...
...它核心库中存在该词也视为无效。 2. [libscws] 新增 int scws_has_word(const char *xattr); 和 scws_top_t scws_get_words(const char *xattr); 两个函数 1. 参数 xattr 和 scws_get_tops 的参数是一样的,指定词性,多个词性之间用逗号(,)分隔,若以 ~ 开...
..._test.php, 精选了一些岐义较多的语句进行测试。 4) 修正 scws_has_word() 的一处内存汇露 (感谢lauxinz) 5) 修改调试模式的编译选项,去除-O2避免源码和代码无法对应。 (感谢lauxinz) [b]scws-1.1.6 发布于 2011-04-20[/b] 修正夹杂在汉字中...
...词性切分后都为/en。在非法词过滤时也是如此,不能使用scws_has_word()函数来判断是否有指定属性的词,假如非法词属性为*,非法的英文单词切分后属性为/en。 想hack一下,但最好还是希望hightman来支持一把。 hack如下: 对代码...
...lexport) scws_get_words(scws_t s, char *xattr); int __declspec(dllexport) scws_has_word(scws_t s, char *xattr); 编译器是C++ Builder 2007,源码未做其它修改。