..., has_word 用于检测当前文本中是否包含这些属性的词。 scws_get_words 是按词性返回分词结果,标点的词应该默认应该是 un 或 # 之类可以自行排除。 [/quote] 关于has_word,我的意思是说,当我不传属性参数,返回的会是0
可能是你的词被切成了其它不合理的单位吧. 加到special没有用. 你最好测试一下被检索的语句/文本切词后的效果...
1. 你的词典只有“再试一个”这个词,当然就只有它了 2. scws_new/scws_free 是C 里的函数,在PHP中是 scws_open/scws_close 建议在PHP中用对象方式使用 scws 即 $so = scws_new(); $so->set_charset('gbk'); $so->set_dict(...
这个应该没问题吧,我用你们提供的gen_scws_dict 在linux上按照你们给的方法转换的,没有报出错误! 不过后来我将转换后的xdb用你们提供的php dump_xdb_file.php 将其转回发现少了7条。
[quote='lyhuc' pid='3803' dateline='1288194553'] 打不开这个ZIP包,提示损坏,可否重新发布一下? [/quote] 直接下载最新的 scws-1.1.3.tar.bz2 就包含相应的DLL包了,详见主页 http://www.ftphp.com/scws