hightman: 补丁我试图去打了,但出现以下错误: patch -c libscws/scws.c scws.patch patching file libscws/scws.c Hunk #1 FAILED at 328. Hunk #2 FAILED at 684. 2 out of 2 hunks FAILED -- saving rejects to file libscws/scws.c.rej 补丁针对的版本是scws-1.5吗?
如果你能长时间用 $scws 对象那就可以一次加载,多次使用。如果每次在不同的脚本中 set_dict 那肯定是每次都加载啊。
[quote='hightman' pid='705' dateline='1333591381'] 自己做个扫描程序,以文件名为key,内容为body建索引不就好了? xunsearch 本身并不是完整的搜索引擎,它是提供核心组件并附带一些例子 [/quote] 如果是页面结构相似的网页,像H大这...
你看一看 /usr/include/zlib.h 是否存在呢?还有,要重新configure
枪王你的作法是对的,“王之王”是自动识别人名的原因。 山楂树之恋,想分成”山楂树“+”树之恋“目前是没有办法做到了~毕竟复合分也没办法把一个字拆到2个词里。
每个线程需要单独的SCWS实例 ,词典和规则集倒是可以共用的,主线程正常操作,其它线程可以在 scws 创建后通过 thread_scws->d = main_scws->d; thread_scws_r = main_scws->r; 来共用它们,因为词典和规则集都是只读而且各API都是线程安全...