试试在 phpext 目录的 configure 运行前 export CFLAGS="-O2 -DZTS=1"
[quote='lyhuc' pid='3803' dateline='1288194553'] 打不开这个ZIP包,提示损坏,可否重新发布一下? [/quote] 直接下载最新的 scws-1.1.3.tar.bz2 就包含相应的DLL包了,详见主页 http://www.ftphp.com/scws
...个词典load到内存需要一些时间的(不光读取还要转换成xtree结构)
...xt('广州建筑工程监理有限公司中山分公司'); $sk = $so->get_result(); 结果是:广州建筑工程监理有限公司 中山 分公司 $so = scws_new(); $so->add_dict('new.txt', SCWS_XDICT_TXT); $so->send_text('广州建筑工程监理有限公司中山分公司'); $sk = $so...
将分辨率数据转换成主表的一个字段,用 XSDocument::addTerm 添加索引或转换成特殊字段采用 split 分词器
[quote='hpxl' pid='116' dateline='1319506745'] 500万条数据可以分段来读取,比如每次10000条,就不会出现上面的php错误了。判断是不是某条数据是不是已经存在了,可以根据主键来判断是不是已存在,存在的跳过就可以了。例如: [php]$qu...
汗,看来就是因为“\r”问题。 hightman老兄,你是用那个来判断换行的?\r\n ?[hr] 测试了一下windows下你使用的是“\n”,linux下你是不是使用了"\r\n" ? 汗,本地windows,服务器linux........ 继续测试。。。
[quote='hightman' pid='8876' dateline='1333164684'] txt词库其实也是转换成XDB再调用的,不用担心性能。 你合并词典很简单啊,把 dict.utf8.xdb 导出来嘛 [/quote] 谢谢hm。还是更加期望加上直接入字典库的功能。这样更加方便,就是不知...
我也遇到同样的问题了, undefined symbol: core_globals_id
...d(s,"*")) //"*"用NULL代替也不行 另外我用函数scws_set_ignore(s,1),怎么去不掉文本中的空格等特殊字符[hr] 我用的版本是scws-1.1.2