txt词库其实也是转换成XDB再调用的,不用担心性能。 你合并词典很简单啊,把 dict.utf8.xdb 导出来嘛
...: mach-o, but wrong architecture in Unknown on line 0 [Tue May 01 12:03:42 2012] [notice] Apache/2.2.22 (Unix) mod_wsgi/3.3 Python/2.7.2 mod_ssl/2.2.22 OpenSSL/0.9.8r PHP/5.3.10 configured -- resuming normal operations [Tue May 01 12:03:57 2012] [error] [client ::1] PHP Fatal error: Call to undefin...
版主您好,我在自定义词表里加了一些数字+字母的词,如pm2.5,101大楼这样。 使用的时候发现无法正常分出来,我看到新版是加了一些强制拆分的功能,但是对自定义词表里的词,也是强制拆分的码?
[quote='hightman' pid='8876' dateline='1333164684'] txt词库其实也是转换成XDB再调用的,不用担心性能。 你合并词典很简单啊,把 dict.utf8.xdb 导出来嘛 [/quote] 谢谢hm。还是更加期望加上直接入字典库的功能。这样更加方便,就是不知...
$so->set_dict('D:\php\scws\etc\dict.utf8.xdb'); $so->set_rule('D:\php\scws\etc\rules.utf8.ini'); $so->add_dict('D:\php\www\htdocs\dict_extra.txt', SCWS_XDICT_TXT); hm你好。 上边的代码的确可以自定义词库,现在的scws能否直接把词加入核心词库了啊?比如直接加...
HM,您好,我目前使用自定义词库实现分词,但是通过scws_get_top5()方法获取数据的时候(字母+数字大于等于3个的时候也会返回)。求过滤方案。 $sh = scws_open(); scws_set_charset($sh, 'utf8'); scws_set_dict($sh, './dict.txt', SCWS_XDICT_TXT); scws_...
2012-03-03 19:34:00 indexd[2970] new connection (SOCK:7, IP:127.0.0.1, BURST:1) 2012-03-03 19:34:00 indexd[2970] [sock:7] unable to allocate memory for ZCMD (CMD:79, SIZE:1763734736) 2012-03-03 19:34:00 indexd[2970] [sock:7] quit, out of memory
...lib/XS.php(2087): Task is canceled due to timeout/error(S#514) 日志: 2012-12-25 10:19:08 worker1[11340] [sock:7] task canceld, run the cleanup (ZARG:0x7f6c775fdbf0) 2012-12-25 10:19:08 worker1[11340] [sock:7] quit, result error (CODE:514) 2012-12-25 10:19:08 worker1[11340] accept() failed, s...
...com/team.aspx?id=2389 Small_image_url:http://www.vetuan.com/upfile/team/2012/0424/634708797667354391.jpg End_date:2.14748e+09 Price:99 Value:170.00 Citypinyin:quanguo OrderPower:482 2. OPI保湿底油+护理亮油(T10+T30) #1164715# [100%] Deal_url:http://www.vetuan.com/team.aspx?id=...
...数据的时候,自动更新索引。 日志效果: @@@@@@@@@@@@@@ 2012-11-30 07:41:01 本次更新1条记录,详情如下:@@@@@@@@@@@@ 2012-11-30 07:41:01 update(ps:这里可能是add,update,delete) index num : 1 ************************** Array ( [0] => Array ( ...