...会在什么环节出了问题呢? 为什么官方的比自己打包的快很多? 非常想知道答案 效率第一 = = 是不是要用 gen_dict.c 创建XDB比较好 还是其他原因?
是不是你创建的XDB文件没有调用相应的optimize方法 ? php里有一个 $xdb->Optimize(); 这是在创建文件后必须调用的,即使不调用,效率也不会像你描述的这么慢吧。
[quote='hightman' pid='4112' dateline='1300085069'] 是PSCWS本身慢,要用DLL的才快一些 [/quote] dll也想用不过种种原因的约束所以只能用PSCWS的版本 话说...用官方的xdb比自己创建的xdb快许多...官方那个xdb速度虽然足以...不过没有许多词语.....
导出TXT文件顺序是按照XDB里面的排列的 (我觉得导出文件可能有问题) 创建XDB文件是根据 foreach $rec[$k] 里面的数字排序的 那样 XDB和TXT里面的排序完全改变了 目前的情况是我导出TXT在创建XDB 分词速度比之前慢了2倍 这...
[quote='hightman' pid='4106' dateline='1299821709'] 是不是你创建的XDB文件没有调用相应的optimize方法 ? php里有一个 $xdb->Optimize(); 这是在创建文件后必须调用的,即使不调用,效率也不会像你描述的这么慢吧。 [/quote] 有运行优化函...
...汇,限制了夹带的字母只能1个或2个字符。 比如:我有很多Q币,这里Q币你如果设为词,它可以被切出。 再比如:我有很多abc币,如果你设置了abc币为词,它仍然无法切割,会被预处理器先切为 我有很多 + abc + 币
我在CentOS4下面编译libscws正常,但是CentOS5下面很多报告。仔细看了一下,是很多地方char和unsigned char出现不匹配的情况。 两个环境的gcc版本不一样。 CentOS4 gcc version 3.4.6 20060404 CentOS5 gcc 版本 4.1.1 20070105 呵呵,不知道怎么...