[quote='hightman' pid='4093' dateline='1299644984'] 导出的TXT格式的顺序并不能说明什么。。。。 [/quote] 那么会在什么环节出了问题呢? 为什么官方的比自己打包的快很多? 非常想知道答案 效率第一 = = 是不是要用 gen_dict.c 创建XDB比...
[quote='sonictan' pid='4085' dateline='1299146055'] 我根据论坛和ftphp网站上要求,在自己的服务器上配置SCWS,但始终无法分词。 我需要的是utf8编码的。 测试文件在gbk下好使,应该如何改成utf8格式的? 请教管理员,我该如何操作。 :hu...
[quote='hightman' pid='3443' dateline='1267710296'] 现在导出的错误已经得到修正,错误原因在于 Next() 中误把 $this->hash_prime写成了$this->hash_base [/quote] 导出TXT文件顺序是按照XDB里面的排列的 (我觉得导出文件可能有问题) 创建XDB文件是...
导出TXT文件顺序是按照XDB里面的排列的 (我觉得导出文件可能有问题) 创建XDB文件是根据 foreach $rec[$k] 里面的数字排序的 那样 XDB和TXT里面的排序完全改变了 目前的情况是我导出TXT在创建XDB 分词速度比之前慢了2倍 这...
[quote='hightman' pid='4106' dateline='1299821709'] 是不是你创建的XDB文件没有调用相应的optimize方法 ? php里有一个 $xdb->Optimize(); 这是在创建文件后必须调用的,即使不调用,效率也不会像你描述的这么慢吧。 [/quote] 有运行优化函...
.c文件追加 [code] typedef struct xdb_tree_node { char *key; int vlen; int voff; struct xdb_tree_node* next; } xdb_tree_list, *xdb_tree_plist; int travel_index = -1; xdb_tree_plist _xdb_tree_plist = NULL; void _xdb_next_tree_read(xdb_t x, xptr_t ptr) { if (ptr->len...