..._extra.txt 也必须是UTF-8编码 4. 删除词条,因为陈凯歌其实可能是因为人名关系导致切成词,可能会不受词典影响 5. 如果你非要用gbk 源码中 set_charset() 的参数就为 'gbk' 或默认的不要加上 'utf8'
...下面区分添加编辑时用相等判断,可根据情况自己改写,可能还有很多不完善的,请高手多指教。也可以到这里下载源码包http://my.php100.com/viewfile.php?file_id=14373 下载积分,是官方默认的,必须加,木有办法,抱歉了! 效果: ...
...导出TXT文件顺序是按照XDB里面的排列的 (我觉得导出文件可能有问题) 创建XDB文件是根据 foreach $rec[$k] 里面的数字排序的 那样 XDB和TXT里面的排序完全改变了 目前的情况是我导出TXT在创建XDB 分词速度比之前慢了2倍 这...
...辑, 因为 GET 到的值是多维度的,例如,用户可能检索 3, 也可以检索 3,5 ,也可能是检索 358 那么,如果GET option = 3 结果就应该是 option like 3 如果GET option = 3,5 结果就应该是 option like 3,5 且不...
导出TXT文件顺序是按照XDB里面的排列的 (我觉得导出文件可能有问题) 创建XDB文件是根据 foreach $rec[$k] 里面的数字排序的 那样 XDB和TXT里面的排序完全改变了 目前的情况是我导出TXT在创建XDB 分词速度比之前慢了2倍 这...
...行地址匹配,就是很多人员信息的地址,但在各数据库中可能填写的不太一样,人一眼就能看出是同一地址,但对于计算机很难,站长有思路吗? 谢谢! [/quote] 抱歉,目前没有这样的php工具. 建议设想能运行 gen_dict, 而 pscws4 ...
...指点,其实我的意思是比如有一条航线,其中这条航线有可能是2011-11-07起飞的,也有可能是2011-11-08起飞的,无论搜索2011-11-08还是2011-11-07都能搜到这条航线[hr] 其实我是想能不能把几个日期组合成“2011-11-07分隔符2011-11-08”这种...
...指点,其实我的意思是比如有一条航线,其中这条航线有可能是2011-11-07起飞的,也有可能是2011-11-08起飞的,无论搜索2011-11-08还是2011-11-07都能搜到这条航线[hr] 其实我是想能不能把几个日期组合成“2011-11-07分隔符2011-11-08”这种...
... ,問題是 638 行 : $rec['value'] = fread($this->fd, $rec['vlen']); 不可能超過 1gb 我有看到 gen_dict.c 但是是有有繁體utf8的 dict.txt 可以讓我自行編輯 麻煩 hightman 大大 [/quote] 这样的错误可能是运行的平台的字节序不一样或者.xdb文件已...
..._extra.txt 也必须是UTF-8编码 4. 删除词条,因为陈凯歌其实可能是因为人名关系导致切成词,可能会不受词典影响 5. 如果你非要用gbk 源码中 set_charset() 的参数就为 'gbk' 或默认的不要加上 'utf8' [/quote] 我那个演示页面就是直接...