xdb 就是一个自己设计的用来保存常量数据库(基本上只读少改)文件格式,类似 gdbm, cdb 这些格式 xtree 是一个HASH + tree 的内存数据结构,可以方便的和 xdb 进行互换
函数 _xdb_read_data 在xdb.c中, memset((void *)((char *)buf + len), 0, 1) 造成内存溢出
恩,我也出现这样的问题,我编码是GBK,加载txt自定义字典后无法取得字典中的内容。 你这种写法txt会把上面的xdb覆盖掉的。 可以使用add_dict增加xdb字典的后面并优先。
在xdb.class.php中有一个函数Put,可以写入xdb词库.可是put的两个参数格式应该是什么样的?新人刚学php,看不懂的说,能不能有大神给我说一下.谢谢了
...12的,但是从 scws 主页上下载词典文件有好几个,dict.utf8.xdb,dict.xdb和dict_cht.utf8.xdb,我可以把这几个都装到etc文件夹里么?还有那几个ini文件也是一样的问题。 我已经在php.ini中这样配置了: extension = php_scws.dll scws.default.charse...
我举个例子吧 下面是用csws分词的结果,明显csws把email,网址给拆开了,还有标签没有去除,但是中文词是正确的分开了 postgres=# SELECT to_tsvector('zw_simple','pgsql中国社区论坛 http://www.pgsqldb.org:8079 chenaishen@263.net'); ...
需要增加一个新词“中国梦”。 使用的php XDB工具,增加词库后导入生成xdb文件。 重新生成coreseek的索引 索引的时候还是搜不出来这个词。 我确认使用的是utf-8 no-bom头的格式。 请问如何解决。谢谢
...以我只能用scws23了,但是词库我希望自己修改添加,但是XDB,这个格式我用了hightman提供的导入导出工具,就像[url=http://www.hightman.cn/bbs/showthread.php?tid=636]本网站的PHP的XDB导入导出工具[/url]里面提到的,我花了一些时间DEBUG后也用...
XDB不可轻易修改, 需要借助工具转换纯文本为xdb, 添加和修改词不太方便 还有二楼的代码是手册里的讲解,并不是要你抄进去. scws_get_tops() 返回的 attr 带有乱码是因为 windows 的 dll 较早所以才会有这样的BUG, 问题不大