...务端的词典路径 $mode int 词典类型, 常量: SCWS_XDICT_XDB|SCWS_XDICT_TXT|SCWS_XDICT_MEM {return} XSTokenizerScws 返回对象本身以支持串接操作 源码: sdk/php/lib/XSTokenizer.class.php#L299 (显示) public function addDict($fpath, $mode = null){ if (!is_i...
...的时候出现了递归的堆栈溢出。但是我将该txt字典转换成xdb文件后再次调用,就不会出现该问题了? 但是如果资源使用txt文本,参数使用SCWS_XDICT_XDB,也不会有问题。 图片在附件中! [hr] 因为我这边是将scws的源码直接加入...
这个应该没问题吧,我用你们提供的gen_scws_dict 在linux上按照你们给的方法转换的,没有报出错误! 不过后来我将转换后的xdb用你们提供的php dump_xdb_file.php 将其转回发现少了7条。
...以我只能用scws23了,但是词库我希望自己修改添加,但是XDB,这个格式我用了hightman提供的导入导出工具,就像[url=http://www.hightman.cn/bbs/showthread.php?tid=636]本网站的PHP的XDB导入导出工具[/url]里面提到的,我花了一些时间DEBUG后也用...
...放后在。 $scws->add_dict(ini_get('scws.default.fpath') . '/dict.utf8.xdb'); $scws->add_dict('/path/to/dict.self.txt', SCWS_XDICT_TXT); 那么就是后面的 dict.self.txt 优先查询,如果 dict.self.txt 中不存在相关记录才会往回查 dict.utf8.xdb,反之也一样
[quote='hightman' pid='4118' dateline='1300201925'] set_dict("d:\test.xdb", SCWS_XDICT_XDB); 应该是这样而不是加引号 [/quote] 哦,写错了,确实是按斑斑写的呢样调用的,换成版版得字典就没问题,用我自定义的结果就是空[hr] 还有 set_dict("d:\test....
恩,我也出现这样的问题,我编码是GBK,加载txt自定义字典后无法取得字典中的内容。 你这种写法txt会把上面的xdb覆盖掉的。 可以使用add_dict增加xdb字典的后面并优先。
我举个例子吧 下面是用csws分词的结果,明显csws把email,网址给拆开了,还有标签没有去除,但是中文词是正确的分开了 postgres=# SELECT to_tsvector('zw_simple','pgsql中国社区论坛 http://www.pgsqldb.org:8079 chenaishen@263.net'); ...
我想问一下,自定义的词典里,只有word,没有其它TF、IDF、Attr可以吗?能生成吗。 因为我试了直接加载TXT的太慢了,想转换成XDB。