...的词库,不想要那么多大的词库,为什么我导出词库重新生成之后会出一大堆错误,在make_xdb_file.php以下两行出错。 if ($v['part']) $flag |= 0x02; $data = pack('ffCa3', $v['tf'], $v['idf'], $flag, $v['attr']); 我的词库是UTF8的。 我提供一个导...
词库在 $prefix/etc/dict.utf8.xdb 您用制作好的 scws 词库支替换它即可,词库生成办法要看看 scws 的帮助,此外字符集必须是 UTF-8
目前不行。只能自己生成 scws 的词典并放进 $prefix/etc/dict.utf8.xdb 覆盖 词典可以自己先制作TXT格式在利用SCWs提供的工具转换成XDB格式 [url]http://www.hightman.cn/bbs/showthread.php?tid=712[/url] 这个贴子后面有讲到
...一些时间DEBUG后也用不了(导出txt总是内存溢出,而由txt生成的XDB在scws23也无效)!最后,我放弃了XDB,但是嘛,直接用TXT也不好,内存占用太大,效率也低。后面,我分析了一下demo程序,就借用作者的程序形成了sqlite的工具了...
[quote='heraldboy' pid='3191' dateline='1246183006'] 谢谢,我找到了,但是我不懂C,现在用的是PSCWS/4.0,我希望有个PHP的字典格式转换程序,我下午分析了一下你的读取代码,本人水平有限,感觉很难。 如果你能提供一个windows下的可执...
需要增加一个新词“中国梦”。 使用的php XDB工具,增加词库后导入生成xdb文件。 重新生成coreseek的索引 索引的时候还是搜不出来这个词。 我确认使用的是utf-8 no-bom头的格式。 请问如何解决。谢谢
...码的,已经分别试过使用PHP版词库工具以及scws-gen-dict来生成词库,但是结果都一样。 有什么可能的原因吗? 谢谢 [hr] 我使用的代码如下, dict.utf8.xdb是我自己的词库 //实例化分词插件核心类 $so = scws_new(); //设置分词时所...
...居然有个错误的词叫“民医院”!! 建议删除该词重新生成词典或,写一个附加词典标记为删除。内容如下,保存为名字 del.txt,然后在分词前加入一句 $scws->add_dict('/path/to/del.txt', SCWS_XDICT_TXT); 如果您不会制作词典可以从 http://...
...d='4506' dateline='1303195392'] 新版会开发一个API直接在函数里生成临时词库供调用。 [/quote] 感谢管理员回复. 其实我的意思大概可以简化为: 最长分词模式. 分出来的词要达到符合语法的最长.这个难度估计不小,呵呵,也可能是比较...