可以的啊,用SCWS_XDB工具导出成TXT格式就可以编辑了. 但要注意词性最多2个字符,不可以是#和@和!,这三个有特殊函义
1. 請問idf怎麼算呀?這有什麼意思? 2. send_text之後,PHP中怎麼看到tf呢?[hr] 请问xdb里的tf idf是那来的计数据呢?
PSCWS23 词典文件如何制作 xdb导入导出工具导出信息如下 ---------------------------------- # WORD TF IDF ATTR ---------------------------------- 除了表头,一个都没导出。。。。。。
自定义词库加载不上,是什么原因呢? $cws = scws_new(); $cws->set_charset('utf8'); $cws->set_dict('/usr/local/scws/etc/dict.utf8.xdb'); $cws->set_dict(BASE_PATH.'admin/data/dict/wo.txt',SCWS_XDICT_TXT);
全是 /un 应该是词典不工作。这个词库应该是不依赖机器字节序的啊 TXT没有提供下载,但我们提供了PHP的脚本可以将XDB转换成TXT
ubuntu13.04是用amd64.iso在虚拟机里安装的 分词几乎都是un 而在另一个32位ubuntu上则正常 字典是完好的的xdb 顺便问下有无txt格式的字典下载,用scws_gen_dict生成不知道行否
...办法: 1. 你把词典删除就可以搜索单字了。etc/dict.utf8.xdb ... 2. 或者要强制检索单还可以考虑修改C代码的部分,修改 src/import.h #define DEFAULT_SCWS_MULTI 3 把 3 改为 15 然后重新编译并重建索引就可以了 3. 用自定...