你好,有在吗,请问你们的程序能不能包装一个c版本的dll,让别的程序调用.不只是PHP
那个属性对分词效果有一定影响的,TF主要用于词的切分,IDF用于统计,词性就用在取TOP时过滤或标注上。 最好是基于现有的词典去补充,你重建一个的话数据又都没有效果可能会比较差。SCWS主页上有一个TF/IDF计算器,你可...
我在本地系统 进行 字典更新。然后上传到FTP 。但是 FTP 里面显示的时间和 服务器显示时间不一样。不仔细还真看不出来这个问题。
你好,我测试了一下,消除标点符号时":"还会显示,其它标点就可以。[hr] “{}]好像这几个都清不了
我也发现是这样的问题,我现在最新1.1.7,自定义一个词库后(),原词库就没有用了。 比如: new.txt(这个文件里,试过一个词也没有、添加个别词两种情况); $so = scws_new(); //$so->add_dict('', SCWS_XDICT_TXT); $so->send_text('广州...
[code][/code] 加了。不过出现 [root@beihai365 365search]# php test.php dict content: 哦你呀 武不只 我是谁 精武英雄 1.0 1.0 tq ------- Array ( [0] => Array ( [word] => 精武英雄 [off] => 0 [len] =>...
下了最新的1.1.3,但是我在windows下winrar解开,里面空的,这个压缩包是不是有问题啊?1.1.2是正常的。呢个对应的ut8的压缩包也不对
...下:“最多只支持2位” 这种限制是在 /etc/rules.utf8.ini 中定义的,还是在源码里处理的? 如果要修改,使其支持更大长度的分词,该从哪里入手呢? 麻烦了!
1. 你的词典只有“再试一个”这个词,当然就只有它了 2. scws_new/scws_free 是C 里的函数,在PHP中是 scws_open/scws_close 建议在PHP中用对象方式使用 scws 即 $so = scws_new(); $so->set_charset('gbk'); $so->set_dict(...