...测试是否可以调用。这个可以,但分词结果不对,猜测是词库调用的原因,但我把xdb放到php同目录下或者调用/usr/local/scws/etc/下的词库,都得到scws_set_dict(): supplied argument is not a valid scws handler resource。这是我php设置寻址有问题,...
这个分词系统虽说是简易的,但是我觉得还是过于强大了 譬如说像我们行业类网站,要分的词不多,屈指可数,也可能就几百个 如果能提供分词方法,和一个自己可以添加的词库就好了 呵呵 谢谢
...不足的是: 25吨,16千克 不能分成整体的词,如果把25吨放入词库确实也能解决问题,只是现实中可能有5~1000吨,总不能一个一个都放进去,所以还是建议在算法上增加此功能比较理想
...估值是不是偏低了?我用咱们网站提供的TF/IDF计算器计算词库中的词,发现TF/IDF已经有明显变化,距上次更新已经过了10个月,变化还是非常明显的。hightman预计多久会更新一次词库? 最后,我对github上提供的 get_tfidf.php 中get_...
...估值是不是偏低了?我用咱们网站提供的TF/IDF计算器计算词库中的词,发现TF/IDF已经有明显变化,距上次更新已经过了10个月,变化还是非常明显的。hightman预计多久会更新一次词库? 最后,我对github上提供的 get_tfidf.php 中get_...
...'5070' dateline='1383632500'] 全是 /un 应该是词典不工作。这个词库应该是不依赖机器字节序的啊 TXT没有提供下载,但我们提供了PHP的脚本可以将XDB转换成TXT [/quote]
我手动导入了一批搜索词, 但由于相关搜索和热门搜索都是从搜索日志数据库中读取的, 导入的词库中难免有一些敏感词,或者不想让其出现的词, 请问怎么才能屏蔽这些词语呢, 多谢了。。。