[quote='hightman' pid='3961' dateline='1294120955'] 这个其实可以通过现有的 libscws 实现的,不过 phpext 里还没有提供。。。 [/quote] 这个是个蛮实在的功能,可以快速形成一个自定义的词库,如果可以,建议phpext提供
HI 在一个项目中使用到了scws PHP的扩展,感觉scws在分词效率和准确率,以及在返回结果的可用性上,显著高于其它的扩展,想问一下,scws是否可以提供Python的扩展?
[quote='hightman' pid='3433' dateline='1267266480'] 感谢提供。 [/quote] 好象不能下载了!
...直接可以把xdb导出为数组或把数组导入形成xdb词典,甚至提供标签决定导入的是否为临时内存词典(这样不会保存为文件,但仍然可以在当前进程中查询和使用该词典。
addweight似乎还是不大够 比如实现比较复杂的算法addweight就麻烦些 象http://www.ruanyifeng.com/blog/it/ 里面提到的用户投票算法是实际中应用比较广泛的 专门做个排序字段rank当然也可以 会不会有性能问题 不如系统级别的好吧