我的PHP是5.4.3,看到也只有SWSC的版本接近的也只有5.3.x 打开PHP报错缺少php4ts.dll 试了下第一个例子 报错,Call to undefined function scws_new() 小白一个,求帮帮忙啊~~
想做自定义词库的功能。 哪位大侠,是否可以告知, http://www.xunsearch.com/scws/demo/get_tfidf.php 的算法。 谢谢
Highyman: 能請問一下,我可以將 SCWS 用在繁體中文的分詞上嗎?如果可以,我應該如何產生繁體中文的分詞詞庫呢? 我預備使用 UTF-8 作為中文編碼而非 Big5。 謝謝你的分享。 Mark
...我定义 电脑 dn dn 就是我自定义的词性。这样我在scws 分词后,程序中可以用来判断。 不知道是否可以目前? 感谢hightman 大哥 提供的那么好用的分词工具。
如果你了解scws就会知道它其实对散字也是自动二元处理。 你所谓的一元是一个字一个词?你也可以拓展 XSTokenizer 自己实现分词