这个就是提示文件 找不到,既然 你把 lib 加进 include_path 你不如直接 require_once 'XS.php' BTW:没接触过PHP直接用XS恐怕很难。
好吧,我考虑加一个。。。 最新 1.4.9-dev 版新增接口: XSSearch::getSynonyms(string $term); 也可以用 util/Quest.php --list-synonyms=??? 来列出 ??? 的全部同义词
[quote='whoneed' pid='443' dateline='1326771261'] 这个是买的VPS,里面数据的。重装有些困难啊。 我本地的32位跑的都正常。。 郁闷。。。[hr] 管理员,请问还有其他什么方法可以解决吗?[hr] 有没有什么办法,在其他机器上编译好了。...
你在include/里放的 php 是直接运行的吗?也就是起始目录位置了? 你可以统一只放一个词典位于上层的 etc/ 然后用绝对路径访问词典或在同不的目录用不同的相对路径啊, 像第一个情况是 ../etc/ 第二个应该是 ../../etc
只有在完全空缺词库的情况下才自动加载默认词库,只要你曾经add_dict,或set_dict那么就不会加载默认词库了。这并不算BUG吧。 这是给懒人设定的规则,当你试图设置词典时那就完全交给你决定,而不是系统强制无论如何都先加...
hightman, 规则集配置文件的说明文档在哪里? 没有说明文档根本就没有办法是用哪个规则集啊, 很多东西都猜不出来. 停用词怎么添加和使用整了一天了都没搞明白怎么弄. 希望给一份规则集的说明文档, 万分感谢.
TF就是词频率,也就是这个词在各种语料中出现的机率权重。(越经常出现的越高) IDF是逆词频率,也就是说这个词更重要(因为罕见一些);具体参见:http://baike.baidu.com/view/1228847.html 并没有很固定的算法,SCWS中的tf/idf均...
是你自己搞错了! “是一”本身不是词,只是因为二元结合法所以scws自动将其合成为一个词。 复合分词是对原本是词的长词情况处理的,比如”中国“可以切成”中“+”国“+”中国“ 你的问题必须是 [code] $tk = $tokenizer->s...