词典没有正确放置或设置吧,看看你的 php.ini 中关于 scws.default.fpath 的设置
顶一下,再问一遍~ configure: error: Invalid xapian library, maybe not do the patch with scws?. 请问这是为什么啊?是不是我不小心运行那个patch的sh脚本啊!!
tokenizer 分词器 默认为 default 采用内置的功能强大的 scws 分词,适合绝大多数字符串字段。也可以指定自定义分词器,格式为 name 或 name(arg) 两种形式,其中 name 是分词器名称,arg 则是传递给分词器构造函数的参数。自定义分词...
那我将自定义词典的方式变成利用scws提供的方法扩充内置词典,是否就能够让自定义词被search.log记录的可能性增大呢
...。 我是使用[color=#FF0000]繁體字庫[/color]。 版本是:php_scws.dll(2)/Windows/PHP 5.2.x [php] [/php] 結果在下面: [code] 原始文字:這個文件是為了測試英文:James是一位研究生。 這 => r 個 => q 文件 => n 是 => v 為了 ...
...pid='255' dateline='1322196172'] 还是不明白! 你把这段文字用scws切割会有问题吗?如果你这段字是用空格或逗号分隔,那么你可以用 split 这个分词器啊。 搜索的时候搜索任何一个分割后的TAG都可以搜索到。 [/quote] 呵呵,管理...
...全不准确,我可以确认是bug,我有一个同事独立安装xapian和scws,利用lib/xs.php的内容,作了修改,得出的值明显是准确的.也就是xapian本身可以得出相对正常的结果,但是使用xunsearch后,在多重排序后,结果不正确 [/quote] 是阿,这个问...
...有被反映到search.log, 猜测search.log只记录系统内置词(scws) 建议如果用户自定了dict_user.txt也一并记录 因为用户自定义的词一般更贴近实际业务,对访客更有帮助和价值
... index=full就行,从实验看,需要设置成index=self(默认采用scws分词),这样就达到了目的。 不过还存在一些问题: 1.有些字段要存两份,分别应对排序和加权场景; 2.对于无分类的情况(我存入的分类id为0),无法实现降权,所...
使用scws-1.2.2时,遇到这样一个问题,对于以下两个句子 “情歌接龙大串烧,情人节好礼多多” “武松杀嫂雕塑是艺术,还是恶俗?大家怎么看的?” 没有加上rule.utf8.ini时,得到如下结果 情歌/n 接龙/n 大/a 串烧/v ,/un 情人...