[quote='hightman' pid='3622' dateline='1278485881'] 目前没有这个内置选项,建议在透过scws_get_result()取数据时自行排除... [/quote] 建议在透过scws_get_result()取数据时自行排除... 不是很理解啊。麻烦站长解释一下啊。
[quote='admin' pid='2688' dateline='1291049346'] 词库没有正确加载,你检查一下 /usr/local/scws/etc/ 下的 .xdb 的文件属性,默认.tar.bz2 解开有可能是600,建议 chmod a+r /usr/local/scws/etc/* [/quote] 非常感谢,被这个问题折磨了1天,原来是权限问题...
如下: 自定义分词字段 b_split_title [b_split_title] type = title tokenizer =coupon $search->setQuery( '(b_split_title:宠物 OR 宠物 ) AND b_city_id:31')->setlimit(1000000)->setFacets('b_tag_id')->search(); 打印: Xapian::Query(((or:(pos=1) AND 宠物:(pos=2) AND and:(pos=3) ...
比如说“这本书”,在用C语言编译调用scws分词结果为"这/本书",但是编译为php扩展后调用,结果为"这本书",没有分掉,同一份代码同一个词库同一个规则集,为什么会出现不一样的结果?
词典没有正确放置或设置吧,看看你的 php.ini 中关于 scws.default.fpath 的设置
...知道英文不需要词典 关键就是这个不需要词典 他的英文分词就没办法控制了,比如我要做计算机专业的分词,其中很多就需要用到一些专业英文单词分词。比如一篇文章是linux相关的我想让“linux”这个词优先被选出来,我在词...
...作品,就必须经过作者授权,没有授权就是侵权。 [b]分词后:[/b] 陈凯歌 并 不 是 《 无 极 》 的 唯 一 著 作 权人 , 一 部 电 影 的 整 体 版 权归电 影 制 片 厂 所 有 。 一 部 电 影 的 作 者 包括导 演 、 摄 影 、 编 剧 ...
楼上你的情况是因为你对API使用不正确, scws_get_result 应该循环调用 while ($words = scws_get_result($sh)) { foreach ($words as $word) { print_r($word); } } 此外, 繁体词库很不完善, 缺词太多而且有一些词也不正确
全是 /un 应该是词典不工作。这个词库应该是不依赖机器字节序的啊 TXT没有提供下载,但我们提供了PHP的脚本可以将XDB转换成TXT