[quote]压缩包中包括以下部分: etc/ - gbk 版本词典和rules.ini libscws/ - scws 库核心代码 phpext/ - php4 扩展代码 (注意必须是 PHP4) src/ - scws 命令行工具 --- Notice: src/ 下的 cmd.c 必须先编译 libscws/ 生成 libscws.a 才可...
en这样解决也比较简单可靠,又避免把scws装到/usr/local中去混杂在一起
对这个比较感兴趣 但是不怎么会用。还是用你们提供的在线演示的比较方便 呵呵
... 那应该是2者的词典不一样吧。。。你可以试试在不IGNORE的情况 下打印词情。
如果只要文章中有Linux出现就算是Linux相关文章的话,其实是不需要分词了,直接用全文搜索Linux就好了。 只是SCWS目前看前来它的自定义词典不支持超过3个字,如果可以的话,可以通过自定义“Linux优化”来指定分词
目前没有方法,我看只有采集 http://www.ftphp.com/scws/demo/get_tfidf.php 这个地址。 希望可以共享一下
[quote='fenglangyj' pid='3739' dateline='1364577940'] 哈哈,我也在找这个问题,终于找到答案了! 我有个字段叫“cat_id”,存的分类id列表用“,”分隔的,如"23,435,66,6",想要搜索出分类id为6的数据,就可以这样设置字段: [cat_id] index = se...
还是不明白! 你把这段文字用scws切割会有问题吗?如果你这段字是用空格或逗号分隔,那么你可以用 split 这个分词器啊。 搜索的时候搜索任何一个分割后的TAG都可以搜索到。