使用的版本是SCWS-1.2.2 我用自己的词库替换了dict.utf8.xdb,然后尝试分词“朝鲜近日播放的一个纪录片中,发现”,发现“纪录片中”在分词结果中丢失了 Array ( [word] => 朝鲜 [off] => 0 [len] => 6 [idf] => 0 [attr] => @ ) Array ( [word] => 近...
原先有计划要移到google code上,可是发现 scws 这名字被人给注册了。。。:(
xunsearch中的scws没有附带安装php扩展,你自行进入 packages 目录里解压 scws-1.1.9.tar.bz2 然后进入 scws-1.1.9/phpext 目录安装PHP扩展吧
解决了,是Greta的问题影响到了scws_free_tops,将项目设置改为MFC静态连接就可以了
对只要编译一下 scws 扩展就可以了。在 xunsearch-full-xxx 下面有 scws-1.1.8/phpext 在此目录下 phpize ./configure make && make install 即可,以上步骤根据不同用户权限略有不同。
第一次导入数据: Indexer.php --rebuild --source=mys ql://root:123456@192.168.1.1/shop --sql="select * from search_products1" --project=demo 成功! Indexer.php --rebuild --source=mys ql://root:123456@192.168.1.1/shop --sql="select * from search_products2" --project=demo 再次导...
还是不明白! 你把这段文字用scws切割会有问题吗?如果你这段字是用空格或逗号分隔,那么你可以用 split 这个分词器啊。 搜索的时候搜索任何一个分割后的TAG都可以搜索到。
longhtml感觉挺强的。你知道这套系统的分布式索引怎么建立吗?翻来翻去翻不到,版主貌似藏起来有一段时间了。
直接修改代码 sdk\php\util\XSDataSource.class.php 482行 $host .= (isset($param['port']) && $param['port'] != 3306) ? ':' . $param['port'] : '[b]:3399[/b]';