汗,看来就是因为“\r”问题。 hightman老兄,你是用那个来判断换行的?\r\n ?[hr] 测试了一下windows下你使用的是“\n”,linux下你是不是使用了"\r\n" ? 汗,本地windows,服务器linux........ 继续测试。。。
...http://www.xunsearch.com/demo/search.php?q=%21@@&f=_all&s=relevance 可以测试这个看,可以考虑强行判断,不包含就让搜索词为空,进行相应处理 如 if(!preg_match('/([0-9a-z]{2,2})/i')) Header('Location: /'); 3、继续搜索词过滤 AND OR如果位于检索词末...
scws_set_multi复式分割不起作用,同样的windows .dll测试是可以正常的。 以下是测试代码,是在你的文档例子代码上加入了 scws_set_multi(s , 1); [code] #include #include main() { scws_t s; scws_res_t res, cur; char *text = "上海市"; if (!(s = scws_new())...
[quote='hightman' pid='6629' dateline='1312967825'] 在 demo 中测试 v,n 结果只有 n 的,测试~v,n,vn 结果还是会出现包含这些词性的。 这。。。似乎完全有BUG,稍后查。 [/quote] 感谢 magike 网友再度来信指出,目前已经在CVS中作了修正,预...
开始一直在取舍,最后敲定了scws 经过部分测试,scws的分词还是比较准确的, 当然还是需要大量的数据测试, 以及一段时间的试运行才会有更好的结果。 就是社区稍显冷清。。呵呵 新项目内部命名为super.maria 。 策划了有一...
...,地名,数字年代等规则识别来达到基本分词,经小范围测试大概准确率在 90% ~ 95% 之间,已能基本满足一些小型搜索引擎、关键字提取等场合运用。 切词效率测试(UTF-8编码,随机从天涯抓取了一个连载页面测试结果, 45Kb左右的...
getSocket() 方法 public mixed getSocket() {return} mixed 连接标识, 仅用于内部测试等目的 源码: sdk/php/lib/XSServer.class.php#L232 (显示) public function getSocket(){ return $this->_sock;} 获取连接资源描述符