富贵鸟(Y1W) 类似这样的名称分词的结果 却是 富贵 鸟(Y1W) 最关键的 Y1W 没有被分出来。 而且 六灯夜视D502 这样的名称 也只能分出 中文, 英文和数字没有被分出来,是为什么?请教高手。 我用的是SCWS 扩展 PHP 5.2.x 版二...
我在自己的网站上使用scws做分词,当文章中有类似PC-BSD之类有连字符的英文词时,都分成类“PC - BSD”,但这是个软件名,本不应分开,英文中加-号的一般都视为一个词,按理说不应分开的,有什么方法解决吗?
Indexer.php 你可以在 sql 语句中指定 offset 和 limit --sql="select * from cdb_posts limit 999999999999 offset 5000000" 类似这样,OFFSET 不能单用必须配合 limit
...$count = $xs->search->getLastCount(); 这时$count不准确,我看过论坛类似的问题,不过没有多的addRange,另外想再问下 $query->addRange('c1',$c1,$c2)->addRange('d1',$d1,$d2)这样写法会不会比上面的效率高?只是这种写法有时比较难写,因为有时要判断一些...
...rch既然是出色的全文搜索引擎,那么应该具有的功能是:类似百度或者谷歌的,那么应该优先可以收录HTML页面 但是目前只做到了结合SCWS做数据库的全文检索啊!也就是说Xunsearch只是 一个站内搜索或者是只是一个能够检索...
查询业务类似于 (filed1:1 or filed1:2 or filed1:3)and (filed2:1 or filed2:2 or filed2:3) and (filed3:1 or filed3:2 or filed3:3) 使用setQuery 出现异常 DATA/NAME too long 最后使用addQueryString拼装语句的方式 但是如上所述的逻辑根本无法达到括号中...
...里,setFuzzy设置false即关闭模糊查询,但出来的结果还是类似用了LIKE这种形式,那么迅搜里的“模糊查询”和“精准匹配”是什么意思? 后来看到文档说迅搜中的setFuzzy设置true相当于使用了OR,那么设置为false的话,用AND了吗?...
... 我就是想有一段文字,然后根据这段文字分词,实现类似tag这样的功能。其实和引擎关系不大,如果没有这个功能的话,只有去另外安装。。比较麻烦
...显时效性可以加权,如‘凤姐’,‘芙蓉姐姐’, 有点类似百度风云榜的感觉; 单纯简单的分类已经有点落伍,这个自动分类必须足够精确, 而做这个的目的是为了下一步精准内容推送。用户在看到‘相关内容推荐’,‘相...
... limit --sql="select * from cdb_posts limit 999999999999 offset 5000000" 类似这样,OFFSET 不能单用必须配合 limit [/quote] 呵呵 原来如此 非常感谢,数据已经导入了500万左右,做了测试,真是相当快,最慢的也就1秒就有结果了,顶起~~