[quote='fenglangyj' pid='3739' dateline='1364577940'] 哈哈,我也在找这个问题,终于找到答案了! 我有个字段叫“cat_id”,存的分类id列表用“,”分隔的,如"23,435,66,6",想要搜索出分类id为6的数据,就可以这样设置字段: [cat_id] index = se...
基本上会保证在相对前面,但内部用BM25计算的,如果有些文章包含的词次数更多可能会在前面吧。 最好给出例子和实际页面。
[quote='hightman' pid='3622' dateline='1278485881'] 目前没有这个内置选项,建议在透过scws_get_result()取数据时自行排除... [/quote] 建议在透过scws_get_result()取数据时自行排除... 不是很理解啊。麻烦站长解释一下啊。
安装scwc后,可以进行分词,但返回格式里没有对应词的id,这样我就不能拿词id查询对应的文字id 难道我还要拿分词再查找对应的词库来获取id?这样就太慢了,估计不是这样做的,不知道大家怎么解决这个问题的。 [php] Array ( ...
本来按照Hightman的说明。我的文件放置的结构是这样的: “etc”:放置“自定义词典” 我的网站的目录结构是这样: [code]www【根目录】 |---mySite【子目录】 |---include【子目录】 |---使用分词功能的页面.php...
问一下,在xapian中document对象有termlist_begin()方法来对该文档进行索引词遍历,在xunsearch里面有没有对应的api呢,在xsDocument类里我找到的方法getAddTerms()似乎只是针对附加索引词进行查找。有没有对某个文档的索引词列表进行遍历...
...N个,这些表的结构是完全相同的。 请问在这种情况下,如何最合理地使用xunsearch建立索引呢?主要是可以满足日后方便地进行[b]批量[/b]索引重建(更新)的需求;检索出结果后,可以反向定位到具体是哪个分表,以便读取详...
每个文档(记录)都有一个字段:分类(cate,值为数字),现在我要搜索所有属于分类 1 或分类 5 或分类 3 的文档,我使用的搜索语句是 cate:1 OR cate:5 OR cate:3 ,目前看来没有问题。但是如果我要搜索的分类很多的话,构造的搜...
oh 谢谢!我试试[hr] require_once '/mnt/search/sdk/php/lib/XS.php'; $xs = new XS('test'); $skey = $_GET["skey"]; $search = $xs->search; $docs = $search->setQuery($skey."type:1")->search(); print_r($docs); 已经 [type] type = string index = self 了 但是搜索不到什么 改成...
[quote='hightman' pid='639' dateline='1331712167'] 那你说的应该是XML数据 源,HTML不好当数据 源吧 [/quote] 呃,H大,我想到的是,Xunsearch既然是出色的全文搜索引擎,那么应该具有的功能是:类似百度或者谷歌的,那么应该优先可以...