支持是支持的,但数字字母最多只支持2位。 你说的情况其实切分成“斯巴鲁+WRX”并不会有多大问题吧。 像 Q币 QQ空间 这样的都是可以支持成词的。
“枪王之王”这四个字我原来以为可以分为“枪王”.....。但是系统分成了”枪“、”王之王“,显然在查询的时候用户很有可能只是输入”枪王“作为关键字。而我自己的系统是不查询单字的。在自定义字典中又不知如何操作...
其实在 xunsearch 的世界里,你的情况完全可以这样作。。。。 假设分类字段 catalog ID为 A 下的子分类为 AA,AB,AC ... 那么你给子分类的数据建索引时,加入索引词 A,通过 XSDocument::addTerm 实现。 那么将来搜索 catalog:A 就相当于包...
...拼写示例则简化,并直接传入 Query 语句进行测试 * 您也可以例句用 `util/Quest.php demo --correct ` 进行测试 */ $search->getCorrectedQuery('cs'); // 通过声母缩写得到建议: "测试" $search->getCorrectedQuery('ceshi'); // 通过全拼缩写得到建议: "测...
关于has_word, 不是很明白你的意思, has_word 用于检测当前文本中是否包含这些属性的词。 scws_get_words 是按词性返回分词结果,标点的词应该默认应该是 un 或 # 之类可以自行排除。
util.searchskel直接生成默认的搜索 代码 ,你在那个基础 上修改就行了。 也可以参见util.Quest里的写法,真要简单搜索 也就大概下面几句就行了: [code] $xs = new XS('demo'); $docs = $xs->search->search('关键字'); print_r($docs); [/code]
subject 是 FULL 的?FULL的话视为布尔字段了所以不会记录到日志中。 我建议你另外开辟一个字段,内容可以和该字段一样,但索引方式不一样来处理。有所冗余,但也是目前最简便的办法吧
[quote='hightman' pid='8771' dateline='1330917695'] 不能,空格都略过了 [/quote] 谢谢管理回答 噢噢!~感觉如果可以保留的话会方便很多!~
搜索其实是很快的,只是传输结果集实在是太慢了,个人觉得应该提供另外一种模式:先把要发送的所有记录或者部分记录打包,然后统一分段发送,这样可以减少发送端和接收端的网络io操作次数
...”。求教啊!!! 另外官方自带的词典的四个字词语可以完整的分词,但我扩充字典后,就无法对任何字典里包含的四个字进行分词。