关于has_word, 不是很明白你的意思, has_word 用于检测当前文本中是否包含这些属性的词。 scws_get_words 是按词性返回分词结果,标点的词应该默认应该是 un 或 # 之类可以自行排除。
[quote='hightman' pid='4118' dateline='1300201925'] set_dict("d:\test.xdb", SCWS_XDICT_XDB); 应该是这样而不是加引号 [/quote] 哦,写错了,确实是按斑斑写的呢样调用的,换成版版得字典就没问题,用我自定义的结果就是空[hr] 还有 set_dict("d:\test....
util.searchskel直接生成默认的搜索 代码 ,你在那个基础 上修改就行了。 也可以参见util.Quest里的写法,真要简单搜索 也就大概下面几句就行了: [code] $xs = new XS('demo'); $docs = $xs->search->search('关键字'); print_r($docs); [/code]
[quote='hightman' pid='1622' dateline='1355128458'] 是服务端崩溃自动退出又重新开启了:(,具体原因是产生了代码为6的信号,即 SIGABRT,应该是 xapian 内部错误调用了 abort()。 [/quote] 那要如何处理呢?
subject 是 FULL 的?FULL的话视为布尔字段了所以不会记录到日志中。 我建议你另外开辟一个字段,内容可以和该字段一样,但索引方式不一样来处理。有所冗余,但也是目前最简便的办法吧
还可以这样索引啊,学习了。 [quote='hightman' pid='366' dateline='1324273957'] 字段多个值是什么意思呢? 这段值可以只有一个,但可以索引多个词汇。 比如你有一个字段叫 date 存的是 2011-11-07 那么你可以在索引的时候通过 $doc-...