关于has_word, 不是很明白你的意思, has_word 用于检测当前文本中是否包含这些属性的词。 scws_get_words 是按词性返回分词结果,标点的词应该默认应该是 un 或 # 之类可以自行排除。
[quote='hightman' pid='4118' dateline='1300201925'] set_dict("d:\test.xdb", SCWS_XDICT_XDB); 应该是这样而不是加引号 [/quote] 哦,写错了,确实是按斑斑写的呢样调用的,换成版版得字典就没问题,用我自定义的结果就是空[hr] 还有 set_dict("d:\test....
没有特别去开进程来修改索引库阿. 我这里只是在数据有更新时才会执行性一次 --rebuild索引, 都是手工来做的. 我们现在的处理方式: 凌晨4:00 固定的去重起xunsearch, 如果没有做, 凌晨4:00多就挂掉。很奇怪,每天都这样。。
util.searchskel直接生成默认的搜索 代码 ,你在那个基础 上修改就行了。 也可以参见util.Quest里的写法,真要简单搜索 也就大概下面几句就行了: [code] $xs = new XS('demo'); $docs = $xs->search->search('关键字'); print_r($docs); [/code]
[quote='hightman' pid='1622' dateline='1355128458'] 是服务端崩溃自动退出又重新开启了:(,具体原因是产生了代码为6的信号,即 SIGABRT,应该是 xapian 内部错误调用了 abort()。 [/quote] 那要如何处理呢?
最近在做个项目,用到了分词,找了一下,发现这个,很好. 遇到一个问题, 命令导出xdb到txt,只导出了这个 # WORD TF IDF ATTR 请问这是咋回事