导入数据是你自己通过API提交的,Indexer.php 只是一个工具帮你全部一次性导入,以后的数据你要自己再设法导入,或者直接用 Indexer.php 重建
...uild() 关闭它? [/quote] 没使用beginRebuild() ,系统会不会自己在一端时间后,或者发生什么状况后自己启动beginRebuild() ,反正就是增加不进去,一直在队列里面
可以的。但是实现代码要你自己去写。例如你可以用CURL去抓取网页并分析网页中的链接,再去抓取,存到你的搜索项目中即可搜索。代码可参照sphider,数据存储的字段也可以参照sphider。 xunsearch只是提供了一个快速搜索的解决...
目前不行。只能自己生成 scws 的词典并放进 $prefix/etc/dict.utf8.xdb 覆盖 词典可以自己先制作TXT格式在利用SCWs提供的工具转换成XDB格式 [url]http://www.hightman.cn/bbs/showthread.php?tid=712[/url] 这个贴子后面有讲到
en Indexer.php 里默认就是设为0的啊,自己做导入程序的话默认是5秒,如果时间很长需要自己设置 0 表示永不超时,直到主动关闭。
...文件名跟这个一样,只是把post_content全改成了content(我自己的字段就是content)。但是不晓得怎么不能用,总是“忽略无效的过滤器。。。”(本人不会php,用我自己会的语言来弄的话又加一步,不太方便,抱歉)! 我自己...
...] 那不会吧,PHP的错误日志有没有呢。。。这个脚本对我自己也没用,你或许应该参见一下帮助,是否字符集正确?用法参数是否正确,实在不行自己加断点简单调试一下。 [/quote] 我知道,不能用于PSCWS23里的词典。可用于 SC...
[quote='hightman' pid='705' dateline='1333591381'] 自己做个扫描程序,以文件名为key,内容为body建索引不就好了? xunsearch 本身并不是完整的搜索引擎,它是提供核心组件并附带一些例子 [/quote] 问题是如果是扫描程序,并不能做到实...
...长.这个难度估计不小,呵呵,也可能是比较不现实的需求. 自己架设scws分词库程序当然可以导入自己的词库,但是不是每个人都愿意这么做.在线api还是很有优势的.
... xdb词典导入导出工具,已經完成 UTF8 chs + cht 的合併,也自己加了一些詞, 目前使用中,感覺很好。 想回應的是自己在合併過程中,碰到的情況。 在個別將 dict_chs(t).utf8.xdb 導出,倒入資料庫處理時發現,有重複的字詞,這...