好像已经有人做过了,google code 上 Google: python scws 就可以查到了
全是 /un 应该是词典不工作。这个词库应该是不依赖机器字节序的啊 TXT没有提供下载,但我们提供了PHP的脚本可以将XDB转换成TXT
...unsearch-full-latest.tar.bz2[/url] 代码仓库:[url]https://github.com/hightman/xunsearch[/url] 修改日志:[url]https://github.com/hightman/xunsearch/commits/1.4.7[/url] CHM手册:[url]http://www.xunsearch.com/download/xs_php_manual.chm[/url] Xunsearch 是免费开源的专业全文...
多谢指出。因为开发时是分开的没有压成 XS.php 单独一个文件。 可以考虑在输出XS.php时移除autoload功能
自己做个扫描程序,以文件名为key,内容为body建索引不就好了? xunsearch 本身并不是完整的搜索引擎,它是提供核心组件并附带一些例子
[quote='hightman' pid='1358' dateline='1350873104'] 这不太科学啊,最好给个页面看看。是不是因为缓存? [/quote] 我重启了一下,好了。。。
[quote='hightman' pid='3961' dateline='1294120955'] 这个其实可以通过现有的 libscws 实现的,不过 phpext 里还没有提供。。。 [/quote] 这个是个蛮实在的功能,可以快速形成一个自定义的词库,如果可以,建议phpext提供