...采用 C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅...
今天旗下的http://www.anetb.com需要一个支持中文分词的搜索页,原drupal的太烂了, 我的做法是:结合xunsearch实现drupal commerce下的中文搜索 测试页:http://www.anetb.com/tsearch/demo/commerce/search.php , 可输入“奶粉”,我的站准备做这...
...! 还有一个问题想要请教哥们: 现在需要对一批中文的文本文件建立检索功能 现在的初步想法是 使用util/Indexer.php一行一行的将所有文本信息全部导入xs-searchd的一个project实例中 (我对php不是特别熟悉 又需要尽...
...人。共同学习才能共同提高,取长补短,分词是很重要的中文信息分析基础技术,中国的信息化建设要达到国际水平,分词技术一定不可以少的,一定要有很多的具有奉献精神的有志之士共同努力,hightman就是我学习的榜样:)
...3. $prefix/sdk/php/util/RequiredCheck.php -c gbk ~~~ 运行结果输出的中文编码默认为 `UTF-8` ,如果您使用 `GBK` 环境请在运行命令最后加上 `-c GBK` 。 运行结果会给出一个可视化的表格说明检测结果,并在最终给出检测结论,告诉您是否符合...