...索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅支持 PHP 语言。API 简单清晰,...
...索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅支持 PHP 语言。API 简单清晰,...
...不仅占用了比较多的内存,而且也需要一定的时间(35万条数据约需要0.3~0.5秒左右)。 若此前 scws 句柄已经加载过词典,则此调用会先释放已经加载的词典。 [b]返回值:[/b]无 [b]错误:[/b] 如果加载失败,scws_t 结构中的 d 元素...
...前已兼容 cli/scws_gen_dict 所用的文本词库) ** 1) 每行一条记录,以 # 或 分号开头的相当于注释,忽略跳过。 2) 每行由4个字段组成,依次为“词语"(由中文字或3个以下的字母合成), "TF", "IDF", "词性", 字段时间用空格或制表...
...前已兼容 cli/scws_gen_dict 所用的文本词库) ** 1) 每行一条记录,以 # 或 分号开头的相当于注释,忽略跳过。 2) 每行由4个字段组成,依次为“词语"(由中文字或3个以下的字母合成), "TF", "IDF", "词性", 字段时间用空格或制表...
...前已兼容 cli/scws_gen_dict 所用的文本词库) ** 1) 每行一条记录,以 # 或 分号开头的相当于注释,忽略跳过。 2) 每行由4个字段组成,依次为“词语"(由中文字或3个以下的字母合成), "TF", "IDF", "词性", 字段时间用空格或制表...
...heck.php 命令行运行,用于检测您的 PHP 环境是否符合运行条件 - util/IniWizzaard.php 命令行运行,用于帮助您编写 xunsearch 项目配置文件 - util/Quest.php 命令行运行,搜索测试工具 - util/Indexer.php 命令行运行,索引...