... C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 500 万网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅支...
...化代码兼容性 - 增加用户案例文档:USERCASE - 改进自定义分词器 XSTokenizerScws 接受参数作为复合等级 - 升级 libevent 到 2.x 版 - 修正中文 stopwords 不生效的问题 - 取消恼人的 NODB(S#506) 错误提示 - 新增获取文档匹配词表的接口 [XSSearch:...
... C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 500 万网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅支...
... C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅支持...
... C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅支持...
.... 修改 XSTokenizerScws 以支持项目级自定义词典的 6. 自定义分词器的字段也能参与权重计算了,在 ini 指定 `non_bool = yes` 7. 采用 bootstrap 框架美化 util.SearchSkel 生成页面效果 官方网站:[url]http://www.xunsearch.com[/url] 下载地址:[url]h...
... C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅支持...
...Search(); $index = $db->getIndex(); // 如有必要,还可以获得 scws 分词对象 $scws = $db->getScws(); ``` #### 使用 xunsearch DebugPanel 为便于调试,还提供了一个 `hightman\xunsearch\DebugPanel` 对象,可以集成到 debug 模块中, 可在调试工具条和面板中显...
...题 * 2011-09-14 16:40:13 +0800 a22ff3f hightman: PHP-SDK: 增加自定义分词器参数编码恒为 UTF-8 的说明 * 2011-09-14 15:11:09 +0800 94fb63f hightman: PHP-SDK: php 的最低版本要求提高到 5.2.0 * 2011-09-14 11:44:34 +0800 5c77bae hightman: PHP-SDK: 参照百度调整骨架代...
...道迅搜这个开源程序,因为我做的一个插件就是用迅搜的分词系统做的。 先按官方的操作,把程序安装到服务器上。我的部署是这样的: 1\运行下面指令下载、解压安装包 cd /home wget http://www.xunsearch.com/download/xunsearch-full-la...