搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

31.编写第一个配置文件

...为了按版块检索，我们必须对它进行索引，而它也不需要分词，所以分词器用内置的 `full`。 - `tid` 内容也是数字的主题ID，我们暂不考虑按主题搜索，所以不需要索引，也没有排序等要求，所以只要当作普通字段存储下来即可...

32.xunsearch-1.4.8 (基于 xapian+scws 的开源中文搜索引擎，小问题优化改进)

发布时间：2013-12-11 15:12 t By hightman

...代码兼容性 2. 增加用户案例文档：USERCASE 3. 改进自定义分词器 XSTokenizerScws 接受参数作为复合等级 4. 升级 libevent 到 2.x 版 5. 修正中文 stopwords 不生效的问题 6. 取消恼人的 NODB(S#506) 错误提示 7. 新增获取文档匹配词表的接口 X...

33.在 Xunsearch 使用 SCWS

...在安装完 `Xunsearch` 后可以通过服务端内置的 scws[1] 实现分词，而不需要另外再安装 scws 的 php 扩展。从 `1.3.1` 版本起，`Xunsearch` 的 PHP-SDK 中加入 [XSTokenizerScws] 类，可通过搜索服务端执行分词功能。用法简单说明 ---------- 这...

34.RE: xunsearch-1.4.5 (基于 xapian 和 scws开源中文搜索引擎，高扛压不死锁)

发布时间：2013-03-28 12:03 t By vus520

...现在的问题是想通过XSTokenizerScws来获取指定文本的自定义分词结果。sdk使用了github里最新的版本，词典格式由一楼所示，现在取出来的结果并不包含任何自定义词典的关键词，求解。[/code] [php] $text =

35.一点疑惑

更新时间：2013-11-09 15:11 t By 子不语

...据是12345678 我搜索345却也不能出结果!为啥？？默认的分词也不行，:huh::huh:我用csv导入的中文全都不可以搜索和显示出来 [id] type = id [user] index = both tokenizer = full [q] index = both tokenizer = full [w] index = both tokenizer = full...

36.www.adminlink.net.cn上的xunsearch案例

更新时间：2011-12-08 12:12 t By adminlink

首页说下我为什么安装中文分词和全文搜索。就是因为提取出更多的页面，让搜索引擎蜘蛛没完没了的爬，达到网页聚合的目的。这样做我估计对优化很有帮助。选择scws的原因是比较了几个中文分词后，感觉scws是一个不错的...

37.xunsearch-1.0.0 正式版

更新时间：2011-09-30 14:09 t By hightman

... C/C++ 开发多线程服务端，索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据，在 500 万网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用：[/b]前端是使用脚本语言编写的开发工具 (SDK)，目前仅支...

38.最新的主要变动

...化代码兼容性 - 增加用户案例文档：USERCASE - 改进自定义分词器 XSTokenizerScws 接受参数作为复合等级 - 升级 libevent 到 2.x 版 - 修正中文 stopwords 不生效的问题 - 取消恼人的 NODB(S#506) 错误提示 - 新增获取文档匹配词表的接口 [XSSearch:...

39.刚开始使用，项目编码与时间戳问题请教

更新时间：2012-07-05 11:07 t By xilin

...sw，但是不知道有xunsearch,当时公司使用的是zend lucene和scsw分词，速度相当相当慢，查询总数5万条左右的记录要2秒以上。现在想换xunsearch试试

40.自定义词库如何使用？

发布时间：2013-05-12 11:05 t By hq22

网页设计分词后变成网页设计网页设计我想把网页设计就分为网页设计一个词，不需要搜索出含有网页跟设计的内容。我在dict_user.txt加入网页设计这个词，好像并没有效果，还是搜索出来含有网页跟设计的文档。

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索