搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

1.想在用索引搜索时,输入的关键字不被分词该怎么做？

发布时间：2014-11-20 15:11 t By pbin

想在搜索的时候,关键词按照自己的意愿来切分应该是要怎么做？文档里看到有个自定义词库的设置,然后根据文档使用了下,发现没达到效果。比如说,我想搜索拥有"味道恶心"这个词的文章,（我的文档库里面是有相关文章的...

2.RE: 这个不支持英文词典和中英文混合词典啊

发布时间：2012-02-22 19:02 t By vanni

如果只要文章中有Linux出现就算是Linux相关文章的话，其实是不需要分词了，直接用全文搜索Linux就好了。只是SCWS目前看前来它的自定义词典不支持超过3个字，如果可以的话，可以通过自定义“Linux优化”来指定分词

3.英文模糊搜索问题

发布时间：2013-07-31 10:07 t By homingway

...都失败了 1. 利用xs自带的scws，这个英文明显是根据空格分词的，所以达不到效果 2. 自己写的一元/二元分词器，某些情况下可以正常工作，不过有时会返回一些意想不到的结果，而且相关度看起来并不高，所以很困惑，最下方...

4.共享自己的drupal模块出来,drupal commerce + xunsearch 做出强大的中文搜索，丢掉solr吧

发布时间：2014-03-11 01:03 t By drupal anywhere

今天旗下的http://www.anetb.com需要一个支持中文分词的搜索页，原drupal的太烂了，我的做法是：结合xunsearch实现drupal commerce下的中文搜索测试页：http://www.anetb.com/tsearch/demo/commerce/search.php ，可输入“奶粉”，我的站准备做这...

5.图片搜索的一些疑问

更新时间：2014-02-16 17:02 t By Mr.

...相等的数据，然后根据hash_196字段按匹配度排序我对xlen分词器不是很了解这个排序mysql可以实现但是mysql分割后的位置不是固定的 project.name = hash project.default_charset = UTF-8 server.index = /dev/shm/xs-indexd.sock server.search = /dev/shm/xs-se...

6.xunsearch-1.4.8 (基于 xapian+scws 的开源中文搜索引擎，小问题优化改进)

发布时间：2013-12-11 15:12 t By hightman

...代码兼容性 2. 增加用户案例文档：USERCASE 3. 改进自定义分词器 XSTokenizerScws 接受参数作为复合等级 4. 升级 libevent 到 2.x 版 5. 修正中文 stopwords 不生效的问题 6. 取消恼人的 NODB(S#506) 错误提示 7. 新增获取文档匹配词表的接口 X...

7.xunsearch-1.0.0 正式版

更新时间：2011-09-30 14:09 t By hightman

... C/C++ 开发多线程服务端，索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据，在 500 万网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用：[/b]前端是使用脚本语言编写的开发工具 (SDK)，目前仅支...

8.xunsearch-1.0.0 正式版 (基于xapian/scws/php的开源中文全文搜索引擎)

发布时间：2011-09-23 13:09 t By hightman

... C/C++ 开发多线程服务端，索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据，在 500 万网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用：[/b]前端是使用脚本语言编写的开发工具 (SDK)，目前仅支...

9.xunsearch-1.4.1 (xapian+scws 开源搜索引擎，修正搜索进程死锁)

发布时间：2013-02-21 11:02 t By hightman

... C/C++ 开发多线程服务端，索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据，在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用：[/b]前端是使用脚本语言编写的开发工具 (SDK)，目前仅支持...

10.xunsearch-1.4.0 (基于xapian+scws的开源中文搜索，大幅改进性能及稳定性)

发布时间：2013-01-22 12:01 t By hightman

... C/C++ 开发多线程服务端，索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据，在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用：[/b]前端是使用脚本语言编写的开发工具 (SDK)，目前仅支持...

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索