搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

21.RE: 搜索问题

发布时间：2012-09-07 15:09 t By hightman

中文分词！！！“千”单字当然搜索不到“千年”这个词　

22.可以实现搜索纯静态网站吗？

更新时间：2013-09-16 17:09 t By anicca

像蜘蛛爬虫那样去检索指定的网站，把数据存入数据库，然后搜索 [hr] 像 sphider 开源的那个，只不过他没有中文分词

23.RE: [HELP]xunsearch安装好了,搜索没有结果集。。。

发布时间：2011-10-27 16:10 t By hightman

...scws的api接口,实现短语分词功能 2.是否可以对scws自定义中文词典,方便扩展 [/quote] 目前没有直接支持自定义词典，而是直接读取 dict.utf8.xdb 你自己改词也必须转换成这个词典文件才能用。词典转换关于SCWS的网站上有。

24.一点疑惑

更新时间：2013-11-09 15:11 t By 子不语

...果!为啥？？默认的分词也不行，:huh::huh:我用csv导入的中文全都不可以搜索和显示出来 [id] type = id [user] index = both tokenizer = full [q] index = both tokenizer = full [w] index = both tokenizer = full ~

25.xunsearch-1.4.1 (xapian+scws 开源搜索引擎，修正搜索进程死锁)

发布时间：2013-02-21 11:02 t By hightman

...采用 C/C++ 开发多线程服务端，索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据，在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用：[/b]前端是使用脚本语言编写的开发工具 (SDK)，目前仅...

26.scws-1.0.0 正式发布 (含php扩展及2文本词典)

更新时间：2010-01-29 13:01 t By hightman

...明节选] SCWS 是 Simple Chinese Words Segmentation 的缩写（简易中文分词系统）。它是一套基于词频词典的机械中文分词引擎，它能将一整段的汉字基本正确的切分成词，因为词是汉语的基本语素单位，而书写的时候不像英语会在词...

27.最新的主要变动

...rScws 接受参数作为复合等级 - 升级 libevent 到 2.x 版 - 修正中文 stopwords 不生效的问题 - 取消恼人的 NODB(S#506) 错误提示 - 新增获取文档匹配词表的接口 [XSSearch::setRequireMatchedTerm] 版本 1.4.7 (2013-7-30) ---------------------- - 优化安装脚本...

28.同义词搜索

... > tip: 独立词汇的意思对于英文来说就是一个单词，对于中文来说必须是 `scws` 词库中的一个词。 > _Xunsearch_ 的同义词不同于 _Xapian_，会智能进行字段匹配和转换，您只需维护通用词库。英文同义词的特殊处理 ------------------ ...

29.编写第一个配置文件

...，分词器当然选用 `full`。 - `author` 作者名字检索，考虑中文名支持，所以建议这个字段保留使用默认内置的 `scws` 分词器。由于希望在默认不指明字段的情况下也能检索作者字段，所以它的过索引方式应为 `both`。 - `authorid` 作...

30.删除文档

...录 ~~~ > note: 如果您删除时指定的主键或字段索引词包含中文字符，则它的编码必须与整个项目的 > 默认字符集 [XS::defaultCharset] 一致。 > > 此外删除操作和[添加文档](index.add)一样，也是一个异步行为。 $Id$

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索