搜索

大约有 40 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.3912秒)

21.RE: 请问一下,xdb与txt词库那个读取效率更高

发布时间:2013-07-03 16:07 t By hightman

但网址和EMAIL如果这样切,也太粗糙了吧。要全部匹配才能检索到,输入 EMAIL 的前段或网址的一部分均检索不到了。 至于消除 HTML 标签,这不应该是分词的事哦

22.RE: 在做一个PHP的项目。 部分功能用到scws。 大家多多交流

更新时间:2010-05-12 15:05 t By hightman

...么问题或建议都可以记录在这。 对于检索部分,光有分词还是远远不够的,而且现在的全文检索已经不仅仅只是匹配、返回这么简单了,用户体验要求也高起来了。 布尔搜索、关键词联想、拼写纠错、拼音搜索、同义词、...

23.RE: 在做一个PHP的项目。 部分功能用到scws。 大家多多交流

发布时间:2010-05-12 16:05 t By xiaolan

...么问题或建议都可以记录在这。 对于检索部分,光有分词还是远远不够的,而且现在的全文检索已经不仅仅只是匹配、返回这么简单了,用户体验要求也高起来了。 布尔搜索、关键词联想、拼写纠错、拼音搜索、同义词、...

24.英文模糊搜索问题

发布时间:2013-07-31 10:07 t By homingway

...都失败了 1. 利用xs自带的scws,这个英文明显是根据空格分词的,所以达不到效果 2. 自己写的一元/二元分词器,某些情况下可以正常工作,不过有时会返回一些意想不到的结果,而且相关度看起来并不高,所以很困惑,最下方...

25.同义词搜索

...一个单词有多种不同的形式,如:单复数、过去式和现在分词等。 而它们要传送的其实是同一种涵义。因此,对于纯英文的同义词记录会自动进行词根处理。 词根记录保存为大写字母 Z 开头的记录。例如: 设置 `find` 是 _s...

26.hightman你好,请问有没有好的相关度算法推荐下?

发布时间:2008-04-03 15:04 t By routerpipe

你好,您的分词插件很好,但有个问题,我用这个插件做的相关度插件,实践中相关度并不大。 例如“你给我买的衣服“ match "你看的书" 和"一件衣服" 代码匹配出来相关度最大的是"你看的书",因为有2个词相同,而按照我...

27.最新的主要变动

...化代码兼容性 - 增加用户案例文档:USERCASE - 改进自定义分词器 XSTokenizerScws 接受参数作为复合等级 - 升级 libevent 到 2.x 版 - 修正中文 stopwords 不生效的问题 - 取消恼人的 NODB(S#506) 错误提示 - 新增获取文档匹配词表的接口 [XSSearch:...

28.xunsearch-1.4.8 (基于 xapian+scws 的开源中文搜索引擎,小问题优化改进)

发布时间:2013-12-11 15:12 t By hightman

...代码兼容性 2. 增加用户案例文档:USERCASE 3. 改进自定义分词器 XSTokenizerScws 接受参数作为复合等级 4. 升级 libevent 到 2.x 版 5. 修正中文 stopwords 不生效的问题 6. 取消恼人的 NODB(S#506) 错误提示 7. 新增获取文档匹配词表的接口 X...

29.XSSearch

...回匹配词表 XSSearch setScwsMulti() 设置当前搜索语句的分词复合等级 XSSearch setSort() 设置搜索结果的排序方式 XSSearch setSynonymScale() 设置同义词搜索的权重比例 XSSearch setTimeout() 设置服务端超时秒数 XSServer ...

30.xunsearch-1.4.7 (基于 xapian+scws 的开源中文搜索引擎,诸多细节改进)

发布时间:2013-07-30 11:07 t By hightman

... C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅支持...

1234
  • 时间不限
  • 按相关性排序