搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

发布时间：2011-02-14 12:02 t By michael

...idf应该是会变化的吧。我的意思是，在做全文搜索时，根据用户输入，拆分到词组，拿这些词组在全文里搜索，这个时候，如果有词组对应的唯一ID，那么就可以通过id关联来查询，而不用like了。如，一篇文章标题为：我是中...

发布时间：2010-05-26 14:05 t By hightman

...词为主体进行计算权重，看哪个情况最优。此外还有根据rules规则匹配。简单举个例子： “开放下载” 1. 开/放下/载 2. 开放/下载根据词典中的tdf进行一个运算得出概率而采取最高的那种

发布时间：2010-05-31 01:05 t By hightman

...要过滤的词新增加文本词典，属性设为 ! 即可。或者自己根据词性直接在取得返回值的时候排除它。。因为你是包含的作法的话，是不是“人们”“人家”“人民”全都要过滤了？？这样肯定不合适，所以建议直接根据词性...

...unsearch PHP-SDK` 相关的基础文档全面讲了一通，您完全可以根据文档和自动生成的 `API` 文档进行搜索开发了。但根据我们研发 [Xungle 项目](http://www.xungle.com) 的实践经验，绝大多数搜索项目的前端代码都类似，不同的均为细节显...

更新时间：2012-12-26 12:12 t By HiLinz

...” 分词后获取首字母得到拼音字段为“qz,ff”，查询时，根据 pinyin:ff 可查找到 “强者风范” 。我遇到的问题是： 1、如何查找类型为电影、并且拼音中包含ff的。如用：util/Quest.php words "pinyin:ff AND type:电影"，怎么查不到结果...

更新时间：2012-11-30 16:11 t By wish5115

...到索引库。如果是物理删除的，须记录删除日志。这个是根据我的情况写的，我由于里面没有删除时间，所以更新索引时记录了下已删除的id，而且添加数据时的默认创建时间和编辑时间相同，所以我下面区分添加编辑时用相等...

...文件中 `index` 选项的值）为 `self` 或 `both`，那么也可以根据该字段上的**索引词**进行删除。特别注意是根据**索引词**删除而不是该字段的值，索引词是指该字段值经过分词器处理后得到的词汇。对于索引方式为 `mixed` 的，如...

...何作用 - 中括号包围的每个分区均为字段配置，字段个数根据项目的实际需求设定 - 每个项目必须有并且只能有一个类型类 ID 的主键字段，ID 字段值的字母不区分大小写项目设置 ------- 1. ### 项目名称要求用纯小写字母...

发布时间：2013-07-31 10:07 t By homingway

...做法，但都失败了 1. 利用xs自带的scws，这个英文明显是根据空格分词的，所以达不到效果 2. 自己写的一元/二元分词器，某些情况下可以正常工作，不过有时会返回一些意想不到的结果，而且相关度看起来并不高，所以很困惑...

发布时间：2012-12-10 15:12 t By timeage

...铭罗”这个词。问题2：如果我想对于一段文字，优先根据自定义词库分出所有在该词库中的内容，再根据默认词库分出结果该怎么实现呢？以下是我的主要代码：库版本信息：SCWS (Module version:1.0.0, Library version:1.2.0) - by hight...