搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

1.RE: 中文分组粗分方法

发布时间：2010-05-27 11:05 t By hightman

...现的机率权重。（越经常出现的越高） IDF是逆词频率，也就是说这个词更重要（因为罕见一些）；具体参见：http://baike.baidu.com/view/1228847.html 并没有很固定的算法，SCWS中的tf/idf均经过特殊加工处理了

2.时间戳排序不生效的问题

发布时间：2014-06-04 21:06 t By live

配置文件设置了时间戳这个字段是numeric类型，想实现搜索的结果进行倒序排列，也就是说新发布的信息都排在最上边，用了setSort、setMultiSort都没起作用，请问是怎么回事呢？

3.RE: 配置感觉没问题就是搜不到

发布时间：2013-01-04 12:01 t By hightman

这个日志说的是超时了，也就是说SDK连接上服务端后，５秒过后还没有收到查询请求，服务端强制关闭了这条连接

4.求PSCWS23问题的解答

发布时间：2012-07-18 20:07 t By wainilxx7

我下了个PSCWS23 代码并成功安装，结果分词只对汉字有效。我用的其中的pscws3分词。比如我输入“2009年” 分词结果却为“年”。也就是说，它只输出了汉字部分请问这该怎么解决

5.RE: 配置感觉没问题就是搜不到

发布时间：2013-01-04 14:01 t By xzl

[quote='hightman' pid='2097' dateline='1357272615'] 这个日志说的是超时了，也就是说SDK连接上服务端后，５秒过后还没有收到查询请求，服务端强制关闭了这条连接 [/quote] 嗯，测试外部库可以了。本地lo设备关闭了。

6.分享一个dict_user.txt

发布时间：2012-02-21 16:02 t By Dull

全部是英文单词数据来源： twitter tumblr amazon alibaba flickr 等的标签原来多是词组形式改成了scws的单字形式没有附加任何属性 也就是说全部使用默认属性参考 http://www.xunsearch.com/doc/php/guide/index.dict

7.RE: 纯HTML页面如何收录

发布时间：2012-03-14 20:03 t By iqpkeq

... 但是目前只做到了结合SCWS做数据库的全文检索啊！也就是说Xunsearch只是一个站内搜索或者是只是一个能够检索具有后台数据库的搜索引擎！譬如：discuz，或者能够提供数据库了能否换种思路把HTML页面的标签也作为字...

8.讯搜的一些优化

发布时间：2012-05-17 21:05 t By myoula

...高索引更新速度 xs-indexd -h 看到 -q这个参数默认是3000 也就是说当提交了3000个文档处理要求的时候才处理可以将xs-ctl.sh 75行的加-q 200 这个200看你的服务器性能情况和要求 3 提高搜索子进程 xs-searchd -h 看到 -m 和 -n -m是指...

9.文档里存进去主键相同分类不同的多条记录，会影响分面查询结果吗？有什么更好的方法？

更新时间：2014-07-22 15:07 t By xunsearch飞吧

... ，一个宠物店属于多个分类，我把这些全存进文档里，也就是说一个宠物店有多条主键值相同，分类不同的内容，这个会影响宠物店分类的分面查询结果不？ [0] => array(22) { ["goodsId"] => string(4) "1100" ["goodsCity"] => string(2) "...

10.在做一个PHP的项目。部分功能用到scws。大家多多交流

更新时间：2010-05-11 18:05 t By xiaolan

...，存储方式以及检索的效率等没有用到scws的mysql扩展，也就是说没有用mysql的fulltext 现在想，在插入信息的时候就对它进行分词，对其中的关键词进行分析，取出权重以及出现频率比较高的，作为这条信息的一个最高检索依...

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索