搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

111.[预告] xunsearch 下一主版本 1.3.x 主要新增功能

更新时间：2011-12-26 10:12 t By hightman

...引进的主要功能，供大家参考和建议。 1. 同义词搜索，通过API建立、管理同义词库，检索的时候智能匹配同义词进行搜索。比如设置 “xunsearch”与“迅搜”为同义词，那么搜索 xunsearch也会包含迅搜的记录。 2. 增强的搜索查询...

112.自定义词库怎么控制（字母+数字）组合的个数

发布时间：2012-08-27 16:08 t By kill-all999

我目前使用自定义词库实现分词，但是通过scws_get_top5()方法获取数据的时候(字母+数字大于等于3个的时候也会返回)。求过滤方案。 $sh = scws_open(); scws_set_charset($sh, 'utf8'); scws_set_dict($sh, './dict.txt', SCWS_XDICT_TXT); scws_set_rule($sh, './r...

113.RE: 请教如何在Xunsearch里面设置scws的M选项(multi-child words mode)

发布时间：2013-01-30 14:01 t By hightman

这个不能随便改，但可以通过调整源码的编译参数来改。通常不需要这么做啊，实在有必要时你们可以考虑继承XSTokenizerScws 来自己修改它。

114.XSDataFilter

...示) public function processDoc($doc); 索引文档处理函数在此通过 XSDocument::addIndex 或 XSDocument::addTerm 做索引相关调整

115.遇到一个分词错误的问题

发布时间：2014-02-08 16:02 t By robinjia

... /n ？ /un 大家 /r 怎么 /r 看 /v 的 /uj ？ /un 后来发现可以通过修改rule.utf8.ini里的规则来调整分词结果，不知道有没有更好的办法？

116.RE: 不能增加索引，每次列队数加1

发布时间：2012-09-03 15:09 t By deling007

...----+--------------------------------+ 检查结果 -------- 共计 7 项通过，2 项警告，0 项错误。不知到这两个警告有没有影响，

117.RE: 请教如何在Xunsearch里面设置scws的M选项(multi-child words mode)

发布时间：2013-02-02 13:02 t By tisswb

[quote='hightman' pid='3251' dateline='1359526251'] 这个不能随便改，但可以通过调整源码的编译参数来改。通常不需要这么做啊，实在有必要时你们可以考虑继承XSTokenizerScws 来自己修改它。 [/quote] 感谢，我就是这么干的~

118.RE: 冒昧的问一下——怎么用tf和idf来计算权重？

发布时间：2012-02-22 18:02 t By vanni

...：相宜本草（某化妆品品牌）被分成：相宜本草我通过词典增加的 “相宜本草” 但是不管用 mydict.txt 文件内容如下： 1 相宜本草 2 雅漾 3 舒护 4 活泉水 # scws -A -d /hp/opt/scws/dict/default.utf8.xdb:/home/vanni/scws/mydict....

119.RE: 在做一个PHP的项目。部分功能用到scws。大家多多交流

更新时间：2010-05-12 15:05 t By hightman

...放API的打算（已经制作完毕，尚未开放），届时用户可以通过 xungle 直接创建和维护自己的搜索项目，就像使用一个远端 mysql server一样的道理，只不过是把全文检索这部分托管出来。

120.求TF/IDF算法（官方的计算器没有作用）

发布时间：2013-05-22 13:05 t By zouhc

...。我想自己扩充我的词库，但不知道TF/IDF如何获得。通过你提过的新词生词的TF/IDF计算器（http://www.xunsearch.com/scws/demo/get_tfidf.php）结果计算出来的大部分内容都是一样的值，而且也无法用于分词。另外用这个计算器计算...

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索