搜索

大约有 160 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0056秒)

111.[预告] xunsearch 下一主版本 1.3.x 主要新增功能

更新时间:2011-12-26 10:12 t By hightman

...引进的主要功能,供大家参考和建议。 1. 同义词搜索,通过API建立、管理同义词库,检索的时候智能匹配同义词进行搜索。比如设置 “xunsearch”与“迅搜”为同义词,那么搜索 xunsearch也会包含迅搜的记录。 2. 增强的搜索查询...

112.自定义词库怎么控制(字母+数字)组合的个数

发布时间:2012-08-27 16:08 t By kill-all999

我目前使用自定义词库实现分词,但是通过scws_get_top5()方法获取数据的时候(字母+数字大于等于3个的时候也会返回)。求过滤方案。 $sh = scws_open(); scws_set_charset($sh, 'utf8'); scws_set_dict($sh, './dict.txt', SCWS_XDICT_TXT); scws_set_rule($sh, './r...

113.RE: 请教如何在Xunsearch里面设置scws的M选项(multi-child words mode)

发布时间:2013-01-30 14:01 t By hightman

这个不能随便改,但可以通过调整源码的编译参数来改。通常不需要这么做啊,实在有必要时你们可以考虑继承XSTokenizerScws 来自己修改它。

114.XSDataFilter

...示) public function processDoc($doc); 索引文档处理函数 在此通过 XSDocument::addIndex 或 XSDocument::addTerm 做索引相关调整

115.遇到一个分词错误的问题

发布时间:2014-02-08 16:02 t By robinjia

... /n ? /un 大家 /r 怎么 /r 看 /v 的 /uj ? /un 后来发现可以通过修改rule.utf8.ini里的规则来调整分词结果,不知道有没有更好的办法?

116.RE: 不能增加索引,每次列队数加1

发布时间:2012-09-03 15:09 t By deling007

...----+--------------------------------+ 检查结果 -------- 共计 7 项通过,2 项警告,0 项错误。 不知到这两个警告有没有影响,

117.RE: 请教如何在Xunsearch里面设置scws的M选项(multi-child words mode)

发布时间:2013-02-02 13:02 t By tisswb

[quote='hightman' pid='3251' dateline='1359526251'] 这个不能随便改,但可以通过调整源码的编译参数来改。通常不需要这么做啊,实在有必要时你们可以考虑继承XSTokenizerScws 来自己修改它。 [/quote] 感谢,我就是这么干的~

118.RE: 冒昧的问一下——怎么用tf和idf来计算权重?

发布时间:2012-02-22 18:02 t By vanni

...:相宜本草 (某化妆品品牌) 被分成: 相宜 本草 我通过词典增加的 “相宜本草” 但是不管用 mydict.txt 文件内容如下: 1 相宜本草 2 雅漾 3 舒护 4 活泉水 # scws -A -d /hp/opt/scws/dict/default.utf8.xdb:/home/vanni/scws/mydict....

119.RE: 在做一个PHP的项目。 部分功能用到scws。 大家多多交流

更新时间:2010-05-12 15:05 t By hightman

...放API的打算(已经制作完毕,尚未开放),届时用户可以通过 xungle 直接创建和维护自己的搜索项目,就像使用一个远端 mysql server一样的道理,只不过是把全文检索这部分托管出来。

120.求TF/IDF算法(官方的计算器没有作用)

发布时间:2013-05-22 13:05 t By zouhc

...。我想自己扩充我的词库,但不知道TF/IDF如何获得。 通过你提过的新词生词的TF/IDF计算器(http://www.xunsearch.com/scws/demo/get_tfidf.php) 结果计算出来的大部分内容都是一样的值,而且也无法用于分词。 另外用这个计算器计算...

  • 时间不限
  • 按相关性排序