搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

71.RE: 如何获取到分词对应的id

发布时间：2011-02-14 12:02 t By michael

这里的idf应该是会变化的吧。我的意思是，在做全文搜索时，根据用户输入，拆分到词组，拿这些词组在全文里搜索，这个时候，如果有词组对应的唯一ID，那么就可以通过id关联来查询，而不用like了。如，一篇文章标题为：...

72.RE: 请教：关于地市信息的分词结果，如何更准确？

发布时间：2010-09-26 20:09 t By hightman

...WS_XDICT_TXT); 这样使文本词典生效. 其中词典格式为词 tf idf attr (当attr为!表示删除该词) [code] 市廛 1 1 ! 河华 1 1 ! 阳道 1 1 ! 道南路 4 2 nz 小白兔 4 2 n [/code] 以下我是根据你的实例编写的，你可以在理解的基础上自己完善这个扩...

73.RE: [特别发布] 纯PHP编写的xdb词典导入导出工具！！

更新时间：2009-07-27 09:07 t By etbobhwang

...出的词库吧.(你可以从附件处下载) 而对于其中的 TF / IDF 则相应的表示该词的词频率系统以及逆词频率(表示词重要性), 你可以参考现有的词造一个系数. 而词性标注请看这篇: http://www.hightman.cn/bbs/showthread.php?tid=42 [/quote] ...

74.使用自定义词典时无法取得字典中的内容

更新时间：2011-08-08 17:08 t By 999

...ops($sh, 5); print_r($top); [/php] dict.txt的内容为： # WORD TF IDF ATTR 再试一个 1.0 1.0 @ 可结果中并匹配到"再试一个"，这是为什么？另外1.1.7是不是还不能使用scws_free(); 我使用时出现方法不存在的错误： Fatal error: Call to undefi...

75.求救PSCWS4问题

发布时间：2010-07-21 10:07 t By FG2008

...alse 为止 // 返回的词是一个关联数组, 包含: word 词本身, idf 逆词率(重), off 在text中的偏移, len 长度, attr 词性 // $text = "中国航天官员应邀到美国与太空总署官员开会"; $pscws->send_text($text); while ($some = $pscws->get_result()) { foreach...

76.SCWS不支持英文和中英文混合分词吗？

更新时间：2010-08-24 20:08 t By fuhehe

...tring(7) "GMhello" ["off"]=> int(0) ["len"]=> int(7) ["idf"]=> float(4.86477518082) ["attr"]=> string(2) "en" } } "GM"和"hello"被合并了且"attr"变成了"en"而不是定义的"*"，而"hello指导员"被拆分了。实际上我只载入了我自定义的词...

77.RE: xunsearch-1.4.5 (基于 xapian 和 scws开源中文搜索引擎，高扛压不死锁)

发布时间：2013-03-26 16:03 t By vus520

...么产生的。请指点一下。以下是我的字典定义 # WORD TF IDF ATTR # —————————————————— 2d 50.0 50.0 n 3d 50.0 50.0 n 3G 50.0 50.0 n

78.[2013] SCWS-1.2.2 发布，BSD协议、支持自定义词库、PHP5.4

更新时间：2013-07-11 21:07 t By hightman

...http://www.ftphp.com/scws/demo/v4.php[/url]（含自定词汇功能） TF/IDF简易查询计算器：[url=http://www.ftphp.com/scws/demo/get_tfidf.php]http://www.ftphp.com/scws/demo/get_tfidf.php [/url](用于新词添加时不知怎么设tf,idf的话) 基于SCWS自动分类演示：[url=http://ww...

79.载入txt词典所出现的BUG

更新时间：2011-08-09 12:08 t By 999

a.txt文档内容： # WORD TF IDF ATTR 印第安那 13.30 15.98 ns 印第安那州 12.72 11.56 ns 印第安那波利斯 12.31 12.68 ns [php] $txt = '我名字叫印第安那，我的家乡是印第安那州的印第安那波利斯！'; $so = scws_open(); scws_set_charset($so, 'gbk'); s...

80.RE: [特别发布] 纯PHP编写的xdb词典导入导出工具！！

更新时间：2009-07-26 12:07 t By hightman

...出的词库吧.(你可以从附件处下载) 而对于其中的 TF / IDF 则相应的表示该词的词频率系统以及逆词频率(表示词重要性), 你可以参考现有的词造一个系数. 而词性标注请看这篇: http://www.hightman.cn/bbs/showthread.php?tid=42

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索