搜索

大约有 86 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1006秒)

71.RE: 如何获取到分词对应的id

发布时间:2011-02-14 12:02 t By michael

这里的idf应该是会变化的吧。 我的意思是,在做全文搜索时,根据用户输入,拆分到词组, 拿这些词组在全文里搜索,这个时候,如果有词组对应的唯一ID,那么就可以通过id关联来查询,而不用like了。 如,一篇文章标题为:...

72.RE: 请教:关于地市信息的分词结果,如何更准确?

发布时间:2010-09-26 20:09 t By hightman

...WS_XDICT_TXT); 这样使文本词典生效. 其中词典格式为 词 tf idf attr (当attr为!表示删除该词) [code] 市廛 1 1 ! 河华 1 1 ! 阳道 1 1 ! 道南路 4 2 nz 小白兔 4 2 n [/code] 以下我是根据你的实例编写的,你可以在理解的基础上自己完善这个扩...

73.RE: [特别发布] 纯PHP编写的xdb词典导入导出工具!!

更新时间:2009-07-27 09:07 t By etbobhwang

...出的词库吧.(你可以从附件处下载) 而对于其中的 TF / IDF 则相应的表示该词的词频率系统以及逆词频率(表示词重要性), 你可以参考现有的词造一个系数. 而词性标注请看这篇: http://www.hightman.cn/bbs/showthread.php?tid=42 [/quote] ...

74.使用自定义词典时无法取得字典中的内容

更新时间:2011-08-08 17:08 t By 999

...ops($sh, 5); print_r($top); [/php] dict.txt的内容为: # WORD TF IDF ATTR 再试一个 1.0 1.0 @ 可结果中并匹配到"再试一个",这是为什么? 另外1.1.7是不是还不能使用scws_free(); 我使用时出现方法不存在的错误: Fatal error: Call to undefi...

75.求救PSCWS4问题

发布时间:2010-07-21 10:07 t By FG2008

...alse 为止 // 返回的词是一个关联数组, 包含: word 词本身, idf 逆词率(重), off 在text中的偏移, len 长度, attr 词性 // $text = "中国航天官员应邀到美国与太空总署官员开会"; $pscws->send_text($text); while ($some = $pscws->get_result()) { foreach...

76.SCWS不支持英文和中英文混合分词吗?

更新时间:2010-08-24 20:08 t By fuhehe

...tring(7) "GMhello" ["off"]=> int(0) ["len"]=> int(7) ["idf"]=> float(4.86477518082) ["attr"]=> string(2) "en" } } "GM"和"hello"被合并了且"attr"变成了"en"而不是定义的"*",而"hello指导员"被拆分了。 实际上我只载入了我自定义的词...

77.RE: xunsearch-1.4.5 (基于 xapian 和 scws开源中文搜索引擎,高扛压不死锁)

发布时间:2013-03-26 16:03 t By vus520

...么产生的。请指点一下。 以下是我的字典定义 # WORD TF IDF ATTR # —————————————————— 2d 50.0 50.0 n 3d 50.0 50.0 n 3G 50.0 50.0 n

78.[2013] SCWS-1.2.2 发布,BSD协议、支持自定义词库、PHP5.4

更新时间:2013-07-11 21:07 t By hightman

...http://www.ftphp.com/scws/demo/v4.php[/url](含自定词汇功能) TF/IDF简易查询计算器:[url=http://www.ftphp.com/scws/demo/get_tfidf.php]http://www.ftphp.com/scws/demo/get_tfidf.php [/url](用于新词添加时不知怎么设tf,idf的话) 基于SCWS自动分类演示:[url=http://ww...

79.载入txt词典所出现的BUG

更新时间:2011-08-09 12:08 t By 999

a.txt文档内容: # WORD TF IDF ATTR 印第安那 13.30 15.98 ns 印第安那州 12.72 11.56 ns 印第安那波利斯 12.31 12.68 ns [php] $txt = '我名字叫印第安那,我的家乡是印第安那州的印第安那波利斯!'; $so = scws_open(); scws_set_charset($so, 'gbk'); s...

80.RE: [特别发布] 纯PHP编写的xdb词典导入导出工具!!

更新时间:2009-07-26 12:07 t By hightman

...出的词库吧.(你可以从附件处下载) 而对于其中的 TF / IDF 则相应的表示该词的词频率系统以及逆词频率(表示词重要性), 你可以参考现有的词造一个系数. 而词性标注请看这篇: http://www.hightman.cn/bbs/showthread.php?tid=42

  • 时间不限
  • 按相关性排序