搜索

大约有 5 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.4879秒)

1.词库词性标注问题反馈

更新时间:2012-09-04 09:09 t By 任侠001

...置attr字段,将提供的xdb格式词库导出,发现存在以下非北大标注标准中的词性: 'df','jb','mq','rr','rz','iv','ld','ln','lx','in','jb','jn','qd','qe','uj','un','vi','vq' 这些应该都算是标注不正确的吧 还有最近我经常来论坛,这几天论坛里每天...

2.scws自定义词库可否自定义词性

发布时间:2012-04-28 14:04 t By yunxiaoad2

...库是否同时还生效,还是只用用户自定义了? 4、能否在北大词性列表外和@外自定义词性,比如美食类、休闲类、餐厅名我想分别定义为:nms、nxx、nct,可否? 以上,麻烦各位解答,谢谢了 伪签名: xunsearch是个好search,...

3.关于词典中的词性标注

发布时间:2007-06-09 12:06 t By hightman

...在词里,还有词性标注错误的。本词典中的标注使用的是北大版本的标注集(见附录),在使用中发现错误的请大家协助跟踪汇报。这是一个长期艰巨的任务,希望本着有一纠一的原则。如有汇报,请遵守格式为: 词 原attr...

4.在 Xunsearch 使用 SCWS

... _$text_ 中的起始偏移位置 - *attr* 这个词汇的词性,使用北大标注 - *word* 分好的词条 ~~~ [php] $text = '迅搜(xunsearch)是优秀的开源全文检索解决方案'; $words = $tokenizer->getResult($text); print_r($words); ~~~ ### 提取重要词汇 调用 [XSToenizer...

5.[特别发布] 纯PHP编写的xdb词典导入导出工具!!

发布时间:2009-07-01 17:07 t By hightman

...Attr组成,其中TF是词频系数,IDF是逆词频率系数 而Attr是北大标注法的词性,这四个字段之间用\t隔开。 --- hightman 特别制作于 2009.7.1 下载地址:http://www.ftphp.com/scws 或 www.hightman.cn/bbs 的 scws 版

  • 时间不限
  • 按相关性排序