...df (folat, 逆文本词频) off (long, 在文本中的位置) attr(string, 词性表示) [color=#0000ff]mixed scws_get_tops(resource scws_handle [, int limit [, string attr]] )[/color] 说明:根据 send_text 设定的文本内容,返回系统计算出来的最关键词汇列表。 返回...
...动重设为10。参数 xattr 用来描述要排除或参与的统计词汇词性,多个词性之间用逗号隔开。当以~开头时表示统计结果中不包含这些词性,否则表示必须包含,传入 NULL 表示统计全部词性。 [b]返回值:[/b]返回词表集链表的头指针...
...TF是词频系数,IDF是逆词频率系数 而Attr是北大标注法的词性,这四个字段之间用\t隔开。 --- hightman 特别制作于 2009.7.1 下载地址:http://www.ftphp.com/scws 或 www.hightman.cn/bbs 的 scws 版
...属性的词,假如品牌的属性设置为pp,因为这些纯英文词的词性切分后都为/en。在非法词过滤时也是如此,不能使用scws_has_word()函数来判断是否有指定属性的词,假如非法词属性为*,非法的英文单词切分后属性为/en。 想hack一下...
...tp://bbs.xunsearch.com/showthread.php?tid=1235][b][color=blue]SCWS - 词典词性标注详解[/color][/b][/url] [url=http://www.xunsearch.com][b][size=5]推荐: 搭配 SCWS 面向 PHP 的全文检索解决方案 FTPHP/XUNGLE 已经可用 :)[/size][/b][/url] [url=http://bbs.xunsearch.com/showthread...