搜索

大约有 50 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0051秒)

21.XSTokenizerScws

... scws 版本号 XSTokenizerScws hasWord() 判断是否包含指定词性的词 XSTokenizerScws setCharset() 设置字符集 XSTokenizerScws setDict() 设置分词词典, 支持 TXT/XDB 格式 XSTokenizerScws setDuality() 设置散字二元组合 XSTokenizerScws ...

22.SCWS-php扩展的说明及用法

发布时间:2007-06-07 18:06 t By hightman

...df (folat, 逆文本词频) off (long, 在文本中的位置) attr(string, 词性表示) [color=#0000ff]mixed scws_get_tops(resource scws_handle [, int limit [, string attr]] )[/color] 说明:根据 send_text 设定的文本内容,返回系统计算出来的最关键词汇列表。 返回...

23.自定义 SCWS 词库

...次表示 “词语”,“词频(TF)”,“逆词频率(IDF)”,“词性(ATTR)” - 后面三个字段如果省略依次使用 scws 的默认值 - 特殊词性 `!` 可用于表示删除该词 - 自定义词典优先于内置词典加载和使用,以 # 开头的行为注释 > note: ...

24.RE: scws_has_word的逻辑问题

发布时间:2010-07-29 14:07 t By hightman

关于has_word, 不是很明白你的意思, has_word 用于检测当前文本中是否包含这些属性的词。 scws_get_words 是按词性返回分词结果,标点的词应该默认应该是 un 或 # 之类可以自行排除。

25.RE: scws_has_word没有得到部分指定词库中的词

发布时间:2011-12-08 16:12 t By hightman

has_word 是用来判断词性的啊,你怎么用的代码 ?

26.RE: scws_has_word的逻辑问题

更新时间:2010-07-29 15:07 t By backluck

...测当前文本中是否包含这些属性的词。 scws_get_words 是按词性返回分词结果,标点的词应该默认应该是 un 或 # 之类可以自行排除。 [/quote] 关于has_word,我的意思是说,当我不传属性参数,返回的会是0

27.RE: scws-1.2.0 发布,支持 PHP5.4 新增用于多线程的 scws_fork()

发布时间:2012-04-01 16:04 t By fxlijun

有个问题,在演示地址中,统计词性: 需要屏蔽 ~vn,~nr时, 仅第一个有效,不能设置多个

28.scws-1.1.6 发布

更新时间:2011-04-20 15:04 t By hightman

1.修正夹杂在汉字中间的1-2个英文字符的词性为 en 而不是原来的 un 导致清除符号时消失. 2.调整将数字后面的独立 % 纳入整词作为百分比,如 33.3% 作为整词而不再是 33.3 和 % 3.修改连字符(-)和下划线(_)的规则,当出现在字母单词...

29.RE: scws_has_word没有得到部分指定词库中的词

更新时间:2011-12-09 11:12 t By michaele

是判断指定词性 我自定义词库格式如下: 销售什么 1.0 1.0 * 出售什么 1.0 1.0 * 出售各式 1.0 1.0 * 某词 1.0 1.0 * scws_t s=scws_new(); 用下面这个函数可以分出“某词”, scws_get_tops(s,1000,N...

30.RE: 分词的关键词选择

发布时间:2010-02-26 17:02 t By hightman

你可以利用内置的 scws_get_tops 来获取权重和频率较高的词汇,可以根据词性排除

12345
  • 时间不限
  • 按相关性排序