搜索

大约有 20 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.2938秒)

1.自定义“词性

发布时间:2010-06-26 11:06 t By 逆雪寒

不知道现在自定义字典那里。是否能自定义词性呢? 比如,现在我们的搜索, 先判断。如果搜的词 词性属于 产品类。那么我就让他跑产品库去搜索。 比如我定义 电脑 dn dn 就是我自定义的词性。这样我在scws 分词...

2.2009/5 scws-1.0.2更新发布,加入词性语义消岐规则

发布时间:2009-05-15 03:05 t By hightman

项目主页: http://www.ftphp.com/scws/ 经过适当的语义词性规则调整, 目前有效的消除了大量的岐义切词. 列部分如下: 1. 学人家人肉搜索 2. 俄罗斯民调显示梅德韦杰夫人气急升 3. 奥巴马上台后中美关系如何变革 4. 结合成分子时 ...

3.RE: 2009/5 scws-1.0.2更新发布,加入词性语义消岐规则

发布时间:2009-05-25 13:05 t By pardis_xiong

我试试,站内搜索也可以用这个吧

4.在 Xunsearch 使用 SCWS

...源参数文本 _$text_ 中的起始偏移位置 - *attr* 这个词汇的词性,使用北大标注 - *word* 分好的词条 ~~~ [php] $text = '迅搜(xunsearch)是优秀的开源全文检索解决方案'; $words = $tokenizer->getResult($text); print_r($words); ~~~ ### 提取重要词汇 调...

5.RE: 搜索的log

发布时间:2012-04-05 10:04 t By hightman

...接口,只要把这些黑词加到自定义词典,并取一个独特的词性,那么就可以用 XSTokenizerScws::hasWord() 的功能来判断是否包含黑词?

6.RE: [2010] SCWS-1.1.3 发布,支持文本词典实现自定义词库啦!!

更新时间:2010-11-13 10:11 t By snakeyasin

...次为“词语"(由中文字或3个以下的字母合成), "TF", "IDF", "词性", 字段时间用空格或制表符分开,数量不限,可自行对齐以美化。 3) 除“词语”外,其它字段可忽略不写。若忽略,TF和IDF默认值为 1.0 而 词性为 "@" 4) 由于 tx...

7.RE: [2010] SCWS-1.1.3 发布,支持文本词典实现自定义词库啦!!

发布时间:2012-11-06 22:11 t By umland

...次为“词语"(由中文字或3个以下的字母合成), "TF", "IDF", "词性", 字段时间用空格或制表符分开,数量不限,可自行对齐以美化。 3) 除“词语”外,其它字段可忽略不写。若忽略,TF和IDF默认值为 1.0 而 词性为 "@" 4) 由于 tx...

8.自定义 SCWS 词库

...次表示 “词语”,“词频(TF)”,“逆词频率(IDF)”,“词性(ATTR)” - 后面三个字段如果省略依次使用 scws 的默认值 - 特殊词性 `!` 可用于表示删除该词 - 自定义词典优先于内置词典加载和使用,以 # 开头的行为注释 > note: ...

9.XSTokenizerScws

... scws 版本号 XSTokenizerScws hasWord() 判断是否包含指定词性的词 XSTokenizerScws setCharset() 设置字符集 XSTokenizerScws setDict() 设置分词词典, 支持 TXT/XDB 格式 XSTokenizerScws setDuality() 设置散字二元组合 XSTokenizerScws ...

10.[2013] SCWS-1.2.2 发布,BSD协议、支持自定义词库、PHP5.4

更新时间:2013-07-11 21:07 t By hightman

...布于 2011-04-20[/b] 修正夹杂在汉字中间的1-2个英文字符的词性为 en 而不是原来的 un 导致清除符号时消失. 调整将数字后面的独立 % 纳入整词作为百分比,如 33.3% 作为整词而不再是 33.3 和 % 修改连字符(-)和下划线(_)的规则,当出...

12
  • 时间不限
  • 按相关性排序