搜索

大约有 20 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1015秒)

1.词性判断

发布时间:2013-09-28 14:09 t By river

自定义字典的时候,有一个字段是词性,这个该怎么判断,如果一个两个就好办,要是词语很多的时候,该怎么判断呢?要怎样用代码实现。

2.自定义“词性

发布时间:2010-06-26 11:06 t By 逆雪寒

不知道现在自定义字典那里。是否能自定义词性呢? 比如,现在我们的搜索, 先判断。如果搜的词 词性属于 产品类。那么我就让他跑产品库去搜索。 比如我定义 电脑 dn dn 就是我自定义的词性。这样我在scws 分词...

3.XSTokenizerScws::hasWord

... $text string 要判断的文本 $xattr string 要判断词性, 参见 getTops 的说明 {return} bool 文本中是否包含指定词性的词汇 源码: sdk/php/lib/XSTokenizer.class.php#L382 (显示) public function hasWord($text, $xattr){ $text = $this->applySet...

4.在 Xunsearch 使用 SCWS

...源参数文本 _$text_ 中的起始偏移位置 - *attr* 这个词汇的词性,使用北大标注 - *word* 分好的词条 ~~~ [php] $text = '迅搜(xunsearch)是优秀的开源全文检索解决方案'; $words = $tokenizer->getResult($text); print_r($words); ~~~ ### 提取重要词汇 调...

5.RE:1268

发布时间:2008-04-08 13:04 t By ianlow

可以添加对词性判断,以及词性的权重比,应该可以达到你想要的效果~ 例如:在SCWS分析以上三句词性得到: 你/r 给/v 我/r 买/v 的/uj 衣服/n 你/r 看/v 的/uj 书/n 一/m 件/q 衣服/n 以此可以看出,其中匹配的是 你/r 的/uj 衣服/n ...

6.RE: scws_has_word的逻辑问题

发布时间:2010-08-05 15:08 t By backluck

..._has_word(scws_t s, char *xattr); 描述:判断text中是包括指定的词性的词汇。参数 xattr 用来描述要排除或参与的统计词汇词性, 多个词性之间用逗号隔开。当以~开头时表示统计结果中不包含这些词性,否则表示必须包含, 传...

7.RE: 遇到一个分词错误的问题

发布时间:2014-02-11 11:02 t By robinjia

...,还是恶俗?大家怎么看的?”这个句子,无论怎么调整词性语法规则表都是会分成“武松杀 /nr 嫂 /ng 雕塑 /n 是 /v 艺术 /n , /un 还是 /n 恶俗 /n ? /un 大家 /r 怎么 /r 看 /v 的 /uj ? /un”。 我的理解是,这是因为程序里并没有判...

8.RE: 搜索的log

发布时间:2012-04-05 10:04 t By hightman

...接口,只要把这些黑词加到自定义词典,并取一个独特的词性,那么就可以用 XSTokenizerScws::hasWord() 的功能来判断是否包含黑词?

9.RE: [2010] SCWS-1.1.3 发布,支持文本词典实现自定义词库啦!!

更新时间:2010-11-13 10:11 t By snakeyasin

...次为“词语"(由中文字或3个以下的字母合成), "TF", "IDF", "词性", 字段时间用空格或制表符分开,数量不限,可自行对齐以美化。 3) 除“词语”外,其它字段可忽略不写。若忽略,TF和IDF默认值为 1.0 而 词性为 "@" 4) 由于 tx...

10.RE: [2010] SCWS-1.1.3 发布,支持文本词典实现自定义词库啦!!

发布时间:2012-11-06 22:11 t By umland

...次为“词语"(由中文字或3个以下的字母合成), "TF", "IDF", "词性", 字段时间用空格或制表符分开,数量不限,可自行对齐以美化。 3) 除“词语”外,其它字段可忽略不写。若忽略,TF和IDF默认值为 1.0 而 词性为 "@" 4) 由于 tx...

12
  • 时间不限
  • 按相关性排序