搜索

大约有 9 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1004秒)

1.关于scws和词库的一些建议

更新时间:2011-04-23 21:04 t By lauxinz

...对商品名分词后不能从使用scws_get_words()函数来提取指定属性的词,假如品牌的属性设置为pp,因为这些纯英文词的词性切分后都为/en。在非法词过滤时也是如此,不能使用scws_has_word()函数来判断是否有指定属性的词,假如非法词...

2.强烈建议支持词库里的词可以是纯英文单词

更新时间:2011-04-24 01:04 t By lauxinz

...对商品名分词后不能从使用scws_get_words()函数来提取指定属性的词,假如品牌的属性设置为pp,因为这些纯英文词的词性切分后都为/en。在非法词过滤时也是如此,不能使用scws_has_word()函数来判断是否有指定属性的词,假如非法词...

3.RE: 我想过滤由‘人’‘得’‘到’‘直’ 这几个字组成的关键字

发布时间:2010-05-31 01:05 t By hightman

建议把这些要过滤的词新增加文本词典,属性设为 ! 即可。或者自己根据词性直接在取得返回值的时候排除它。。 因为你是包含的作法的话,是不是“人们”“人家”“人民”全都要过滤了??这样肯定不合适,所以建议直...

4.分词问题,不能分出单个字

更新时间:2013-01-07 15:01 t By rocl

...先的一个回复: 建议把这些要过滤的词新增加文本词典,属性设为 ! 即可。或者自己根据词性直接在取得返回值的时候排除它。。 尝试了下,是可以的!!!多谢

5.RE: 自定义的 txt 字典 有关问题 求助

发布时间:2010-04-09 15:04 t By hightman

那个属性对分词效果有一定影响的,TF主要用于词的切分,IDF用于统计,词性就用在取TOP时过滤或标注上。 最好是基于现有的词典去补充,你重建一个的话数据又都没有效果可能会比较差。SCWS主页上有一个TF/IDF计算器,你可...

6.RE: [2010] SCWS-1.1.3 发布,支持文本词典实现自定义词库啦!!

更新时间:2010-11-13 10:11 t By snakeyasin

... 1) 将非法词汇收集整理,作成 txt 格式文件,统一将其属性设为 '*' 即可 2) 按步骤最后加载黑词词库 3) 在 $cws->send_text($text); 之后 调用 $cws->has_word("*"); 来判断是否包含黑词, 该函数效率较高, 只要判断到一个黑词即返...

7.RE: [2010] SCWS-1.1.3 发布,支持文本词典实现自定义词库啦!!

发布时间:2012-11-06 22:11 t By umland

... 1) 将非法词汇收集整理,作成 txt 格式文件,统一将其属性设为 '*' 即可 2) 按步骤最后加载黑词词库 3) 在 $cws->send_text($text); 之后 调用 $cws->has_word("*"); 来判断是否包含黑词, 该函数效率较高, 只要判断到一个黑词即返...

8.SCWS-php扩展的说明及用法

发布时间:2007-06-07 18:06 t By hightman

...数用法,区别就是不需要传入第一参数(会自动从handle的属性中取值)。

9.[2013] SCWS-1.2.2 发布,BSD协议、支持自定义词库、PHP5.4

更新时间:2013-07-11 21:07 t By hightman

... 1) 将非法词汇收集整理,作成 txt 格式文件,统一将其属性设为 '*' 即可 2) 按步骤最后加载黑词词库 3) 在 $cws->send_text($text); 之后 调用 $cws->has_word("*"); 来判断是否包含黑词, 该函数效率较高, 只要判断到一个黑词即返...

  • 时间不限
  • 按相关性排序