搜索

大约有 18 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0057秒)

1.强烈建议支持词库里的词可以是纯英文单词

更新时间:2011-04-24 01:04 t By lauxinz

建议支持词库里的词可以是纯英文单词,虽然在分词时英文单词可以自动识别切分开,但在关键词提取和非法词过滤时却无法提取出或过滤掉纯英文单词。 比如:我要从一些商品名中提取一些品牌:adidas nike。。。对商品名分词...

2.关于scws和词库的一些建议

更新时间:2011-04-23 21:04 t By lauxinz

建议支持词库里的词可以是纯英文单词,虽然在分词时英文单词可以自动识别切分开,但在关键词提取和非法词过滤时却无法提取出或过滤掉纯英文单词。 比如:我要从一些商品名中提取一些品牌:adidas nike。。。对商品名分词...

3.英文单次能不能做到词典里删除

发布时间:2011-03-18 17:03 t By caoagui

一段文字里有些英文单词, 但是不想进行分词和统计 加入到词典里, 用!, 但是没有用 咋办?

4.RE: SCWS不支持英文和中英文混合分词吗?

发布时间:2010-08-27 10:08 t By hightman

除中文外其余的只按标点符号或空格切分,无缝连在一起的单词字母是不支持的。

5.RE: 英文模糊搜索问题

发布时间:2013-07-31 14:07 t By hightman

模糊搜索和空格不冲突吧。你单词内模糊就行了,比如按3个字母为单位建立?

6.RE: 英文单次能不能做到词典里删除

发布时间:2011-04-23 02:04 t By 粟术英

[quote='caoagui' pid='4121' dateline='1300441376'] 一段文字里有些英文单词, 但是不想进行分词和统计 加入到词典里, 用!, 但是没有用 咋办? [/quote] 这个可以在get_tops的时候设定 可选择去掉英文属性分词 如下:$tops = $pscws->get...

7.RE: 这个不支持英文词典和中英文混合词典啊

发布时间:2011-12-30 14:12 t By conglei1981

...uote='hightman' pid='7573' dateline='1325211638'] 不知你在说什么。英文不需要词典啊!! [/quote] 我知道英文不需要词典 关键就是这个不需要词典 他的英文分词就没办法控制了,比如我要做计算机专业的分词,其中很多就需要用到一...

8.同义词搜索

...不可以是多个词组成的短语。 > tip: 独立词汇的意思对于英文来说就是一个单词,对于中文来说必须是 `scws` 词库中的一个词。 > _Xunsearch_ 的同义词不同于 _Xapian_,会智能进行字段匹配和转换,您只需维护通用词库。 英文同...

9.RE: 英文模糊搜索问题

发布时间:2013-07-31 15:07 t By homingway

...常感谢! 我刚试了下,针对我的需求来说,对于人物英文名以3个字母为单位建立索引的确可以达到很好的效果,中文名以一个汉字为单位。 最后贴出我的代码给有需要的人: [php] class XSTokenizerUnary implements XSTokenizer { p...

10.RE: 分享一个dict_user.txt

发布时间:2012-02-22 11:02 t By hightman

感谢分享,不过英文单词不需要词库啊。

12
  • 时间不限
  • 按相关性排序