搜索

大约有 10 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0988秒)

1.强烈建议支持词库里的词可以是纯英文单词

更新时间:2011-04-24 01:04 t By lauxinz

建议支持词库里的词可以是纯英文单词,虽然在分词时英文单词可以自动识别切分开,但在关键词提取和非法词过滤时却无法提取出或过滤掉纯英文单词。 比如:我要从一些商品名中提取一些品牌:adidas nike。。。对商品名分词...

2.关于scws和词库的一些建议

更新时间:2011-04-23 21:04 t By lauxinz

建议支持词库里的词可以是纯英文单词,虽然在分词时英文单词可以自动识别切分开,但在关键词提取和非法词过滤时却无法提取出或过滤掉纯英文单词。 比如:我要从一些商品名中提取一些品牌:adidas nike。。。对商品名分词...

3.SCWS自定义修改问题

发布时间:2013-11-20 16:11 t By kimiduan

我们在修改的过程中想把书名号里的文字和单词不进行分词处理,请问要如何修改?是不是先判断书名号?

4.RE: SCWS不支持英文和中英文混合分词吗?

发布时间:2010-08-27 10:08 t By hightman

除中文外其余的只按标点符号或空格切分,无缝连在一起的单词字母是不支持的。

5.scws-1.1.6 发布

更新时间:2011-04-20 15:04 t By hightman

...3.3 和 % 3.修改连字符(-)和下划线(_)的规则,当出现在字母单词之间时视为同一词而不再强行切开,此时如果激活复合分词的 DUALITY 选项,则仍能将符号切开作为复合词。 4.修正浮点数的识别规则,避免将IPv4地址识别为2个小数的...

6.分享一个dict_user.txt

发布时间:2012-02-21 16:02 t By Dull

全部是英文单词 数据来源: twitter tumblr amazon alibaba flickr 等的标签 原来多是词组形式 改成了scws的单字形式 没有附加任何属性 也就是说全部使用默认属性 参考 http://www.xunsearch.com/doc/php/guide/index.dict

7.RE: 请问一下,xdb与txt词库那个读取效率更高

发布时间:2013-06-29 22:06 t By hightman

后者是什么意思,举例说明一下吧。SCWS处理英文是按普通单词和数字的规则来做

8.libscws的问题

发布时间:2009-12-02 16:12 t By nftw

...说过C#语言" 这句话进行分词的时候,除了Hello和C#这两个单词,其他都没有切分出来!

9.关于扩展词库的问题

发布时间:2012-12-10 15:12 t By timeage

... n 罗铭 1 0 n 我的原意是想分出我的词典中所有的单词:“罗铭” “铭罗”,但加入到自定义词典后,却完全没有了“铭罗”这个词。 问题2: 如果我想对于一段文字,优先根据自定义词库分出所有在该词库中的内容,...

10.[2013] SCWS-1.2.2 发布,BSD协议、支持自定义词库、PHP5.4

更新时间:2013-07-11 21:07 t By hightman

...33.3 和 % 修改连字符(-)和下划线(_)的规则,当出现在字母单词之间时视为同一词而不再强行切开,此时如果激活复合分词的 DUALITY 选项,则仍能将符号切开作为复合词。 修正浮点数的识别规则,避免将IPv4地址识别为2个小数的...

  • 时间不限
  • 按相关性排序