搜索

大约有 6 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0051秒)

1.RE: 我想过滤由‘人’‘得’‘到’‘直’ 这几个字组成的键字

发布时间:2010-05-31 16:05 t By hightman

哦,那没有这样的功能,也提取不出这样的规则。建议在自己提取返回词时作判断和过滤吧。

2.get_tops 不能限制统计个数

发布时间:2012-03-05 17:03 t By 521vicky20

get_tops 这个不管传入的limit是多少,总是提取前10个键字,演示中的例子也是这个样子,请修正一下。

3.RE: 能否提供字典dict.xdb的生成程序

发布时间:2009-06-28 21:06 t By hightman

...对地名名词(含缩写,别名)建立词库, 然后将其分词, 提取键字进行比较, 如果相同即可视为相同. 比如同样是 xx市, 有些人可能只写 xx 而没写市

4.PSCWS4使用问题

更新时间:2010-10-21 17:10 t By hnmazda

...外一个问题,我使用PSCWS4,是想在发布的文章内容中提取键字,数量大约8个左右就可以了,get_tops()能满足吗?能按匹配到的词的长度排序吗?再次感谢!

5.scws-1.0.0 正式发布 (含php扩展及2文本词典)

更新时间:2010-01-29 13:01 t By hightman

...确率在 90% ~ 95% 之间,已能基本满足一些小型搜索引擎、键字提取 等场合运用。首次雏形版本发布于 2005 年底。 本系统支持的汉字编码包括 GBK、UTF-8

6.关于 SCWS 简易中文分词系统

更新时间:2013-01-10 16:01 t By hightman

...确率在 90% ~ 95% 之间,已能基本满足一些小型搜索引擎、键字提取等场合运用。 切词效率测试(UTF-8编码,随机从天涯抓取了一个连载页面测试结果, 45Kb左右的文本切词时间是0.026秒, 换算完毕大概是 1.5MB文本/秒) 测试过程中开启...

  • 时间不限
  • 按相关性排序