搜索

大约有 75 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0043秒)

71.RE: daemon server(linux后台程序)和embed(库的形式嵌入程序中)

更新时间:2010-12-10 15:12 t By lauxinz

...果需要经常频繁的进行分词操作就应该采用mem方式,比如搜索引擎的建索引时主要耗费的时间都花费在分词上,反正现在内存也便宜,而且词典不算太大。如果程序偶尔才需要分一下词,那就没必要load到内存里了。

72.RE: daemon server(linux后台程序)和embed(库的形式嵌入程序中)

发布时间:2010-12-10 15:12 t By hightman

...果需要经常频繁的进行分词操作就应该采用mem方式,比如搜索引擎的建索引时主要耗费的时间都花费在分词上,反正现在内存也便宜,而且词典不算太大。如果程序偶尔才需要分一下词,那就没必要load到内存里了。 [/quote] 恩...

73.关于 SCWS 简易中文分词系统

更新时间:2013-01-10 16:01 t By hightman

...测试大概准确率在 90% ~ 95% 之间,已能基本满足一些小型搜索引擎、关键字提取等场合运用。 切词效率测试(UTF-8编码,随机从天涯抓取了一个连载页面测试结果, 45Kb左右的文本切词时间是0.026秒, 换算完毕大概是 1.5MB文本/秒) 测试...

74.scws-1.0.0 正式发布 (含php扩展及2文本词典)

更新时间:2010-01-29 13:01 t By hightman

...试大 概准确率在 90% ~ 95% 之间,已能基本满足一些小型搜索引擎、关键字提取 等场合运用。首次雏形版本发布于 2005 年底。 本系统支持的汉字编码包括 GBK、UTF-8

75.本站论坛正式启用FullText检索功能

发布时间:2007-06-12 00:06 t By hightman

...检索引擎(计划支持1000万以上贴子) 进入本站论坛,搜索右边的"FullText"即是,实时同步BBS贴子的发布\删除\修改,欢迎提建议。目前直接对dz的代码进行了一些 hack 而制成的,只要在后台打勾就行啦。 顺便征询...

  • 时间不限
  • 按相关性排序