搜索

大约有 30 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.2014秒)

11.关于词典中的词性标注

发布时间:2007-06-09 12:06 t By hightman

... 处所词 取英语space的第1个字母。 Tg 时语素 时间词性语素。时间词代码为t,在语素的代码g前面置以T。 t 时间词 取英语time的第1个字母。 dec 助词 的、之   deg 助词 得   di 助词 地   etc 助词 等、...

12.daemon server(linux后台程序)和embed(库的形式嵌入程序中)

更新时间:2010-12-09 23:12 t By lauxinz

...加载进内存不仅占用了比较多的内存,而且也需要一定的时间(35万条数据约需要0.3~0.5秒左右)。[/quote] 上文中daemon server(linux后台程序)和embed(库的形式嵌入程序中)有什么区别呢? daemon server指的是这个后台程序使用了scws库,...

13.2007简易分词第4版(scws-0.1.x)体验

发布时间:2007-06-06 11:06 t By hightman

... 这套程序的开发其实很早就开始做基础工作了,持续时间和耗费精力都相当大。开始全部采用纯 php 代码编写,功能基本实现了但发现速度太慢,比以前慢5~8倍,而准确率只比前面的第2/3版提升2个百分点,实在很不爽。 先...

14.编写第一个配置文件

...、作者全文检索,并希望搜索结果能 过滤回贴、按发表时间排序、能按版块过滤。明确了意图之后我们就只需要从数据表中提取必要的 字段即可。 - `pid` 主键,必须的 - `fid` 按版块检索时需要用到 - `tid` 搜索结果阅读链接都是...

15.[特别提供] 纯PHP编写的sqlite词典工具!!

更新时间:2010-07-08 22:07 t By limaoxiang

...网站的PHP的XDB导入导出工具[/url]里面提到的,我花了一些时间DEBUG后也用不了(导出txt总是内存溢出,而由txt生成的XDB在scws23也无效)!最后,我放弃了XDB,但是嘛,直接用TXT也不好,内存占用太大,效率也低。后面,我分析了...

16.RE: [2010] SCWS-1.1.3 发布,支持文本词典实现自定义词库啦!!

更新时间:2010-11-13 10:11 t By snakeyasin

...(由中文字或3个以下的字母合成), "TF", "IDF", "词性", 字段时间用空格或制表符分开,数量不限,可自行对齐以美化。 3) 除“词语”外,其它字段可忽略不写。若忽略,TF和IDF默认值为 1.0 而 词性为 "@" 4) 由于 txt 库动态加...

17.RE: [2010] SCWS-1.1.3 发布,支持文本词典实现自定义词库啦!!

发布时间:2012-11-06 22:11 t By umland

...(由中文字或3个以下的字母合成), "TF", "IDF", "词性", 字段时间用空格或制表符分开,数量不限,可自行对齐以美化。 3) 除“词语”外,其它字段可忽略不写。若忽略,TF和IDF默认值为 1.0 而 词性为 "@" 4) 由于 txt 库动态加...

18.xunsearch-1.4.7 (基于 xapian+scws 的开源中文搜索引擎,诸多细节改进)

发布时间:2013-07-30 11:07 t By hightman

...多支持 40 亿条数据,在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅支持 PHP 语言。API 简单清晰,开发难度极低,提供全中文的示例代码、文档...

19.体验 DEMO 项目

...行为,所以录完数据并不是立刻就能检索到(当然,这个时间差也不会太大)。 所以为稳定起见请稍等几秒再进行下一步的搜索测试。 测试搜索 ------- 首先,我们体验一下正常的搜索,分别以关键词 *项目*、*测试*、*项目测...

20.搜索日志管理

...索词都是异步行为,也就是说执行完命令后需要等待一段时间才能生效。 $Id$

123
  • 时间不限
  • 按相关性排序