...h 是一个高性能、全功能的全文检索解决方案。 //第一个注释 Xunsearch 旨在帮助一般开发者针对既有的海量数据,快速而方便地建立自己的全文搜索引擎。 /* 第二条注释 /* Xunsearch 中文译名为“迅搜”,代码中的经常被缩写...
en 后来改过了,可能没有注意同步这块注释。非常感谢指出来。。。CVS代码已经清除这条注释 。 早期返回是一个静态的 word_st 结构。
很感谢,大致看了版主发布的scws的文件包,很规范,接口和扩展都做的很少,不过就是注释少了点,对我等菜鸟,看的不是很明白!:D 想请问版主一个问题,分词分出来后,怎么选择一个句子的关键词是哪些!
谢谢马老师 [ 应该是吧:-)]的及时回复。 我在研读代码的时候,看到有段代码注释着,是对半字的处理,并不是很理解,对于文字都是1-4字节的UTF-8存储编码。 半字是种什么情况呢?
...,由4个字段组成,字段之间用 \t 或空格分隔: 1) 注释以 # 或 分号开头。 2) 每行由4个字段组成,依次为“词语"(由中文字或[b]3个以下的字母合成[/b]), "TF", "IDF", "词性", 字段时间用空格或制表符分开,数量不限,可自行...
date 字段可以去掉 index = self,INI的注释最好另一起行写。 搜索这么慢可能是硬盘速度太慢了。你是不是加了排序?
to hightman: 在xdict.h文件中,有这么一行注释,能否说明一下: /* return pointer to static data, DO NOT use two or more times in one line, Non-ThreadSafe */ word_t xdict_query(xdict_t xd, const char *key, int len); xdict_query() 不是线程安全的? 看代码xdict_...
... --- 关于文本文件的说明,每行一条记录,#开头表示注释,每条记录由 word、TF、IDF、Attr组成,其中TF是词频系数,IDF是逆词频率系数 而Attr是北大标注法的词性,这四个字段之间用\t隔开。 --- hightman 特别制作于 2009.7.1...