...提取高频词 6.支持GET与POST方式 7.支持短词、二元、主要单字、全部单字(基于scws功能) 8.支持标点过滤(基于scws功能) 简单测试结果: AMD 64位台式机四核CPU,程序加载词库后占用21M内存,使用10进程不间断请求请求,内存无增...
...值,1~15。[b]按位与[/b]的 1|2|4|8 依次表示 短词|二元|主要单字|全部单字。缺省不复合分词。 返回值:无 错误:无 我记得符合 [b]| [/b]应该称为 [b]按位或[/b] 吧。另外这个函数的代码看了觉得有些不对劲: /* hightman.070901: m...
...id=191][img]http://www.hightman.cn/bbs/images/common/back.gif[/img][/url] 单字通常是因为字典没有加载的缘故,看看程序就应该知道字典位置了。 [/quote] 默认放哪里啊?
...检索了,大概有几种办法: 1. 你把词典删除就可以搜索单字了。etc/dict.utf8.xdb ... 2. 或者要强制检索单还可以考虑修改C代码的部分,修改 src/import.h #define DEFAULT_SCWS_MULTI 3 把 3 改为 15 然后重新编译并重建索引...
单字标为 @ 是以前遗留下来的, 未确定词性, 还有一部分被标为 un 了, 建议把 un 改为 '@' ,否则可能导致散字自动聚合成2元分词时会不聚合.