2007年最新的 SCWS 第4版已于近日开发完成并测试运行中。它在算法与写法上都有相当大的改进,支持自定义规则的人名等专名自动识别,也支持UTF-8/GBK等不同字符集。经评估测试分词准确率在 95% 左右,召回率有 92% 以上。 这...
mmbb:/usr/src/scws-0.0.1-pre/src# valgrind --tool=memcheck --leak-check=yes ./scwsc -r ../etc/rules.ini -d ../etc/dict.xdb -i "有用过NTFS的朋友抱怨" ==30624== Memcheck, a memory error detector. ==30624== Copyright (C) 2002-2006, and GNU GPL'd, by Julian Seward et al. ==30624== Using LibVE...
转眼间距离 libscws-pre 发布已经半年多了, 这段时间来 scws 伴随着 [url=http://www.ftphp.com]ftphp[/url] 不断的改进和成长, 现在忙里偷闲将 scws 代码整理发布, 并使用 Autoconf, Automake 工具打包发布, 方便大家安装和使用, 也感谢大量网友的...
2010-12-31: SCWS-1.1.5 Released. 1) 修正 xdb.c 中存在的一处缓冲区溢出, 感谢论坛网友 hovea. 2) 修正 phpext/ 中 scws_get_result() 参数解析里多了一个z 的问题,感谢网友(阿男)告知 3) 修正 scws.c 中某些字符在ignore symbol设置下无效的问...
...de #include #include int main(int argc, char *argv[]) { scws_t s; scws_res_t res, cur; char *text;// = "Hello, 我名字叫李那曲是一个中国人, 我有时买Q币来玩, 我还听说过C#语言"; text = "我是一名中国的程序员"; ...
1. 需要重启 xs-searchd 2. 只读取 dict_user.txt 3. 系统的同时生效,但 dict_user.txt 优先级更高 4. 词性完全可以自定义,但最多 2个字节
谢谢hightman的回复! 安装问题已于今日上午解决,也已经能够正常的被php加载上去了。 但是现在有个问题是 无法分词,情况是这样的: 1. 按照统计形式分词,返回结果为空 2. 而按照非统计形式分词,结果是单字,没有词组。 3...
[b]下载地址[/b] [url]http://www.ftphp.com/scws/download.php[/url] [b]主要更新记录如下:[/b] 1) 删除 __PARSE_XATTR__ 宏中企图修改 xattr 的内容的作法, 当 xattr 为常量字符串时会出错. 2) 调整 config.h 的包含方式移入 .c 文件而非 .h 文件 3) ...
...以考虑修改C代码的部分,修改 src/import.h #define DEFAULT_SCWS_MULTI 3 把 3 改为 15 然后重新编译并重建索引就可以了 3. 用自定义分词,自己按字划分
...s php5.3.3/apache/2.2.17 all x64bit, now, all my service is ok but the php_scws.dll, run php got error: ------------------------------------------ PHP Warning: PHP Startup: Unable to load dynamic library 'D:\home\php\ext\php_s cws.dll' - %1 is not a valid Win32 application. in Unknown on line...