[b][size=3]简要说明[/size][/b] cscwsd 是英文全称 C-Simpled Chinese Word Segment Daemon 的首字缩写,这是用标准纯 C 编写,并配合使用 autoconf GNU软件工具包, 基本上可以很方便在的各类 Unix-Like OS 系统下顺利编译执行。目前测试过的有 RedHat...
...那个代码反正我试验是错误的! [php] $cws->add_dict(ini_get("scws.default.fpath").'/dict.xdb'); $cws->add_dict("./dict_extra.txt", SCWS_XDICT_TXT); [/php] 在说说词分词测试: 我的网址:http://sjz.haojishu.com/tools/222.php 官方网址:http://www.ftphp.com/scws/...
... 看了一下确实是宏定义的问题 diff -c -r1.28 -r1.29 *** libscws/scws.c 5 Aug 2011 04:39:33 -0000 1.28 --- libscws/scws.c 26 Oct 2011 08:41:44 -0000 1.29 *************** *** 1278,1284 **** memset(at, 0, cnt); \ cnt = 0; ...
... index=full就行,从实验看,需要设置成index=self(默认采用scws分词),这样就达到了目的。 不过还存在一些问题: 1.有些字段要存两份,分别应对排序和加权场景; 2.对于无分类的情况(我存入的分类id为0),无法实现降权,所...
在ubuntu12.04下安装了分词,php版本为5.5.19,scws版本1.2.2 http://www.xunsearch.com/scws/demo/v48.php(演示分词) 与本地的分词效果不一样 本地分词结果: 陈凯歌 并 不 是 《 无 极 》 的 唯 一 著 作 权人 , 一 部 电 影 的 整 体 版 权归电...
...过你提过的新词生词的TF/IDF计算器(http://www.xunsearch.com/scws/demo/get_tfidf.php) 结果计算出来的大部分内容都是一样的值,而且也无法用于分词。 另外用这个计算器计算得到的TF和IDF值和词典中原先的不一样。 如:词典中的...
...过你提过的新词生词的TF/IDF计算器(http://www.xunsearch.com/scws/demo/get_tfidf.php) 结果计算出来的大部分内容都是一样的值,而且也无法用于分词。 另外用这个计算器计算得到的TF和IDF值和词典中原先的不一样。 如:词典中的...
在ubuntu12.04下安装了分词, http://www.xunsearch.com/scws/demo/v48.php(演示分词) 与本地的分词效果不一样 本地分词结果: 陈凯歌 并 不 是 《 无 极 》 的 唯 一 著 作 权人 , 一 部 电 影 的 整 体 版 权归电 影 制 片 厂 所 有 。 一 ...
...器的设置(合租的服务器,windows环境),所以我只能用scws23了,但是词库我希望自己修改添加,但是XDB,这个格式我用了hightman提供的导入导出工具,就像[url=http://www.hightman.cn/bbs/showthread.php?tid=636]本网站的PHP的XDB导入导出工具[/...
首先惭愧今天才知道scws这么好的项目。。 -________- 。。 最近有个PHP项目需要用到中文分词。。辗转很久来到了这里。。 在本机安装也很顺利,。 不过。。编码用的UTF8 按照文档里面的demo也自己做个小东西。。试试。。。...