搜索

大约有 20 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1009秒)

1.自定义 SCWS 词库

...每个服务端独自使用自己的自定义词典文件。 添加删除修改自定义词库只要编辑该文件即可,以下为相关规范: - 文件为纯文本文件,编码必须是 UTF-8,可用任何编辑器修改 - 每行一条记录表示一个词,每行包含 1~4 个字段...

2.强烈建议支持词库里的词可以是纯英文单词

更新时间:2011-04-24 01:04 t By lauxinz

...最好还是希望hightman来支持一把。 hack如下: 对代码进行修改,可以实现在词库里添加英文单词,修改的地方只有一个。 scws.c 修改一个宏定义即可:(粗体部分为修改的) #define SCWS_PUT_RES(o,i,l,a) \ do { \ scws_res_t res; ...

3.RE: SCWS自定义修改问题

发布时间:2013-11-22 10:11 t By hightman

直接 scws 应该不行,没这个写法,规则集也是建立在非词库词的基础上。

4.[特别提供] 纯PHP编写的sqlite词典工具!!

更新时间:2010-07-08 22:07 t By limaoxiang

...要使用这个功能在我的网站上而基于hightman提供的代码的修改,现在返回给项目,希望更多的人能有用。 原因:我希望给网站提供分词功能,但是,我只能用php方式,也不能修改服务器的设置(合租的服务器,windows环境),所...

5.xunsearch-1.2.0 (基于xapian/scws/php的开源中文全文搜索,自定义词库、搜索日志管理)

发布时间:2011-12-12 17:12 t By hightman

... [url]http://www.xunsearch.com/doc/php/guide/util.logger[/url] 2. 小修改大提升,支持自定义 SCWS 分词词典,文本格式。但旧有索引必须重建,新增的词汇才能生效。 [url]http://www.xunsearch.com/doc/php/guide/index.dict[/url] 3. 其它一些 PHP-SDK 工具...

6.RE: [2010] SCWS-1.1.3 发布,支持文本词典实现自定义词库啦!!

更新时间:2010-10-22 19:10 t By hightman

...,所以当时强制没有过滤。 下一版本会纳入,如需自行修改请按以下方式修改: [code] *** scws.c 8 May 2010 17:28:30 -0000 1.17 --- scws.c 22 Oct 2010 11:09:46 -0000 1.18 *************** *** 1035,1041 **** /* try to parse the sentence */ ...

7.[2013] SCWS-1.2.2 发布,BSD协议、支持自定义词库、PHP5.4

更新时间:2013-07-11 21:07 t By hightman

...的删减词库功能,该功能通过变通的办法解决,并非直接修改核心词库。下面详细介绍一下 scws-1.1.x 的更新日志及用法举例(示例以PHP扩展语言为例)。 最新版下载地址:[url]http://www.xunsearch.com/scws/download.php[/url] -- [b]scws-1.2.2 ...

8.scws加载词库和规则集失败,使用者为啥不知道呢?

更新时间:2010-12-09 22:12 t By lauxinz

...); s->r = scws_rule_new(fpath, s->mblen); }[/code] 建议 hightman 修改一下以上两个函数,增加一下判断即可。或者 提交到 google code 的svn上,大家来修改维护这个中文分词项目。

9.http-scws(基于scws的http协议中文分词) 更新至2.0版

更新时间:2011-06-27 20:06 t By smallevil

...、删除更方便 2.支持gbk与utf-8(基于scws功能) 3.运行中可修改词库,不停服务只需一个命令即可使新词库生效 4.最大150K文本提交 5.可分词、提取高频词 6.支持GET与POST方式 7.支持短词、二元、主要单字、全部单字(基于scws功能) ...

10.RE: 三个问题需要求教

更新时间:2011-01-17 16:01 t By hightman

...un 是指不存在于词库中的字词,对于你这个情况,你可以修改 libscws/scws.c 第 680 行把 attr_un 改为 attr_en 即可,如果需要严格一点可以先判断一下 ch 是否为字母, 如以下: strcpy(wmap[i][i]->attr, SCWS_IS_ALPHA(txt[start-...

12
  • 时间不限
  • 按相关性排序