搜索

大约有 30 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0082秒)

1.自定义词库用不了。非常不解啊。。

发布时间:2011-10-21 16:10 t By ci169

# mydict_utf8.txt 我是新增词 爆红 再试一个 [php] $text = '最近撑腰体爆红网络我是新增词再试一个'; class scws { public $so; function get_microtime() { list($usec, $sec) = explode(' ', microtime()); return ((float)$usec + (float)$sec); } ...

2.Failed to load the dict file

发布时间:2009-03-19 15:03 t By kumo

...[simpledcws.set-dict]: Failed to load the dict file in D:\website\ dict_utf8.xdb 及 rules.utf8.ini 是放在test.php 同一個資料夾下 另有我試過用 $scws->set_dict('D:\website\dict_utf8.xdb'); 也有相同問題 請問PHP 設定是否特殊要求? PHP Version 5.2.8 Windows...

3.RE: 神奇的 "附加" 一詞

发布时间:2013-08-15 13:08 t By paperjet123

我解壓了 scws-dict-cht-utf8 ,發現大量 (7974個) 詞都給予了詞性un 對比 scws-dict-chs-utf8 (0個詞性un),這是技術問題嗎?

4.XSSearch::getCorrectedQuery

...lse) { return $ret; } $buf = XS::convert($query, 'UTF-8', $this->_charset); $cmd = array('cmd' => XS_CMD_QUERY_GET_CORRECTED, 'buf' => $buf); $res = $this->execCommand($cmd, XS_CMD_OK_QUERY_CORRECTED); if ($res->buf !== '') { $ret = explode("\...

5.2007简易分词第4版(scws-0.1.x)体验

发布时间:2007-06-06 11:06 t By hightman

...的改进,支持自定义规则的人名等专名自动识别,也支持UTF-8/GBK等不同字符集。经评估测试分词准确率在 95% 左右,召回率有 92% 以上。 这套程序的开发其实很早就开始做基础工作了,持续时间和耗费精力都相当大。开始全部...

6.使用SCWS的libscws C源码,测试分词不成功

发布时间:2014-01-02 18:01 t By banderuilq

...CWS的源码,使用其中的libscws; 2,并下载了 [简体中文(UTF-8) (3.9MB,28万词,2013/01/08更新)] scws-dict-chs-utf8.tar.bz2。 3,使用示例代码: #include #include #define SCWS_PREFIX "/usr/local/scws" main() { scws_t s; scws_res_t res, cur; ch...

7.修正utf-8版make_xdb_file.php的错误

发布时间:2011-06-09 09:06 t By itlong

...在65行处看到only support GBK dictionary 到80行,这是不参对utf-8字符处理的,不能对中文(中英混合)字符进行mb_substr($word, 0, $len)切分,[u]mb_substr($word, 0, $len)切分中文会是乱码的。[/u] 所以要人为添加字符串处理涵数,针对utf-8。 [p...

8.XSTokenizerScws

...s->buf); $tmp['word'] = XS::convert($tmp['word'], self::$_charset, 'UTF-8'); $words[] = $tmp; $res = self::$_server->getRespond(); } return $words;} 获取分词结果 getTokens() 方法 public void getTokens($value, $doc=NULL) $value $doc ...

9.填充测试数据的时候出现错误

更新时间:2011-09-19 17:09 t By tisswb

...?[hr] 呃 发现必须的加 -c gbk 由于我使用的putty设置的是utf8的原因, 虽然显示有点不正常,但加上 -c gbk 就可以了

10.复合分词的级别"multi" 可以设置分词的长度吗?

发布时间:2012-07-19 11:07 t By calvin

[php] header("Content-type: text/html; charset=utf-8"); var_dump(SCWS('中文分词解析,我的个神啊')); //中文分词解析 function SCWS($title) { set_time_limit(0); $data = array("data"=>$title,"respond"=>"json","ignore"=>'yes', "multi"=>3); $data = http_build_query($data); $r...

123
  • 时间不限
  • 按相关性排序