搜索

大约有 196 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0063秒)

51.RE: 如果能让 我自定义的字典优先匹配呢?

发布时间:2010-10-12 13:10 t By hightman

...义的放后在。 $scws->add_dict(ini_get('scws.default.fpath') . '/dict.utf8.xdb'); $scws->add_dict('/path/to/dict.self.txt', SCWS_XDICT_TXT); 那么就是后面的 dict.self.txt 优先查询,如果 dict.self.txt 中不存在相关记录才会往回查 dict.utf8.xdb,反之也一样

52.使用SCWS的libscws C源码,测试分词不成功

发布时间:2014-01-02 18:01 t By banderuilq

...CWS的源码,使用其中的libscws; 2,并下载了 [简体中文(UTF-8) (3.9MB,28万词,2013/01/08更新)] scws-dict-chs-utf8.tar.bz2。 3,使用示例代码: #include #include #define SCWS_PREFIX "/usr/local/scws" main() { scws_t s; scws_res_t res, cur; ch...

53.RE: 1.1.2的 自定义字典无法使用

更新时间:2010-05-24 14:05 t By hightman

...scws SCWS BugReport => http://www.ftphp.com/scws scws.default.charset => utf8 => utf8 scws.default.fpath => /usr/local/scws/etc => /usr/local/scws/etc [/code] 2. 测试 PHP代码 [code] [hightman@d1 hightman]$ cat 1.php

54.RE: 关于词典中的词性标注

发布时间:2009-08-05 06:08 t By akira

得助於 xdb词典导入导出工具,已經完成 UTF8 chs + cht 的合併,也自己加了一些詞, 目前使用中,感覺很好。 想回應的是自己在合併過程中,碰到的情況。 在個別將 dict_chs(t).utf8.xdb 導出,倒入資料庫處理時發現,有重複的字...

55.RE: Hightman您好,我的分词怎么不对啊

更新时间:2010-08-19 15:08 t By assad

...有文件编码都GBK,但是传到FTP上,用浏览器打开,却成了UTF-8的编码了,显示出乱码了! 不管怎么去设置,每次打开,都成UTF8的,按理说,我的GBK编码的文件,浏览器里应该是也是GBK的,但是却成了UTF8的了 所以我认为分词不...

56.limit 参数好象没有效果。

发布时间:2011-01-28 18:01 t By whjtoby

$scws = scws_new(); $scws->set_charset('utf8'); $xattr = 'Ng,n,nr,ns,nt,nz,vn'; $limit = 5; // 这里没有调用 set_dict 和 set_rule 系统会自动试调用 ini 中指定路径下的词典和规则文件 $scws->send_text("这里没有调用 set_dict 和 set_rule 系统会自动试调用...

57.RE: 在使用scws中遇到的怪问题,是否是bug,估计php缓冲区问题,恳求帮助

发布时间:2010-05-23 10:05 t By hightman

你默认的字符集是 gbk吧?请在 add_dict 前先调用 $so->set_charset('utf8'); 或者直接用 $so = scws_new('utf8');

58.扩展安装问题求助,谢谢

更新时间:2009-05-25 15:05 t By pardis_xiong

...gb2312的,但是从 scws 主页上下载词典文件有好几个,dict.utf8.xdb,dict.xdb和dict_cht.utf8.xdb,我可以把这几个都装到etc文件夹里么?还有那几个ini文件也是一样的问题。 我已经在php.ini中这样配置了: extension = php_scws.dll scws.default.ch...

59.RE: 官方和提供的下载不一样,并且官方实例还写了错误代码

发布时间:2010-07-14 17:07 t By hightman

...看明白。 2. 你的错误是因为你用错误词了,48.php 是针对UTF-8的,而你调用了gbk的词典,把你的词典语句改为 dict.utf8.xdb 即可 3. dict_extra.txt 也必须是UTF-8编码 4. 删除词条,因为陈凯歌其实可能是因为人名关系导致切成词,可能...

60.RE:1265

发布时间:2008-09-09 00:09 t By terry39

...le规则文件就可以了 $cws->set_dict('/usr/local/scws/etc/dict_chs_utf8.xdb'); $cws->set_rule('/usr/local/scws/etc/rules.utf8.ini');

  • 时间不限
  • 按相关性排序