搜索

大约有 50 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0054秒)

21.好消息,scws-0.0.1 pre 版发布!!

发布时间:2007-06-09 11:06 t By hightman

...支发布或商业用途(特指出售)等。所有已经正确安装并使用本软件的用户们,希望可以在论坛或其它方式通知我,让我知道有多少人在用它。 本软件承诺不包含任何恶意代码,但由于水平所限,BUG难免。因为本代码的使用或...

22.RE: 能否提供字典dict.xdb的生成程序

发布时间:2009-06-28 21:06 t By hightman

...有这样的php工具. 建议设想能运行 gen_dict, 而 pscws4 不推荐使用, 速度太慢. 地址匹配事实上应该针对地名名词(含缩写,别名)建立词库, 然后将其分词, 提取关键字进行比较, 如果相同即可视为相同. 比如同样是 xx市, 有些人可能...

23.RE: 怎么回事呢 ?

更新时间:2011-08-08 17:08 t By 999

恩,我也出现这样的问题,我编码是GBK,加载txt自定义字典后无法取得字典中的内容。 你这种写法txt会把上面的xdb覆盖掉的。 可以使用add_dict增加xdb字典的后面并优先。

24.RE: 使用scws例子报错,附上全部细节,请大牛帮忙

发布时间:2013-05-07 09:05 t By hightman

scws_set_dict($so, '/dict.utf8.xdb'); scws_set_rule($so, '/rules.utf8.ini'); 问题在这里!!

25.RE: 能否提供新功能

更新时间:2011-01-04 23:01 t By hightman

...(这样不会保存为文件,但仍然可以在当前进程中查询和使用该词典。

26.[特别提供] 纯PHP编写的sqlite词典工具!!

更新时间:2010-07-08 22:07 t By limaoxiang

...一点点扩展,我不是本项目的开发人员,仅仅是因为需要使用这个功能在我的网站上而基于hightman提供的代码的修改,现在返回给项目,希望更多的人能有用。 原因:我希望给网站提供分词功能,但是,我只能用php方式,也不...

27.词库词性标注问题反馈

更新时间:2012-09-04 09:09 t By 任侠001

使用mysql来管理词库,使用enum类型设置attr字段,将提供的xdb格式词库导出,发现存在以下非北大标注标准中的词性: 'df','jb','mq','rr','rz','iv','ld','ln','lx','in','jb','jn','qd','qe','uj','un','vi','vq' 这些应该都算是标注不正确的吧 还有...

28.使用SCWS的libscws C源码,测试分词不成功

发布时间:2014-01-02 18:01 t By banderuilq

1,下载了SCWS的源码,使用其中的libscws; 2,并下载了 [简体中文(UTF-8) (3.9MB,28万词,2013/01/08更新)] scws-dict-chs-utf8.tar.bz2。 3,使用示例代码: #include #include #define SCWS_PREFIX "/usr/local/scws" main() { scws_t s; scws_res_t r...

29.“有空间”的分词有问题和扩充词典

更新时间:2013-05-18 14:05 t By lyjkensou

使用的是scws-1.2.1 对“有空间”这个句子进行分词,理想的结果应该是“有空 空间” 但实际结果是“有空 间” 即使通过scws_add_dict()添加了自定义的txt字典(里面只包含“空间 11.82 12.38”一行),仍然分不出“空间”这个词。...

30.RE: 关于词典中的词性标注

发布时间:2009-08-05 06:08 t By akira

...,已經完成 UTF8 chs + cht 的合併,也自己加了一些詞, 目前使用中,感覺很好。 想回應的是自己在合併過程中,碰到的情況。 在個別將 dict_chs(t).utf8.xdb 導出,倒入資料庫處理時發現,有重複的字詞,這部份不多: chs 部份 ...

12345
  • 时间不限
  • 按相关性排序