搜索

大约有 546 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1956秒)

151.RE: 分词初试,结果不对

发布时间:2010-09-17 16:09 t By xiaowang19

事实上,我UTF-8的一直不成功,GBK的就会出现那样奇怪的问题 今天我又再试了一下(GBK版本的),在Windows下,在文件保存的时候,选择编码“ANSI”,这样就不会出现那样奇怪的问题了

152.RE: 关于词典和分词

发布时间:2011-03-22 20:03 t By zfzeng

[quote='leeeboo' pid='4129' dateline='1300776583'] set_mutli() php扩展里是否有这个方法 Fatal error: Call to undefined method SimpleCWS::set_mutli() [/quote] 应该是set_multi(0)

153.发现有几种情况会导致分词不准确?

发布时间:2011-09-15 14:09 t By 逆雪寒

scws分词不正确的情况 1、中文夹杂连续两个以上英文或数字(例如:程jj序ii员e 正常,程jjj序ii员e 不正常) 2、英文数字组合中,同时含有连续一个以上英文或数字的组合(例如:w1156k 正常,w16ky不正常) 3、含有任意一个...

154.RE: 遇到一个分词错误的问题

发布时间:2014-02-11 14:02 t By robinjia

不知道还有没有其它更好的解决办法?不能改代码,也必须保留武这个姓。正在考虑加一条规则,可是我不懂那些词性语法规则的运作原理。

155.RE: 请问scws分词如何实现优先级

发布时间:2010-12-30 17:12 t By hightman

提升在词典中的 tf 值

156.RE: 如何获取到分词对应的id

发布时间:2011-01-30 13:01 t By hightman

不存在于词库中的所以没有idf啊,你说的是idf吗?

157.狂赞!很难想像居然会有如此简单易用的分词技术

更新时间:2012-04-22 02:04 t By duyipeng

早就对分词技术做过很多研究,但是却从没发现简单易用的产品,哪怕是收费的。 今天无意中发现了FTPHP的SCWS,安装试用了下,非常棒!关键MMD还是开源免费的,能够自定义各种功能。 强烈支持并持续关注!

158.RE: 对于分词的一些困惑

发布时间:2010-10-13 17:10 t By hightman

由于分词规则开头会先进行中英文粗分,那时就强行把数字、字母与多字节的汉字拆分开。 只有夹在汉字中间的1~2个数字或字终才被允许和汉字组合,比如“T恤” ”Q币“ 这种。 假设你的词典里有”北海36“,被分的句子是...

159.RE: 关于SCWS基于HTTP/POST的分词API的一个问题

发布时间:2011-04-19 15:04 t By tuzwu

...] 感谢管理员回复. 其实我的意思大概可以简化为: 最长分词模式. 分出来的词要达到符合语法的最长.这个难度估计不小,呵呵,也可能是比较不现实的需求. 自己架设scws分词库程序当然可以导入自己的词库,但是不是每个人都愿...

160.本地安装后,分词和v48.php演示不一致,求解?

更新时间:2014-11-27 13:11 t By 28302551@qq.com

在ubuntu12.04下安装了分词,php版本为5.5.19,scws版本1.2.2 http://www.xunsearch.com/scws/demo/v48.php(演示分词) 与本地的分词效果不一样 本地分词结果: 陈凯歌 并 不 是 《 无 极 》 的 唯 一 著 作 权人 , 一 部 电 影 的 整 体 版 权归电...

  • 时间不限
  • 按相关性排序