搜索

大约有 665 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0990秒)

291.RE: 分词不对

发布时间:2010-04-26 13:04 t By hightman

多谢汇报,根据词典机械分词存在一定的误分率。 因为该词典从互联网信息为主要语料进行取值,故可能存在一些错误,只要将词典中的 年高 词频调低即可。 若不方便改词典可以加一个文本词典,并将 年高 词频减低。

292.RE: 分词不对

发布时间:2010-04-26 16:04 t By hightman

一个快速解决办法在 rules.ini 及 rules.utf8.ini 的 v + v = 10 之后添加以下一行 q + vn = 10 即可

293.RE: 分词不对

更新时间:2010-04-30 13:04 t By hightman

呃确实存在,这都跟这个词库有关系,是互联网上整理的词库,像“法上”居然是专有名词而且权重很高。。。 可以考虑删除“法上”这个错误的词,外挂一个文本词典把“法上”标记为删除或设成更低权重及词性

294.RE: 关于扩展词库的问题

发布时间:2010-06-02 20:06 t By hightman

这个检测是从左往右检测,因为“冰包”不存在,所以后面的餐桌也就不显示了。 这个是处理上的一个隐规则,或许将来会得到改变。

295.RE: “讨薪”这个词无法取到

发布时间:2010-10-13 17:10 t By hightman

可能因为词库中没有这个词,建议通过外挂一个文本型的扩展词典来解决。参见置顶贴子的说明!

296.RE: Overflow bug

发布时间:2010-12-31 12:12 t By hovea

其实我更应该感谢你,这个程序做的非常棒。我找了很多分词的方案,做得如此精炼的只有这一个。 这个错误造成的coredump 是无法预测的地方,所以非常难定位。

297.RE: XDB词典

发布时间:2011-08-10 09:08 t By hightman

PSCWS23和SCWS的词典不是一个格式。

298.PSCWS23 词典文件如何制作

发布时间:2011-11-28 11:11 t By alicar

PSCWS23 词典文件如何制作 xdb导入导出工具导出信息如下 ---------------------------------- # WORD TF IDF ATTR ---------------------------------- 除了表头,一个都没导出。。。。。。

299.RE: 如何修正分词错误

发布时间:2012-02-22 19:02 t By vanni

定义一个自定义词典,包括下面内容: 了 100 100 e 现在 100 100 时间 100 100

300.求帮助

发布时间:2012-08-08 09:08 t By a12022511

在xdb.class.php中有一个函数Put,可以写入xdb词库.可是put的两个参数格式应该是什么样的?新人刚学php,看不懂的说,能不能有大神给我说一下.谢谢了

  • 时间不限
  • 按相关性排序