搜索

大约有 732 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1944秒)

271.RE: 分词切分

发布时间:2010-07-27 10:07 t By hightman

没有,不过你可以自己从分词结果里根据词频过滤

272.RE: 分词初试,结果不对

发布时间:2010-09-17 11:09 t By hightman

希望可以把不对的完整语句发出来。 是否在我们的网站测试页面也一样出现错误呢?谢谢

273.RE: scws与多线程

发布时间:2010-12-08 10:12 t By lauxinz

谢谢回复。 另外scws结构体中:unsigned char *mblen; unsigned int mode;这两个成员也应该是可以多个线程共用的。

274.RE: Overflow bug

发布时间:2010-12-31 15:12 t By hovea

--disable-mmap 红色部分在1.1.4中可以去掉了

275.RE: 能否提供新功能

发布时间:2011-01-04 14:01 t By hightman

这个其实可以通过现有的 libscws 实现的,不过 phpext 里还没有提供。。。

276.RE: 三个问题需要求教

发布时间:2011-01-20 13:01 t By hightman

是1.5你手动改一下吧 或者 patch -p0 libscws/scws.c < scws.patch 你的命令行我没用过不知对不,用上面这句应该肯定可以

277.RE: 三个问题需要求教

发布时间:2011-01-20 18:01 t By hightman

拷的不对吧,缩进没有了。那个很容易看懂吧,手动打也可以,有个+就是加上,有个!是要修改的

278.RE: 有没有更简单的分词啊?

发布时间:2011-03-14 14:03 t By hightman

自建词库就可以

279.RE: 怎么回事呢 ?

更新时间:2011-08-08 17:08 t By 999

恩,我也出现这样的问题,我编码是GBK,加载txt自定义字典后无法取得字典中的内容。 你这种写法txt会把上面的xdb覆盖掉的。 可以使用add_dict增加xdb字典的后面并优先。

280.RE: 求TF/IDF算法。

发布时间:2011-12-26 16:12 t By hightman

那个也不太准,新词你统统设为1就可以

  • 时间不限
  • 按相关性排序