搜索

大约有 80 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0049秒)

11.scws分词乱码问题,求解

发布时间:2012-07-17 16:07 t By wainilxx7

的是scws[PHP-5.4.x (40KB,VC9,NTS)] 分词模块。其中的代码我都没改。我对“调 segment 方法执行词汇切割”进行分词分词结果为“Array ( [0] => 璋 [1] => 冪 [2] => 敤 [3] => segment [4] => 鏂 [5] => 规 [6] => 硶 [7] => 鎵 [8] => ц [9] =>  [10]...

12.RE: Hightman您好,我的分词怎么不对啊

更新时间:2010-08-19 15:08 t By assad

...情况,在本地,我测试了一下,程序没半点问题,能正常分词FTP传到服务器上,却不行了 说明一下:所有文件编码都GBK,但是传到FTP上,浏览器打开,却成了UTF-8的编码了,显示出乱码了! 不管怎么去设置,每次打开...

13.RE: 二元分词问题

发布时间:2011-11-15 10:11 t By icebolt

已经实现了一元分词了,不过一元分词以后不能near之类的。还想问一下,我现在想自定义的分词库,从哪里配置

14.二元分词问题

发布时间:2011-11-14 17:11 t By icebolt

... [pid] type = id [subject] index = both tokenizer =xlen(2) 二元分词只能对英文生效,对中文不生效 同时急于需要一元分词,主要是做黑词筛选,因为有的时候就要搜索某些一元词,比如 武器 near/2 售,但是不能实现

15.RE: 二元分词问题

更新时间:2011-11-15 11:11 t By hightman

需要 NEAR 位置信息的话,目前只能内置的 scws 分词 scws 目前不能自定义词库,你必须把词库转换成 dict.utf8.xdb 一个统一的词库放进 $prefix/etc/ 才可以

16.RE: 分词不对

更新时间:2010-04-28 15:04 t By xinbao

锅炉的法上 No. WordString Attr Weight(times) ------------------------------------------------- 01. 法上 nz 14.14(1) 02. 锅炉 n 5.86(1) 分词也不对的[hr] 下载的rules.ini里没有v+v=10这个东西

17.请问SCWS可以做英文分词么?

发布时间:2014-11-18 14:11 t By angelhater

我想对打断的英文做分词,utf-8,scws可以么?应该下载哪个版本呢?PSCWS4 说是速度慢,不推荐使,而PSCWS23 仅支持GBK字符集

18.ubuntu 64位无法分词

发布时间:2013-11-05 12:11 t By luopuya

ubuntu13.04是amd64.iso在虚拟机里安装的 分词几乎都是un 而在另一个32位ubuntu上则正常 字典是完好的的xdb 顺便问下有无txt格式的字典下载,scws_gen_dict生成不知道行否

19.RE: 二元分词问题

发布时间:2011-11-14 23:11 t By hightman

xlen(2) 不是这样的,XLEN 是每次取固定长度。。。。

20.RE: 遇到一个分词错误的问题

发布时间:2014-02-11 10:02 t By hightman

这个就是来辅助调节的,要不断适应修整,这套机制下没有更好的办法了。

  • 时间不限
  • 按相关性排序