搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

11.scws分词乱码问题，求解

发布时间：2012-07-17 16:07 t By wainilxx7

我用的是scws[PHP-5.4.x (40KB,VC9,NTS)] 分词模块。其中的代码我都没改。我对“调用 segment 方法执行词汇切割”进行分词，分词结果为“Array ( [0] => 璋 [1] => 冪 [2] => 敤 [3] => segment [4] => 鏂 [5] => 规 [6] => 硶 [7] => 鎵 [8] => ц [9] =>  [10]...

12.RE: Hightman您好，我的分词怎么不对啊

更新时间：2010-08-19 15:08 t By assad

...情况，在本地，我测试了一下，程序没半点问题，能正常分词我用FTP传到服务器上，却不行了说明一下：所有文件编码都GBK，但是传到FTP上，用浏览器打开，却成了UTF-8的编码了，显示出乱码了！不管怎么去设置，每次打开...

13.RE: 二元分词问题

发布时间：2011-11-15 10:11 t By icebolt

已经实现了一元分词了，不过一元分词以后不能用near之类的。还想问一下，我现在想用自定义的分词库，从哪里配置

14.二元分词问题

发布时间：2011-11-14 17:11 t By icebolt

... [pid] type = id [subject] index = both tokenizer =xlen(2) 二元分词只能对英文生效，对中文不生效同时急于需要一元分词，主要是做黑词筛选用，因为有的时候就要搜索某些一元词，比如武器 near/2 售,但是不能实现

15.RE: 二元分词问题

更新时间：2011-11-15 11:11 t By hightman

需要 NEAR 位置信息的话，目前只能用内置的 scws 分词 scws 目前不能自定义词库，你必须把词库转换成 dict.utf8.xdb 一个统一的词库放进 $prefix/etc/ 才可以

16.RE: 分词不对

更新时间：2010-04-28 15:04 t By xinbao

锅炉的用法上 No. WordString Attr Weight(times) ------------------------------------------------- 01. 法上 nz 14.14(1) 02. 锅炉 n 5.86(1) 分词也不对的[hr] 下载的rules.ini里没有v+v=10这个东西

17.请问SCWS可以做英文分词么？

发布时间：2014-11-18 14:11 t By angelhater

我想对打断的英文做分词，utf-8，scws可以用么？应该下载哪个版本呢？PSCWS4 说是速度慢，不推荐使用，而PSCWS23 仅支持GBK字符集

18.ubuntu 64位无法分词

发布时间：2013-11-05 12:11 t By luopuya

ubuntu13.04是用amd64.iso在虚拟机里安装的分词几乎都是un 而在另一个32位ubuntu上则正常字典是完好的的xdb 顺便问下有无txt格式的字典下载，用scws_gen_dict生成不知道行否

19.RE: 二元分词问题

发布时间：2011-11-14 23:11 t By hightman

xlen(2) 不是这样用的，XLEN 是每次取固定长度。。。。

20.RE: 遇到一个分词错误的问题

发布时间：2014-02-11 10:02 t By hightman

这个就是用来辅助调节的，要不断适应用修整，这套机制下没有更好的办法了。

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索