搜索

大约有 60 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0995秒)

1.自定义的分词文件怎么调用使用

发布时间:2014-11-28 15:11 t By tt123

自定义的分词文件怎么调用使用

2.配置文件的困惑

发布时间:2012-03-16 17:03 t By 张十三

tokenizer 分词器 默认为 default 采用内置的功能强大的 scws 分词,适合绝大多数字符串字段。也可以指定自定义分词器,格式为 name 或 name(arg) 两种形式,其中 name 是分词器名称,arg 则是传递给分词器构造函数的参数。自定义分词...

3.RE: 分词初试,结果不对

发布时间:2010-09-19 15:09 t By xiaowang19

...的演示程序(源代码另存为)。 UTF-8版本的一直不成功,分词结果就如我最开始的截图; GBK版本的在保存文件的时候选择文件编码为ANSI,就一切正常了。如果编码选择GB2312,就会出现随便输入一些字符,时行时不行。 然后,...

4.新手分词问题

发布时间:2012-07-10 22:07 t By bustard

我的discuz论坛编码是GBK的,安装的xunsearch1.3.2,并按照手册上建立了索引 etc目录下有个dict.utf8.xdb文件是干嘛的啊?我是不是要传一个GBK的xdb文件啊?

5.RE: Windows7 分词准确率极低

发布时间:2010-12-31 10:12 t By hightman

$hdr['fsize'] 是从 XDB 的头部 unpack 出来的,可能 xdb 文件损坏了,PSCWS4的XDB文件必须和SCWS一样,从 www.ftphp.com/scws/ 下载

6.关于 misc/ 目录下的文件

发布时间:2007-06-06 10:06 t By hightman

CWS_cli.php - 命令行分词, 读取标准输入 CWS_query.class.php - PHP 访问 cscwsd 的类库 CWS_file.php - 针对文件分词 CWS_test.web.php - 网页测试 [code] cscwsd-0.0.x (PHP版查询交互程序示例...

7.RE: 使用SCWS的libscws C源码,测试分词不成功

发布时间:2014-01-03 10:01 t By banderuilq

我知道我的问题出在哪了,我把这个文件存储为UTF8格式的文件就好了,输出结果就正常了。

8.scws分词乱码问题,求解

发布时间:2012-07-17 16:07 t By wainilxx7

我用的是scws[PHP-5.4.x (40KB,VC9,NTS)] 分词模块。其中的代码我都没改。我对“调用 segment 方法执行词汇切割”进行分词分词结果为“Array ( [0] => 璋 [1] => 冪 [2] => 敤 [3] => segment [4] => 鏂 [5] => 规 [6] => 硶 [7] => 鎵 [8] => ц [9] =>  [10]...

9.RE: Hightman您好,我的分词怎么不对啊

更新时间:2010-08-19 15:08 t By assad

...情况,在本地,我测试了一下,程序没半点问题,能正常分词 我用FTP传到服务器上,却不行了 说明一下:所有文件编码都GBK,但是传到FTP上,用浏览器打开,却成了UTF-8的编码了,显示出乱码了! 不管怎么去设置,每次打开...

10.daemon server(linux后台程序)和embed(库的形式嵌入程序中)

更新时间:2010-12-09 23:12 t By lauxinz

...n server指的是这个后台程序使用了scws库,且主要功能就是分词, embed指的就是一个程序使用了scws库,分词只是其中一个环节?daemon server也是embed啊。 另外不知道xdb和xtree性能差距有多大?xdb格式没有装入内存,只是在分词过程...

  • 时间不限
  • 按相关性排序