搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

1.自定义的分词文件怎么调用使用

发布时间：2014-11-28 15:11 t By tt123

自定义的分词文件怎么调用使用

2.配置文件的困惑

发布时间：2012-03-16 17:03 t By 张十三

tokenizer 分词器默认为 default 采用内置的功能强大的 scws 分词，适合绝大多数字符串字段。也可以指定自定义分词器，格式为 name 或 name(arg) 两种形式，其中 name 是分词器名称，arg 则是传递给分词器构造函数的参数。自定义分词...

3.RE: 分词初试，结果不对

发布时间：2010-09-19 15:09 t By xiaowang19

...的演示程序（源代码另存为）。 UTF-8版本的一直不成功，分词结果就如我最开始的截图； GBK版本的在保存文件的时候选择文件编码为ANSI，就一切正常了。如果编码选择GB2312，就会出现随便输入一些字符，时行时不行。然后，...

4.新手分词问题

发布时间：2012-07-10 22:07 t By bustard

我的discuz论坛编码是GBK的，安装的xunsearch1.3.2，并按照手册上建立了索引 etc目录下有个dict.utf8.xdb文件是干嘛的啊？我是不是要传一个GBK的xdb文件啊？

5.RE: Windows7 分词准确率极低

发布时间：2010-12-31 10:12 t By hightman

$hdr['fsize'] 是从 XDB 的头部 unpack 出来的，可能 xdb 文件损坏了，PSCWS4的XDB文件必须和SCWS一样，从 www.ftphp.com/scws/ 下载

6.关于 misc/ 目录下的文件

发布时间：2007-06-06 10:06 t By hightman

CWS_cli.php - 命令行分词, 读取标准输入 CWS_query.class.php - PHP 访问 cscwsd 的类库 CWS_file.php - 针对文件分词 CWS_test.web.php - 网页测试 [code] cscwsd-0.0.x (PHP版查询交互程序示例...

7.RE: 使用SCWS的libscws C源码，测试分词不成功

发布时间：2014-01-03 10:01 t By banderuilq

我知道我的问题出在哪了，我把这个文件存储为UTF8格式的文件就好了，输出结果就正常了。

8.scws分词乱码问题，求解

发布时间：2012-07-17 16:07 t By wainilxx7

我用的是scws[PHP-5.4.x (40KB,VC9,NTS)] 分词模块。其中的代码我都没改。我对“调用 segment 方法执行词汇切割”进行分词，分词结果为“Array ( [0] => 璋 [1] => 冪 [2] => 敤 [3] => segment [4] => 鏂 [5] => 规 [6] => 硶 [7] => 鎵 [8] => ц [9] =>  [10]...

9.RE: Hightman您好，我的分词怎么不对啊

更新时间：2010-08-19 15:08 t By assad

...情况，在本地，我测试了一下，程序没半点问题，能正常分词我用FTP传到服务器上，却不行了说明一下：所有文件编码都GBK，但是传到FTP上，用浏览器打开，却成了UTF-8的编码了，显示出乱码了！不管怎么去设置，每次打开...

10.daemon server(linux后台程序)和embed(库的形式嵌入程序中)

更新时间：2010-12-09 23:12 t By lauxinz

...n server指的是这个后台程序使用了scws库，且主要功能就是分词, embed指的就是一个程序使用了scws库，分词只是其中一个环节？daemon server也是embed啊。另外不知道xdb和xtree性能差距有多大？xdb格式没有装入内存，只是在分词过程...

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索