搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

发布时间：2012-03-16 17:03 t By 张十三

tokenizer 分词器默认为 default 采用内置的功能强大的 scws 分词，适合绝大多数字符串字段。也可以指定自定义分词器，格式为 name 或 name(arg) 两种形式，其中 name 是分词器名称，arg 则是传递给分词器构造函数的参数。自定义分词...

...。访问网址： > note: 在线编辑器暂时不支持指定自定义分词器和分词器参数，这个部分需要用户自行手动修改。 $Id$

更新时间：2014-11-26 17:11 t By 28302551@qq.com

在ubuntu12.04下安装了分词， http://www.xunsearch.com/scws/demo/v48.php（演示分词）与本地的分词效果不一样本地分词结果：陈凯歌并不是《无极》的唯一著作权人，一部电影的整体版权归电影制片厂所有。一 ...

...，请将关联记录转换为搜索项目的新字段并设置对应的分词规则。字段设计很重要，请仔细根据需求创建，字段名建议和您的实际数据库字段一致。 1. ### 定义字段每个字段用一个区段配置来表示，中括号内的名字即为字...

...为了按版块检索，我们必须对它进行索引，而它也不需要分词，所以分词器用内置的 `full`。 - `tid` 内容也是数字的主题ID，我们暂不考虑按主题搜索，所以不需要索引，也没有排序等要求，所以只要当作普通字段存储下来即可...

发布时间：2011-03-03 17:03 t By sonictan

我根据论坛和ftphp网站上要求，在自己的服务器上配置SCWS，但始终无法分词。我需要的是utf8编码的。测试文件在gbk下好使，应该如何改成utf8格式的？请教管理员，我该如何操作。 :huh:

XSTokenizer 分词接口 [XSTokenizer] 是搜索字段的分词接口定义，整个接口只要求实现一个方法 [XSTokenizer::getTokens]，自定义分词器用于 INI 配置文件中的 `tokenizer` 选项。关于自定义分词器的详细用法剖析请阅读后面...

发布时间：2011-11-15 10:11 t By icebolt

已经实现了一元分词了，不过一元分词以后不能用near之类的。还想问一下，我现在想用自定义的分词库，从哪里配置

自定义分词器 `Xunsearch` 默认内置了功能强大的 [SCWS][1] 分词系统，也附加提供了一些简单常见的分词规则，但考虑到用户的个性需求，特意提供了自定义分词器的功能。 > note: 自定义分词器存在一个缺陷，它不支持存...

发布时间：2011-03-03 23:03 t By hit

...ftphp网站上要求，在自己的服务器上配置SCWS，但始终无法分词。我需要的是utf8编码的。测试文件在gbk下好使，应该如何改成utf8格式的？请教管理员，我该如何操作。 :huh: [/quote] 你要注意的是一些文件里面的编码设置