... //设置分词所用规则 $so->set_rule('/usr/local/scws/etc/rules.utf8.ini'); //分词前去掉标点符号 $so->set_ignore(false); //是否复式分割,如“中国人”返回“中国+人+中国人”三个词。 $so->set_multi(false); //设定将文字自动以二字分词法聚...
... if (!(s = scws_new())) { printf("error, can't init the scws_t!\n"); exit(-1); } scws_set_charset(s, "gbk"); scws_set_multi(s, 1); scws_set_dict(s, "/usr/local/etc/dict_chs_gbk.xdb", SCWS_XDICT_MEM); scws_set...
自定义分词器 `Xunsearch` 默认内置了功能强大的 [SCWS][1] 分词系统,也附加提供了一些简单常见的分词规则, 但考虑到用户的个性需求,特意提供了自定义分词器的功能。 > note: 自定义分词器存在一个缺陷,它不支持存...
...011-09-15 14:22:37 +0800 4526e12 hightman: PHP-SDK: 修正 XS 对象解析 ini 字符串时得不到默认项目名的问题 * 2011-09-15 14:12:11 +0800 aab446f hightman: 给 markdown 格式的 README 加上 .md 后缀 * 2011-09-15 11:13:23 +0800 2fe76cf hightman: PHP-SDK: 修正搜索语句中处...
...是这份指南所关注的。假设一个项目的名称 为 `demo` (即 `INI` 文件中 `project.name` 的值),那么它在服务端的索引数据的存储 路径为: ~~~ $prefix/data/demo ~~~ 该目录底下包含 2 个主要索引数据库,分别是 - `db` 默认的主索引数据库...
.../etc/dict.utf8.xdb'); $rr = $so->set_rule('/usr/local/scws/etc/rules.utf8.ini'); //打印返回值 var_dump($rd); var_dump($rr); // $so->set_duality(0); $so->set_ignore(1); $so->set_multi(0); $words = $_GET['words']; //分词 $so->send_text($words); echo($words); //打印搜索...
...har *text = "上海市"; if (!(s = scws_new())) { printf("error, can't init the scws_t!\n"); exit(-1); } scws_set_charset(s, "utf-8"); scws_set_dict(s, "/usr/local/etc/dict.utf8.xdb", SCWS_XDICT_XDB); scws_set_rule(s, "/usr/local/etc/rules.utf8.ini"); scws_set_multi(s , 1); scws_send_...
...ring 即可”。xunsearch/1.4.6 正式版正常,无此情况。 附上ini设置,资源占用信息。[php] ini文件配置信息: project.name = goods project.default_charset = utf-8 server.index = 8383 server.search = 8384 [id] type = id [price] type = numeric 查询操作...
...路径, 如果指定的是名称,则使用 ../app/.ini 作为配置文件 --charset= -c 指定您当前在用以及数据源的字符集,以便系统进行智能转换(默认:UTF-8) --db= -d 指定项目中的数据库名称,默认是名为 ...