搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

1.复合分词的级别"multi" 可以设置分词的长度吗?

发布时间：2012-07-19 11:07 t By calvin

... header("Content-type: text/html; charset=utf-8"); var_dump(SCWS('中文分词解析,我的个神啊')); //中文分词解析 function SCWS($title) { set_time_limit(0); $data = array("data"=>$title,"respond"=>"json","ignore"=>'yes', "multi"=>3); $data = http_build_query($data); $re = w...

2.RE: SCWS切分的字符串是否有长度限制？

更新时间：2010-08-19 10:08 t By wrongway

...个比方，我要切分一段有200个汉字的字符串，但是返回的分词数组只包含了前100个汉字的词。[hr] 我还是把代码贴出来吧。从返回的分词数组可以看出来，语句的后半句“从下油到火候，从调料到配菜，她都另有一功，炒...

3.SCWS切分的字符串是否有长度限制？

发布时间：2010-08-18 18:08 t By wrongway

在linux下装了scws1.1.2，并且装了php5的扩展，但是发现在分词时对于较长的字符串会自动截取前多少个字符进行切分，不知这是不是一个BUG？

4.RE: SCWS切分的字符串是否有长度限制？

发布时间：2010-08-22 00:08 t By hightman

请仔细看说明，$so->get_result() 并不是一次调用，需要多次调用直到返回FALSE 例子1. 使用类方法分词

5.英文模糊搜索问题

发布时间：2013-07-31 10:07 t By homingway

...都失败了 1. 利用xs自带的scws，这个英文明显是根据空格分词的，所以达不到效果 2. 自己写的一元/二元分词器，某些情况下可以正常工作，不过有时会返回一些意想不到的结果，而且相关度看起来并不高，所以很困惑，最下方...

6.RE: 二元分词问题

发布时间：2011-11-14 23:11 t By hightman

xlen(2) 不是这样用的，XLEN 是每次取固定长度。。。。

7.请注意关于tokenizer 分词器

发布时间：2012-10-24 11:10 t By a114708367

xlen([2]) 表示根据指定参数长度分段取词，如 ABCDEF => AB + CD + EF 用的朋友一定要把中括号去掉变成xlen(2) 否则报错

8.配置文件的困惑

发布时间：2012-03-16 17:03 t By 张十三

tokenizer 分词器默认为 default 采用内置的功能强大的 scws 分词，适合绝大多数字符串字段。也可以指定自定义分词器，格式为 name 或 name(arg) 两种形式，其中 name 是分词器名称，arg 则是传递给分词器构造函数的参数。自定义分词...

9.图片搜索的一些疑问

更新时间：2014-02-16 17:02 t By Mr.

...相等的数据，然后根据hash_196字段按匹配度排序我对xlen分词器不是很了解这个排序mysql可以实现但是mysql分割后的位置不是固定的 project.name = hash project.default_charset = UTF-8 server.index = /dev/shm/xs-indexd.sock server.search = /dev/shm/xs-se...

10.求救PSCWS4问题

发布时间：2010-07-21 10:07 t By FG2008

...s4.class.php'; header("Content-Type:text/html;charset=utf-8"); // 建立分词类对像, 参数为字符集, 默认为 gbk, 可在后面调用 set_charset 改变 $pscws = new PSCWS4('utf-8'); $pscws->set_ignore('yes'); $pscws->set_dict('E:/scws/etc/dict.utf8.xdb'); $pscws->set_rule('E:/scws...

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索