...概需求 其实跟 http://bbs.xunsearch.com/showthread.php?tid=1170 这个老兄的需求差不多。 我有3个字段要做这样的搜索 配置是这样的: project.name = city [ID] type = id tokenizer = none [name] index = self tokenizer = xstep(1) cutlen = 15 phrase = yes...
...为 5.2.3 完全按照文档目录 php_scws.dll/Win32 安装说明 这个上面做的。而且安装完扩展之后echo phpinfo();也看到了 scws服务已经有了。 在运行时加了 scws.default.charset (default = gbk) , Changeable = PHP_INI_ALL scws.default.fpath (default = NULL) , Cha...
...果有延迟的话 延迟多长时间了 我这一下午了 也没出来那个几个文件 目录 倒是生成了 郁闷 卸载了 重装 也是那样 哪位大侠 帮俺看看:huh: 搜索报错 错误:[XSException] ../../xunsearch/sdk/php/lib/XS.php(2092): None of database avaiable(S#506) [hr]...
...糊搜索和空格不冲突吧。你单词内模糊就行了,比如按3个字母为单位建立? [/quote] 非常感谢! 我刚试了下,针对我的需求来说,对于人物英文名以3个字母为单位建立索引的确可以达到很好的效果,中文名以一个汉字为单...
...//if ($tf > 13) $idf *= 1.4; return array($tf, $idf); } 有几个问题: 1、当一个词在baidu搜索中找到小于1000篇文章包含该词时,为什么要重新计算count,“21000 - $count * 18” 其中21000是什么?18是什么? 2、对tf的计算过程没明白为...
...//if ($tf > 13) $idf *= 1.4; return array($tf, $idf); } 有几个问题: 1、当一个词在baidu搜索中找到小于1000篇文章包含该词时,为什么要重新计算count,“21000 - $count * 18” 其中21000是什么?18是什么? 2、对tf的计算过程没明白为...
...false) $limit int 数量上限, 若设为 0 则启用默认值 100 个 $offset int 偏移量, 即跳过的结果数量, 默认为 0 $stemmed bool 是否包含处理过的词根同义词, 默认为 false 表示否 {return} array 同义词记录数组, 每个词条为...
...哪?dict.utf8.xdb是新下载的没有动,非常感谢。 另外一个问题,我使用PSCWS4,是想在发布的文章内容中提取关键字,数量大约8个左右就可以了,get_tops()能满足吗?能按匹配到的词的长度排序吗?再次感谢!
...么好的东西先 以下是我的提问: 1.SDK下面的php文件实际是个客户端,那么该php文件是否可以任意放置到系统任何位置,不限制在sdk目录下(不依赖sdk目录下的文件) 2.说明文档中说,如果是与web服务器同机器,那么可以直接require 里面的ph...
...附加提供了一些简单常见的分词规则, 但考虑到用户的个性需求,特意提供了自定义分词器的功能。 > note: 自定义分词器存在一个缺陷,它不支持存储位置信息,也就是不能按短语检索、以及 `NEAR` 之类的 > 语法检索。相当于...