搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

161.scws 1.2.2的问题，为什么PHP调用c扩展和直接在c语言环境下得到的分词结果不一样？

发布时间：2014-02-24 10:02 t By 562586756

比如说“这本书”，在用C语言编译调用scws分词结果为"这／本书"，但是编译为php扩展后调用，结果为"这本书"，没有分掉，同一份代码同一个词库同一个规则集，为什么会出现不一样的结果？

162.RE: 三个问题需要求教

更新时间：2011-01-17 16:01 t By hightman

...只允许一个.）。不过这样可能对于一些情况会误处理，比如代码中的 i = 300%2; 就会被认为是 300% 了。。。 3. 由于是根据词库来处理的，繁体词不在词库中就没有办法切分，不过你可以简单的打开 set_duality 功能，这样不认识的...

163.RE: 搜索蜘蛛来抓取，导致搜索日志不正常，热门搜索一直是不相关的内容

发布时间：2012-05-11 12:05 t By Mr.

...，似乎用户后者搜索引擎能通过别的域名访问你的网站比如，你在代码中配置的是www.xxxx.com，而蜘蛛通过无www的域名访问过滤蜘蛛应该用user_agent [/quote] 我不会去用user_agent的麻烦全部蜘蛛都给判断一次？其实知道这个$...

164.英文模糊搜索问题

发布时间：2013-07-31 10:07 t By homingway

...，最下方是我的具体代码实现，我试验的对象是英文名，比如有两个名字：San Zhang和randy hong，我按照这种方式建立索引后，查询：name:randy后，返回的第一条结果是San Zhang,第二条才是randy hong，很不解啊，同时这个方法也不支持...

165.想在用索引搜索时,输入的关键字不被分词该怎么做？

发布时间：2014-11-20 15:11 t By pbin

...义词库的设置,然后根据文档使用了下,发现没达到效果。比如说,我想搜索拥有"味道恶心"这个词的文章,（我的文档库里面是有相关文章的了）搜索的时候出现了大多都是分成了"XX味道"+"XX恶心"的,所以我就在自定义词库"etc/dict_user...

166.www.adminlink.net.cn上的xunsearch案例

更新时间：2011-12-08 12:12 t By adminlink

...都用到了scws来提取tags. 提取到了tags，然后链接到搜索页比如服饰关键词链接到了 [url]http://www.adminlink.net.cn/websearch/search.php?q=%E6%9C%8D%E9%A5%B0[/url] 页面。整个的搜索页在 [url]http://www.adminlink.net.cn/websearch/search.php[/url] 库内数据总量...

167.在 Xunsearch 使用 SCWS

...以自制一个词典，并将黑词统一设置为一个独特的属性，比如 "@"，那么就可以用该功能判断一段文本是否包含黑词。 ~~~ [php] $text = '...'; if ($tokenizer->hasWord($text, '@')) { // 包含词性为 '@' 的词 } else { // 为包含词性为 '@' 的词...

168.RE: 1.1.2的自定义字典无法使用

更新时间：2010-05-23 22:05 t By 逆雪寒

...C%94%E8%AE%B0%E6%9C%AC%E7%94%B5%E8%84%91%E5%90%97&wq=%E6%90%9C%E7%B4%A2 比如这个:我搜得是 "那是你的笔记本电脑吗" 在 ff 浏览器下. ctrl + f5 强刷新下. 几次就会出现一两次无法分词的问题. 去掉显式,就一点问题都没有了..我实在很无奈...

169.自定义分词器

...始终为 UTF-8 。如果您需要编写带有参数支持的分词器，比如让用户传入按什么字符分割，请参照下面写法编写构造函数： ~~~ [php] class XSTokenizerXyz implements XSTokenizer { private $delim = '-'; // 默认按 - 分割 public function __construct...

170.复合分词的级别"multi" 可以设置分词的长度吗?

发布时间：2012-07-19 11:07 t By calvin

... 具体返回的json 见下面. 我想设置到不要一个字的词, 比如说至少要返回的分词是有两个字符的. "multi"=>3 这个参数可以设置到吗? [code] object(stdClass)#1 (2) { ["status"]=> string(2) "ok" ["words"]=> array(7) { [0]=> object...

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索