搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

71.RE: SCWS 能否添加 “中文＋英文”和“中文＋数字”自定义词

更新时间：2012-09-03 11:09 t By hightman

scws源码中写死的…… 超过２个字符的英文数字都在第一步被预处理了，所以想要改这个恐怕了也会比较麻烦。

72.RE: XSTokenizerScws的一个使用问题

发布时间：2013-02-02 13:02 t By tisswb

...将其合成为一个词。复合分词是对原本是词的长词情况处理的，比如”中国“可以切成”中“＋”国“＋”中国“ 你的问题必须是 [code] $tk = $tokenizer->setDuality(false)->setIgnore(true)->setMulti(11)->getResult("是一"); [/code] [/quote] ...

73.同义词搜索

...匹配和转换，您只需维护通用词库。英文同义词的特殊处理 ------------------ 英文单词的同义词在 xunsearch 中做了一些个特殊处理： - **统一小写** 统一转换为小写字母进行存储，不支持必须保留大写字母的同义词。 - **同根词...

74.搜索概述

... `API` 进行必要的修饰，再传递给底层的搜索服务器进行处理，然后把匹配的结果返回。具体包括以下步骤： * 构建搜索查询语句 `query`，然后调用 [XSSearch::setQuery] 设定它 * 根据需要设置附加的查询条件：通过 [XSSearch::addWeigh...

75.RE: xunsearch每天凌晨4点左右挂掉（log）

更新时间：2013-05-21 14:05 t By tendyming

没有特别去开进程来修改索引库阿. 我这里只是在数据有更新时才会执行性一次 --rebuild索引, 都是手工来做的. 我们现在的处理方式: 凌晨4:00 固定的去重起xunsearch, 如果没有做，凌晨4：00多就挂掉。很奇怪，每天都这样。。

调用API获取返回结果后，对结果如何进行处理获取自己想要的信息呢？现在获取返回结果是这样的， a:2:{s:6:"status";s:2:"ok";s:5:"words";a:1:{i:0;a:5:{s:4:"word";s:12:"在线测试";s:3:"off";i:0;s:3:"len";i:12;s:3:"idf";d:8.19999980926513671875;s:4:"attr";s:1:"...

77.RE: 关于XS:getExpandedQuery() 方法,获取展开的搜索词列表

发布时间：2011-12-06 14:12 t By hightman

subject 是 FULL 的？FULL的话视为布尔字段了所以不会记录到日志中。我建议你另外开辟一个字段，内容可以和该字段一样，但索引方式不一样来处理。有所冗余，但也是目前最简便的办法吧

78.修正utf-8版make_xdb_file.php的错误

发布时间：2011-06-09 09:06 t By itlong

...看到only support GBK dictionary　到80行，这是不参对utf-8字符处理的，不能对中文(中英混合)字符进行mb_substr($word, 0, $len)切分,[u]mb_substr($word, 0, $len)切分中文会是乱码的。[/u] 所以要人为添加字符串处理涵数，针对utf-8。 [php] functi...

79.RE: 我有10多万条用户搜索记录，导入到日志中，有什么用

发布时间：2012-02-20 16:02 t By hightman

如果是xunsearch搜索日志你不需要手动导入，它已经自动处理过了。外部来的可以导，手册很明确指出搜索日志用于拼音建议、相关搜索。至于你所谓的精准度，似乎毫无关系

80.RE: Indexer 索引管理工具Sql语句书写注意避免出现符号“`”

更新时间：2011-11-28 14:11 t By hightman

这是由于 `` 反引号在 shell 中是特殊处理的，代表在命令执行，所以当 PHP 执行时已经被替换为命令结果了。已在新代码的帮助说明中增加了标注，特别感谢楼主的提示。

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

搜索