搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

71.RE: 麻烦站长解释一下“透过scws_get_result()取数据时自行排除单个字”

发布时间：2010-09-10 14:09 t By johnbaby

[quote='hightman' pid='3685' dateline='1282406611'] 返回的时候根据长度排除啊，GBK的话单字就是2字节，很好判断啊，UTF-8三字节，但也能判断出是不是一个单个的汉字 [/quote] 原来如此。明白了。非常感谢！

72.RE: iis+php5.2.X下配置utf8的scws的问题

发布时间：2011-03-03 23:03 t By hit

[quote='sonictan' pid='4085' dateline='1299146055'] 我根据论坛和ftphp网站上要求，在自己的服务器上配置SCWS，但始终无法分词。我需要的是utf8编码的。测试文件在gbk下好使，应该如何改成utf8格式的？请教管理员，我该如何操作。 :hu...

73.RE: 索引到一大半的时候出错退出，有没有办法继续？

发布时间：2011-10-25 10:10 t By tisswb

...php错误了。判断是不是某条数据是不是已经存在了，可以根据主键来判断是不是已存在，存在的跳过就可以了。例如： [php]$query = "id:1753"; $docs = $xs->search->search($query); print_r($docs);[/php] [/quote] 我是使用util/Indexer.php --source=mysql...

74.RE: [特别发布] 纯PHP编写的xdb词典导入导出工具！！

更新时间：2011-03-01 22:03 t By hit

...的排列的 (我觉得导出文件可能有问题) 创建XDB文件是根据 foreach $rec[$k] 里面的数字排序的那样 XDB和TXT里面的排序完全改变了目前的情况是我导出TXT在创建XDB 分词速度比之前慢了2倍这个问题很想知道原因T-T XDB->...

75.为何导出txt,里面内容不动在创建XDB之后速度变慢很多很多

发布时间：2011-03-03 00:03 t By hit

...的排列的 (我觉得导出文件可能有问题) 创建XDB文件是根据 foreach $rec[$k] 里面的数字排序的那样 XDB和TXT里面的排序完全改变了目前的情况是我导出TXT在创建XDB 分词速度比之前慢了2倍这个问题很想知道原因T-T XDB->...

76.建议过滤器能更加方便的进行配置

发布时间：2013-07-02 16:07 t By yestar

...建议。在数据导入xunsearch有时候需要对数据进行过滤。根据官方的文档进行操作是OK。但是感觉有点小麻烦。每次导入的时候都需要指定过滤器。比如当我导入数据的时候需要输入 ./util/Indexer.php --rebuild --source=mysql://root:1...

77.RE: 三个问题需要求教

更新时间：2011-01-17 16:01 t By hightman

...代码中的 i = 300%2; 就会被认为是 300% 了。。。 3. 由于是根据词库来处理的，繁体词不在词库中就没有办法切分，不过你可以简单的打开 set_duality 功能，这样不认识的散字都会自动按2元切分法，对于搜索来说效果要好于单字。

78.RE: scws_has_word的逻辑问题

发布时间：2010-08-05 15:08 t By backluck

..._t s, char *xattr); 描述：返回指定词性的关键词表，系统会根据词语出现的先后插入列表。参数 xattr 用来描述要排除或参与的统计词汇词性，多个词性之间用逗号隔开。当以~开头时表示统计结果中不包含这些词性，否则...

79.开发规范

...推荐以下命名规范： - 字段名都使用小写命名，您可以根据自己的偏好选择用单数或复数形式，但不要二者同时使用。 - 名字中的单词应使用下划线分割 (例如 product_order)。 - 只在搜索项目中设置搜索结果展示、搜索条件必须用...

80.获取搜索结果

...20 条。 ~~~ 设置排序方式 ----------- 默认情况，搜索结果根据内部算法计算相关度进行排序，采用著名的 `BM25` 算法，这在信息检索概率模型中表现非常优秀，通常只要使用默认的算法即可。通过 [XSSearch::setSort] 我们可以指定...

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索