搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

1091.RE: 麻烦站长解释一下“透过scws_get_result()取数据时自行排除单个字”

发布时间：2010-08-22 00:08 t By hightman

返回的时候根据长度排除啊，GBK的话单字就是2字节，很好判断啊，UTF-8三字节，但也能判断出是不是一个单个的汉字

1092.Call to undefined function scws_has_words()

发布时间：2012-08-27 17:08 t By kill-all999

code: var_dump(scws_version()); scws_has_words($sh, $cutword); 打印输出： string(64) "SCWS (Module version:1.0.0, Library version:1.2.0) - by hightman" Fatal error: Call to undefined function scws_has_words() in /letv/data/www/cutword/index.php on line 15 求帮助

1093.RE: small50,big161这种词汇搜索不到

发布时间：2013-06-18 11:06 t By hightman

@FIXME: 先记录一下，这是因为你既是自定义分词器又指定了 non_bool 参与权重计算。那么 SDK 端先按自定义分词器拆分重新组合成查询语句，发送到 xapian 解析器时由于不是 boolean prefix，因此它又会调用内部切词法再次切割。简...

1094.RE: 请教如何在Xunsearch里面设置scws的M选项(multi-child words mode)

发布时间：2012-02-26 03:02 t By hightman

不会的啊，默认就是-M3呀

1095.RE: 请教如何在Xunsearch里面设置scws的M选项(multi-child words mode)

发布时间：2012-02-26 03:02 t By hightman

不会的啊，默认就是-M3呀

1096.RE: 我想问个简单的问题，我的分词有了，然后我怎么使用这些分词啊？

发布时间：2010-05-09 02:05 t By hightman

通常全文检索是按词构建反向索引。即以词条为线索，记录包含该词的文档ID~~ 检索的时候将用户的输入切词后在索引中查找出合适的文档ID再返回。

1097.RE: 1.1.2的自定义字典无法使用

发布时间：2010-05-25 12:05 t By 逆雪寒

[quote='hightman' pid='3574' dateline='1274756194'] 我用IE8在您的网址试了非常多次的强制刷新，MS都是正常的。但用FF确实不正确(而且是一直不正确）。。。我猜到原因所在了，你提交的是GET方法，FF自动在URL中显示汉字，所以可能导...

1098.RE: 我想过滤由‘人’‘得’‘到’‘直’　这几个字组成的关键字

发布时间：2010-05-31 01:05 t By hightman

建议把这些要过滤的词新增加文本词典，属性设为 ! 即可。或者自己根据词性直接在取得返回值的时候排除它。。因为你是包含的作法的话，是不是“人们”“人家”“人民”全都要过滤了？？这样肯定不合适，所以建议直...

1099.RE: scws-1.2.0 发布，支持 PHP5.4 新增用于多线程的 scws_fork()

发布时间：2012-04-02 14:04 t By hightman

~vn,nr 就行了，第二个不要加 ~

1100.RE: libscws的问题

发布时间：2009-12-04 13:12 t By nftw

[quote='hightman' pid='3417' dateline='1259892522'] 从结果看应该是 scws_set_dict(s, "/usr/local/etc/dict_chs_gbk.xdb", SCWS_XDICT_MEM); 这句话出了问题, 也就是可能词典不正确. 但这个词典目前测试在64位系统下也是可以正常工作的, 检查一下词典的字...

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索