搜索

大约有 1,288 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1014秒)

1091.RE: 麻烦站长解释一下“透过scws_get_result()取数据时自行排除单个字”

发布时间:2010-08-22 00:08 t By hightman

返回的时候根据长度排除啊,GBK的话单字就是2字节,很好判断啊,UTF-8三字节,但也能判断出是不是一个单个的汉字

1092.Call to undefined function scws_has_words()

发布时间:2012-08-27 17:08 t By kill-all999

code: var_dump(scws_version()); scws_has_words($sh, $cutword); 打印输出: string(64) "SCWS (Module version:1.0.0, Library version:1.2.0) - by hightman" Fatal error: Call to undefined function scws_has_words() in /letv/data/www/cutword/index.php on line 15 求帮助

1093.RE: small50,big161这种词汇搜索不到

发布时间:2013-06-18 11:06 t By hightman

@FIXME: 先记录一下,这是因为你既是自定义分词器又指定了 non_bool 参与权重计算。 那么 SDK 端先按自定义分词器拆分重新组合成查询语句,发送到 xapian 解析器时由于不是 boolean prefix,因此它又会调用内部切词法再次切割。 简...

1094.RE: 请教如何在Xunsearch里面设置scws的M选项(multi-child words mode)

发布时间:2012-02-26 03:02 t By hightman

不会的啊,默认就是-M3呀

1095.RE: 请教如何在Xunsearch里面设置scws的M选项(multi-child words mode)

发布时间:2012-02-26 03:02 t By hightman

不会的啊,默认就是-M3呀

1096.RE: 我想问个简单的问题,我的分词有了,然后我怎么使用这些分词啊?

发布时间:2010-05-09 02:05 t By hightman

通常全文检索是按词构建反向索引。 即以词条为线索,记录包含该词的文档ID~~ 检索的时候将用户的输入切词后在索引中查找出合适的文档ID再返回。

1097.RE: 1.1.2的 自定义字典无法使用

发布时间:2010-05-25 12:05 t By 逆雪寒

[quote='hightman' pid='3574' dateline='1274756194'] 我用IE8在您的网址试了非常多次的强制刷新,MS都是正常的。但用FF确实不正确(而且是一直不正确)。。。 我猜到原因所在了,你提交的是GET方法,FF自动在URL中显示汉字,所以可能导...

1098.RE: 我想过滤由‘人’‘得’‘到’‘直’ 这几个字组成的关键字

发布时间:2010-05-31 01:05 t By hightman

建议把这些要过滤的词新增加文本词典,属性设为 ! 即可。或者自己根据词性直接在取得返回值的时候排除它。。 因为你是包含的作法的话,是不是“人们”“人家”“人民”全都要过滤了??这样肯定不合适,所以建议直...

1099.RE: scws-1.2.0 发布,支持 PHP5.4 新增用于多线程的 scws_fork()

发布时间:2012-04-02 14:04 t By hightman

~vn,nr 就行了,第二个不要加 ~

1100.RE: libscws的问题

发布时间:2009-12-04 13:12 t By nftw

[quote='hightman' pid='3417' dateline='1259892522'] 从结果看应该是 scws_set_dict(s, "/usr/local/etc/dict_chs_gbk.xdb", SCWS_XDICT_MEM); 这句话出了问题, 也就是可能词典不正确. 但这个词典目前测试在64位系统下也是可以正常工作的, 检查一下词典的字...

  • 时间不限
  • 按相关性排序