...g) #define SCWS_WORD_MALLOCED 0x100 只要将 0x100 改变 0x80 即可,因为 struct scws_word 中定义的 flag 为 unsigned char 即 8bit, 容不下 0x100 导致,所有的 ->flag |= SCWS_WORD_MALLOCED 失效,以至于在 scws.c 中无法正确的释放这些内存。 再次感谢您的...
...度偏慢,要 1.x 秒的响应时间,这个应该是可以优化的,因为您的界面上搜索条件较多,是不是有什么地方没有发挥索引的特性而采用了值比较? 还有一点,首页的热门搜索好像不是效果很好,可能要运营一段时间后再看看。...
..."一件衣服" 代码匹配出来相关度最大的是"你看的书",因为有2个词相同,而按照我们人的字面理解,相似度最大应当是"一件衣服" ,但这个只有1词个相同,所以程序就判断没有2个词相同的相关度大。 这个问题可能涉及到对...
...置词(scws) 建议如果用户自定了dict_user.txt也一并记录 因为用户自定义的词一般更贴近实际业务,对访客更有帮助和价值
... 当然不是这个意思,你说的用 setFuzzy() 就可以实现。 因为分词的关系,有些长词其实可以细分为短词。 比如当一篇文章中包含“管理制度”的时候,它被分为“管理制度”“管理”“制度”三个词,无论搜索这三个词中的...
...。要怎么更新啊,现在研究不出来,不知道要怎么做。 因为现在要做排序,想按照自己要的一些规则排序。 还有查询的时候 $search->setSort($sort); $search->setLimit($limit, $offset)->search(); 他这个是现在整个数据库按我的规则排序后在按...
.../lib/XS.php on line 469 [/quote] 你是不是用的旧版本,这是因为变量使用不严谨导致的,建议在搜索 代码开头用 error_reporting(E_ALL ^ E_NOTICE) 屏蔽NOTICE级的错误 。
...? ! ~ ! ! # j# % D' # k* ) ? ! ? ................ 这是不是因为xdb词典文件的问题呢?改怎么办?多谢各位帮忙,谢谢
...因是对输入的编码做了二次校正。 改法参见 GIT 仓库,因为输入的数据已经统一转成 UTF-8 了,所以搜索服务端应统一使用 UTF-8 即可。 [url]https://github.com/hightman/xunsearch/commit/b02faaf4a5dbf9e85153782d2c5d5cf6b477259a#diff-1[/url]