...要是开发了一些新功能,同时修正了一些 BUG,强烈各位用户建议升级到该最新稳定版本。新增的主要功能如下: 1. 新增搜索日志管理工具 util.Logger,可用于管理热门搜索、相关搜索、搜索建议和纠错等内容。 [url]http://www.xuns...
这个要考虑一些用户没有安装MBSTRING扩展的情况。 像你这样你可以考虑自己拓展一个 Tokenizer 类,然后根据自己需要生成 tokens 就可以了。 二元分词并不是直接分成N长的若干段,而是 ABCD => AB + BC + CD 你的作法会把 ABCD => AB+CD ...
...问时,可以记录log”,但从你2小时未记录log来看,似乎用户后者搜索引擎能通过别的域名访问你的网站 比如,你在代码中配置的是www.xxxx.com,而蜘蛛通过无www的域名访问 过滤蜘蛛应该用user_agent
...索引时,消耗CPU和缓存如何计算? 2、xunsearch 运行时,用户搜索时,消耗CPU和缓存如何计算? 3、单库搜索支持多大并发,并发数受什么因素影响? 还有一个疑问,Xunsearch 的索引库是把数据缓存到内存中吗?
我刚重新清空刷新了日志,但热门搜索词中出现一些莫名其妙的词 看了一下搜索日志,也没有用户搜索这些词 images(20) 批量(22) 涂料标准(34) 免费资料(32) 技能知识(24) 投产
...ch.log, 猜测search.log只记录系统内置词(scws) 建议如果用户自定了dict_user.txt也一并记录 因为用户自定义的词一般更贴近实际业务,对访客更有帮助和价值
...id时,id可能不是连续区间,使用addRange()不好使. 用例:用户搜索一个关键字后 点击分面搜索结果(某一顶级分类)进一步过滤搜索 所以建议search对象能否增加一个像sphinx api过滤接口: Prototype: function SetFilter ( $attribute, $values, $exc...
...统,也附加提供了一些简单常见的分词规则, 但考虑到用户的个性需求,特意提供了自定义分词器的功能。 > note: 自定义分词器存在一个缺陷,它不支持存储位置信息,也就是不能按短语检索、以及 `NEAR` 之类的 > 语法检索。...
...够精确, 而做这个的目的是为了下一步精准内容推送。用户在看到‘相关内容推荐’,‘相似内容,热度内容’时,肯定是越精准体验越好,反之就失去意义。