...4位系统下也是可以正常工作的, 检查一下词典的字节数是不是没有下载完整. [/quote] 谢谢您的回复,词典是用README中提供的命令生成的 /usr/local/scws/bin/gen_scws_dict -c gbk -i etc/dict_chs_gbk.txt -o /usr/local/scws/etc/dict_chs_gbk.xdb 生成的xd...
...显示当前生效的 php.ini 的路径,再看看你改的 php.ini 是不是正确的被使用了吧。 如果有命令行可以在命令行运行 php -m | grep scws 看看有没有能加载 如果都还不行,可以看看php的运行日志(如果有开启) [/quote] 谢谢 Hightma...
...,如表中“新浪” 词重为6.26 还有,在实际应用中,是不是不用管词频的具体值,只用知道其大小关系就行了? PS:看到之前有的发贴问类似的问题,得到答案说词重是对词频取1000000的对数,我试了一下是不对的! 本人刚...
嗯,这个问题很常见,用户总是误改了一个不是正在用的PHP.INI,然后怎么也想不通
是不是你创建的XDB文件没有调用相应的optimize方法 ? php里有一个 $xdb->Optimize(); 这是在创建文件后必须调用的,即使不调用,效率也不会像你描述的这么慢吧。
search.log 的生成是有一些规则判断和调整的,并不是如你所说的。自定义词典也会纳入考虑,但过于复杂的搜索语句是不会记录的。
...就不会搜索doc这个词 热门搜索一直是不相关的内容,都不是用户真实搜索的结果, 甚至影响到了相关搜索的内容 但由于很多站长要做SEO,又不想屏蔽搜索引擎,请问这个问题如何解决?
.... 自己架设scws分词库程序当然可以导入自己的词库,但是不是每个人都愿意这么做.在线api还是很有优势的.
[quote='hightman' pid='3685' dateline='1282406611'] 返回的时候根据长度排除啊,GBK的话单字就是2字节,很好判断啊,UTF-8三字节,但也能判断出是不是一个单个的汉字 [/quote] 原来如此。明白了。非常感谢!
你这样不是过滤蜘蛛,是“通过代码中的域名访问时,可以记录log”,但从你2小时未记录log来看,似乎用户后者搜索引擎能通过别的域名访问你的网站 比如,你在代码中配置的是www.xxxx.com,而蜘蛛通过无www的域名访问 过滤...