...很大的cpu,并且data文件夹里的文件大小也一直在变化,是不是虽然索引导入完成,还有一些其他的工作在执行?
... 测试了多种方式,结果均是这种情况。请highman帮忙看看是不是真的有问题,另外我的xunsearch版本1.4.8,1.4.7-dev都不行。
返回的时候根据长度排除啊,GBK的话单字就是2字节,很好判断啊,UTF-8三字节,但也能判断出是不是一个单个的汉字
能否试试打印 add_dict 的返回值,在异常的时候看看是不是 true~ 看了你的贴子我特地再做了一翻测试,add_dict,无没问题。我的相关代码及设置: 1. php.ini的设置 [code] [hightman@d1 hightman]$ php -i | grep scws scws SCWS BugReport => http://w...
...返回值的时候排除它。。 因为你是包含的作法的话,是不是“人们”“人家”“人民”全都要过滤了??这样肯定不合适,所以建议直接根据词性过滤吧。这些无意义的词词性通常可以确定的!
顶一下,再问一遍~ configure: error: Invalid xapian library, maybe not do the patch with scws?. 请问这是为什么啊?是不是我不小心运行那个patch的sh脚本啊!!
...64位系统下也是可以正常工作的, 检查一下词典的字节数是不是没有下载完整. [/quote] 谢谢您的回复,词典是用README中提供的命令生成的 /usr/local/scws/bin/gen_scws_dict -c gbk -i etc/dict_chs_gbk.txt -o /usr/local/scws/etc/dict_chs_gbk.xdb 生成的x...
...面显示当前生效的 php.ini 的路径,再看看你改的 php.ini 是不是正确的被使用了吧。 如果有命令行可以在命令行运行 php -m | grep scws 看看有没有能加载 如果都还不行,可以看看php的运行日志(如果有开启) [/quote] 谢谢 High...
...别,如表中“新浪” 词重为6.26 还有,在实际应用中,是不是不用管词频的具体值,只用知道其大小关系就行了? PS:看到之前有的发贴问类似的问题,得到答案说词重是对词频取1000000的对数,我试了一下是不对的! 本人...
是不是你创建的XDB文件没有调用相应的optimize方法 ? php里有一个 $xdb->Optimize(); 这是在创建文件后必须调用的,即使不调用,效率也不会像你描述的这么慢吧。