是事方便加我QQ勾通或发测试代码给我 16139558 此外您的代码是直接抓取URL然后转换成DOC入库吗?
谢谢,我用了两台虚拟机安装的,一台出现的比较少,一台碰到大的就一直出现了[hr] http://114.80.193.25/trunkey/index.php?url=www.qq.com您可以试试这个,多刷新几下有时会出现
[XSException] ../../../../usr/local/xunsearch/sdk/php/lib/XS.php(1906): Failed to send the data to server completely (SIZE:8192/15664, REASON:unknown) #0 /usr/local/xunsearch/sdk/php/lib/XS.php(1851): XSServer->write('????????25?????...') #1 /usr/local/xunsearch/sdk/php/lib/XS.php(1058): XSServe...
从提示信息看您往服务端发送15664字节,但实际只有8192字节发送成功,您是用 util/Indexer 来更新数据吗?也许是 server 端卡住,是否同时运行了多个脚本在并发写入呢?是否方便复现。 这种情况是发生在导入数据的什么 阶段?...
感谢 jake 的配合和 DEBUG,目前已经查证原因所在了。 由于 XS 服务端在设计时为了避免资源浪费默认发呆时间为 5秒,如果超过 5秒没有任何动作,服务端会进行主动关闭。 因此当您的代码如下 $xs = new XS(...); $index = $xs->index; ......
php5.3.3 scws_get_result有警告,并得不到分析结果,麻烦看一下 $res = scws_get_result($cws) Warning: scws_get_result() expects exactly 2 parameters, 1 given in /data/web/htdocs/scws.php on line 54 我这样用就OK,并且有结果返回 $res = scws_get_result($cws,null)
返回的时候根据长度排除啊,GBK的话单字就是2字节,很好判断啊,UTF-8三字节,但也能判断出是不是一个单个的汉字
[quote='hightman' pid='3685' dateline='1282406611'] 返回的时候根据长度排除啊,GBK的话单字就是2字节,很好判断啊,UTF-8三字节,但也能判断出是不是一个单个的汉字 [/quote] 原来如此。明白了。非常感谢!
今天刚安装好了,用了很舒服。但有些分好的词都带有某些不重要的字。 如“我的秘密花园”里面的‘我’,‘的’我是都想去掉的。看了你的回帖,但是摸不着头脑是如何通过透过scws_get_result()取数据时自行排除... 还请...