2006年9月20日星期三

正常访问Google网页快照的方法

  目前,Google的网页快照几乎完全无法访问,对Google的使用者来说非常不便,本文将从Google网页快照无法访问的原理出发,逐步分析出一个可以正常访问Google网页快照的方法。

  根据Google自己的介绍,“Google储存网页的快照,当存有网页的服务器暂时出现故障时仍可浏览该网页的内容”。因此说,网页快照服务器本身出问题的可能性非常小,否则就成笑话了,那么为什么我们都无法访问Google网页快照呢?我们只要分析出不能访问的具体原因,就能知道正常访问Google网页快照的方法。

  举个例子分析一下,比如使用Google来搜索“搜索引擎”这个词,可以看到如下图的界面。

Google搜索

  这时我们看一下“网页快照”的URL地址,可以发现是下面的地址:

  http://72.14.235.104/search?q=cache:aPVaeKi1wxcJ:www.baidu.com/+%E6%90%9C%E7%B4%A2%E5%BC%95%E6%93%8E&hl=zh-CN&ct=clnk&cd=1

  根据我们的测试,72.14.235.104这个IP是可以访问的,完全可以ping通,如下图所示,这说明网页快照服务器本身实际没有任何问题,完全可以直接访问到。

Google搜索

  但是我们点击“网页快照”链接后,却出现“该页无法显示”的提示。如下图所示,这显然是关键字过滤的现象。

Google搜索

  为了分析出具体是什么词语影响,我们还可以在Yahoo下搜索“search?q=cache”这个词,会发现Yahoo也出现了“该页无法显示”的提示。

  现在,聪明的读者应该已经明白这意味着什么了。既然知道了原因,那么解决方法应该很简单了。就是在search?和q=cache中插入一些字符,将这个词分开即可,就可以让Google的网页快照“恢复正常”。

  还是上面提到的这个页面的网页快照,我们将“网页快照”的URL地址复制到地址栏,然后将“search?q=cache”中间插入一个“&”符号,使得该词语变成“search?&q=cache”,这时候按下回车,我们就可以看到了久违了的Google网页快照,如下图所示。

Google搜索

  当然,这是分析出网页快照无法使用的原理,具体使用中,如果我们每次都这样用快照,那就显得非常麻烦了,如果大家需要频繁使用,建议安装一些浏览器的开发插件,自动将搜索结果中的字符串进行替换,这样就可以完全自动实现Google网页快照的正常浏览访问,关于详细的代码安装和下载,请查看文章《正常访问Google网页快照的插件代码》。