2006年8月11日星期五

电信竟通过路由器篡改网站内容

  今天,我总算见识了中国互联网领域的一个“超级流氓”。

  起因是早上发现各个RSS阅读器都无法得到我博客的Feed内容,但是我浏览网站却没有感觉有异常。为了查找原因,我使用Feedburner推荐的RSS校验程序Feed Validator对我的Feed链接地址进行检查,这时我惊讶地发现,我的文件竟然被篡改了。文件竟然读出下面的内容:

  <html><body><script language=javascript>document.cookie = "__fwsignature__=jdfw5cac9ac2";window.location = "/rss.xml";</script></body></html>

  怎么解释呢?我自己查看服务器上的内容,完全没有问题,经过一些其他程序的检测,我发现,浏览我网站的所有网页,读出来的内容都是类似上面的代码,但是服务器上查看文件没有任何异常。这段代码是被强行添加上的,当我将IE的“Internet安全级别”设置为高,禁用JavaScript后,发现无法浏览我的博客内容,查看源文件就是上面的代码,因为JavaScript被禁用了,因此没有进行跳转。为了证实不是我网站的问题,我登录到服务器上用IE访问,没有任何问题,在8080端口新开了一个网站,也没有任何问题,看来问题就出在80端口上,某个路由器修改了我的页面代码,我怀疑可能是电信在某个路由器上安装了劫持设备,劫持了我们的HTTP会话,将上面那段代码做为回应包,发送给客户端,造成代码被恶意修改的现象。

  这段代码是非常恶毒的,首先其使得我站点上的全部Feed都因为语法错误而失效,导致所有RSS阅读器都无法更新内容,其次,这段代码让搜索引擎无法继续索引和收录我的网站,再次,这段代码偷偷往用户的客户端写入了一个Cookie,很可能会有恶意功能,最后这样篡改我网站代码无非是为了在我网站上增加一些恶意弹窗广告甚至木马病毒,我每年花几千块钱在你们电信机房托管服务器就是为了让电信干这种勾当吗?电信局的各位流氓老大们,你们想做广告也不用这样耍流氓吧。

Google索引清空-飞来横祸

  上面的图片显示我的Google地图博客的首页已经被Google索引于8月9日删除为空了,这可真是飞来横祸啊。

  目前我已经被迫将上海服务器的全部网站转移到我在广东的服务器上,然后再去找他们协调。下午打电话去上海的机房,他们竟然对我说,路由器不归他们管理,归“上头”管理,“上头”管理的路由器就可以随便往里面加恶意代码吗?这是什么狗屁逻辑。

  目前,为了保留证据,我将自己的www.williamlong.info迁移到广东的服务器,而williamlong.info继续保留在上海,通过Feed合法性校验的页面,分别检验两边的RSS内容,就可以获取了电信局的邪恶罪证。

  http://feedvalidator.org/check.cgi?url=http://williamlong.info/rss.xml

  下图是流氓电信通过路由器篡改我网站的罪证,由于他们将我的rss.xml文件修改为一段有潜在威胁的代码,导致我的rss.xml无法通过feed合法性校验,使得所有的RSS阅读器都无法抓取到我的Feed内容,迫使我不得不将博客迁移到其他服务器。

电信罪证

  http://feedvalidator.org/check.cgi?url=http://www.williamlong.info/rss.xml

  这里是我迁移后,通过上面的校验获得的结果,我们可以看到feedvalidator可以获得正确的rss.xml页面的内容。证明广东这边的路由器还没有添置这种恶意代码。

电信罪证

  我不明白的是,我花了数千元托管自己的服务器,为什么无良电信奸商还要通过如此卑鄙下流的手段往我的网站上添加广告代码,严重影响我的网站运行,打电话投诉,竟然说路由器不归他们管,如此厚颜无耻,他们的良心都让狗吃了吗?

  以前电信局通过路由器篡改IE客户端乱弹广告,我们还能忍受,毕竟那并不是每次都有电信弹窗的,而现在,电信竟然直接明目张胆地篡改服务器上的代码了,这还有没有王法了,这简直就是和尚打伞,无法无天了。我们国家现在不是倡导文明办网吗?为什么中国电信这种超级流氓还敢顶风作案呢?

  下面是我tracert所经过的路由器列表,那个“流氓”路由器应该就是其中的某一台。

  tracert williamlong.info

  Tracing route to williamlong.info [61.151.239.212] over a maximum of 30 hops:

  1     *        *        *     Request timed out.
  2    69 ms    65 ms    65 ms  58.60.19.81
  3    36 ms    35 ms    35 ms  59.40.49.110
  4    36 ms    35 ms    35 ms  58.60.24.49
  5    36 ms    35 ms    35 ms  202.97.64.18
  6    54 ms    53 ms    53 ms  202.97.41.233
  7    59 ms    57 ms    57 ms  202.97.35.29
  8    64 ms    63 ms    65 ms  61.152.81.46
  9   141 ms   159 ms   183 ms  61.152.81.102
 10   144 ms   145 ms   143 ms  218.1.0.201
 11   138 ms   139 ms   141 ms  218.1.1.33
 12   147 ms   147 ms   149 ms  218.1.6.2
 13   147 ms   149 ms   143 ms  218.1.6.70
 14   147 ms   145 ms   145 ms  218.1.26.170
 15   139 ms   139 ms   139 ms  61.151.239.212

  更新:经过我的据理力争,电信方面终于在快晚上的时候修改了路由错误,目前我查看现在网站上的恶意代码已经没有了,我还要再观察几天,如果的确稳定了,就把网站迁移回来。

2006年8月10日星期四

Google Blogsearch(博客搜索)使用技巧

  在过去的几年中,博客已成为观点和信息共享的重要载体,其影响力和传播力也越来越大。Google的博客搜索工具Blogsearch也成为喜爱写作的博客们的重要工具。

  做为一个认真写作的博客,互动交流是写作欲望的基础。“生活在一个没有反馈的世界中,即使他生活在豪华之颠,他也只不过是一个隐士而已”。然而,如何实现与读者之间的互动交流,如何和自己读者之间形成一种对话,并有效地为自己建立一种反馈机制,成为每一个博客作者非常迫切的需要。评论系统和Traceback当然是一种有效的方法,但并不是全部,毕竟不是所有内容发布系统都支持TrackBack Ping机制,很多人对你的文章感兴趣,却不主动去给你留言,这时候,我们就需要一个博客搜索引擎,来主动搜索跟踪全世界博客对你的文章的观点和看法。

  通过Google Blogsearch可以很方便的实现这个有用的功能,举个例子来讲,月光博客的域名是www.williamlong.info,那么在Google Blogger追踪其他人对我的反馈评论就可以使用下面的命令来实现:link:www.williamlong.info,返回的搜索结果可以按照时间或者相关度进行排序,时效性非常强,你可以追踪到一个小时前别人对你文章的评论,最关键的是,搜索结果可以使用RSS输出订阅,因此只需要在RSS阅读器中订阅这个RSS地址,就可以实时追踪到全世界博客对于你文章的引用评论。效果如下图所示:

在RSS阅读器订阅

  优秀的反馈系统可以激发了博客们的写作热情,使他们体会到写作的乐趣。所以,热爱写作的博客们,你们还在等什么呢,赶快去Google Blogsearch订阅自己的引用RSS吧。

  附:几个主要的博客搜索引擎

  做好一个博客搜索引擎实际上并不容易,甚至由于其实时性以及大量更新的特点,要比普通的网页搜索更难做好。一个好的博客搜索要有庞大的索引规模,快速的更新机制,以下几个是目前比较流行的博客搜索引擎,其搜索效果大家可以自己尝试一下,这些搜索引擎都支持搜索结果的RSS订阅。

  Technorati - http://technorati.com

  Google - http://blogsearch.google.com

  Feedster - http://www.feedster.com

  Icerocket - http://www.icerocket.com

2006年8月9日星期三

Blogger.com可能解封了

  今天发现Google Blogger域名blogspot.com已经可以正常访问,怀疑可能是解封了,具体结果还需要多观察几天。

  一个星期前,Blogger也曾经有过短暂的解封,但是后来证实是因为Blogger自己在修改IP地址,并非是解封,而这次发现Blogger的IP地址并没有发生变化,这次是否是解封呢?

  Blogger被封并不是新闻,上个月,印度就曾经封杀了Google的Blogger.com网站,引起印度网民的反弹,事发3天后印度就解封了上述的网站。而Blogger在中国被封已经长达三年多的时间。

  提到Google Blogger,我们不得不提一下微软的Live Spaces。Blogger是Google对抗微软的Live Spaces的产品,微软的Live Spaces是全球第一大博客服务,拥有超过1亿个独立访客。在在8月1日Netcraft公布的2006年7月份统计结果里,Live Spaces一个月里新增了858000个新Blog,而Google的Blogger.com也不弱,增加了568000个新Blog。

  微软的Live Spaces虽然使用量惊人,但是我觉得大部分原因是因为和MSN Messenger互动的结果,使用MSN Messenger的用户大多都喜欢建立一个MSN Spaces和朋友联系,而MSN Spaces入门的门槛很低,操作简便,模版众多,因此也就很容易建立。

  然而微软的Spaces也有一些缺点,最大的缺点就是慢。MSN Spaces继承了微软网络服务的一贯特色-庞大、臃肿、加载缓慢。而Google则恰恰轻装上阵,GMail的简洁而功能强大给人深刻的印象,Blogger也是同样的,操作和浏览界面都非常简洁,但是速度却非常快。

  虽然Google Blogger长期被封,但是我们依旧可以利用Blogger的FTP发布功能来方便地使用这个服务,不过,Google Blogger虽然简单,但是似乎不太符合中文的习惯,比如无法在首页上添加最新留言功能(通过一些很复杂的方法才能实现),每次发文章都要重建一次显得比较麻烦。不过从用户数的持续增长来看,Google Blogger依然是深受用户喜爱的服务。

2006年8月8日星期二

FeedSky的FeedDomain发布

  昨天我在讨论发布Feed不同方法的比较时,我的结论是倾向于使用自己的域名来发布Feed,并比较关注FeedSky正在开发的FeedDomain功能。

  令人出乎意外的是,哈啰波波在我文章里的一则留言告诉我一个消息,就是FeedSky的FeedDomain终于发布了

  FeedDomain是Feedsky推出一项新服务,可以让独立域名的用户将自己的域名与Feed地址绑定,以通过自己的域名来访问自己在Feedsky烧制的Feed。我第一时间登录FeedSky进行了一些测试。

  整个过程和设置一个虚拟主机的操作几乎完全一样,先在Feedsky上设置一下自己要绑定的域名,例如feed.williamlong.info,然后在自己域名的DNS服务器添加一个子域名A记录,域名绑定到:210.72.225.185,绑定成功之后,在浏览器中直接输入绑定的域名,即可直接访问到Feed。具体效果可参见Feed地址http://feed.williamlong.info

  这种绑定和我昨天介绍的域名重定向是不同的,是属于直接将页面Host到了主机上的Feed Host,相当虚拟主机的概念,使用这种方式发布Feed绝对优于直接使用Feedsky发布,我测试后感觉效果非常好。

  前段时间因为FeedBurner事件导致了不少Blogger更换Feed地址到Feedsky,现在,是到了再次更换地址的时候了,将Feedsky的Feed更换到FeedDomain上,你将掌握自己Feed的命运,而不必再看服务商的脸色,当遇到紧急情况时,可以将Feed切换到另外一家服务商。因此使用自己的域名来发布Feed,几乎是只有好处没有坏处,有域名的朋友们,赶快行动起来吧。

2006年8月7日星期一

Feed发布方式的思考

  Feed应该以什么样的形式发布,是一个有争议的问题。

  这些天看到国外Blogger之间的一些讨论,有人认为Feed应该发布在自己的域名上,而不是通过类似FeedBurner这样的服务,这样的好处是,当遇到紧急情况时,他们可以将Feed切换到另外一家服务商。

  这些观点来源于FeedBurner在八月一日发生的那次事故,一些人认为,越为集中发布的Feed就存在越大的风险,如果将Feed地址移动到自己的域名下,这风险就会减少。

  在这方面,FeedSky就正在开发一个有意思的功能-FeedDomain。我虽然对FeedSky印象不好,但是这个功能的确很又用,我可以使用自己的子域名(例如feed.williamlong.info)来访问自己的FeedSky。

  不过这也是有缺点的,就是这个域名是放在FeedSky的,而不是放在我自己的空间,我无法将其指向其他地址。

  我想出来的比较好的方案是,就是在自己的空间上开一个子域名,然后用程序将此域名跳转到FeedBurner,这样订阅此域名实际上就是订阅FeedBurner,而当FeedBurner无法访问的时候,可以修改代码将此域名切换到其他的地址,而对于最终用户来讲不需要做任何操作。具体效果可以参考一下我目前做的这个Feed:feed.williamlong.info ,该域名使用程序进行重定向来实现Feed的功能。

  服务器端代码也很简单,如下:

<?php
header("Location: http://feeds.feedburner.com/williamlong"); /* 重定向浏览器 */
/* 确保重定向后,后续代码不会被执行 */
exit;
?>

  这个方法的缺点是,跳转可能会不太稳定,并加大自己服务器的负载。因此我目前还不打算启用这套方法,等到FeedBurner被封掉的以后,再启用这套方法也不迟。

Z-Blog 1.6静态补丁及其他插件下载

  今天为Z-Blog 1.6制作了2个插件补丁。

  Z-Blog 1.6新版本增加了一些功能,其中的防止垃圾引用的功能和分类RSS输出功能很不错,然而可惜的是,这个版本的目录结构发生了比较大的变化,因此我以前发布的几个Z-Blog需要重新修改一下再发布,我初步看了一下,改动的工作量还真不小,看来我自己的系统升级到1.6还不太容易,只好慢慢来了,于是我干脆直接把Z-Blog 1.6新增加的功能加入到我目前的1.5版本中,目前我的Blog也支持分类RSS了。不过为了其他人比较方便地升级,我这里还是提供了1.6的几个Z-Blog插件,供大家参考。

  Z-Blog 1.6 静态化补丁插件点击下载

  此版本的静态化补丁支持自定义分类目录名,在“分类管理”里编辑目录属性的“别名”,修改为英文目录名。请再执行静态化补丁前一定要修改此项内容,否则将无法生成静态化目录。静态化补丁插件需要修改原版的三个文件:c_system_event.asp 、c_system_lib.asp 、c_system_base.asp。

  使用和安装这个补丁很简单,一般用户使用下面3个操作就可以安装好静态化补丁:

  1、下载原版Z-Blog 1.6 Build 60802

  2、下载月光静态化补丁1.6。将补丁里的三个ASP文件覆盖到原版的FUNCTION目录下,catbuild目录放到PLUGIN目录下。

  3、确认“分类管理”里的目录属性的“别名”已经设置为英文目录名。

  4、重新进行文件重建操作,然后进入“插件管理”,点击“静态分类目录文件生成”。

  此时Z-BLOG的目录文件就被静态化了。分类目录的静态页放在POST目录下,首页的静态页放在根下,名字为index.html。

  手工修改

  如果你的ZBLOG是自己修改过的版本,那么可以使用下面的操作手动进行静态化修改。其操作较为复杂,不建议使用。

  c_system_event.asp 文件的修改:

  785行修改为:

strArchives=strArchives & "<li><a href="""& ZC_BLOG_HOST & ZC_STATIC_DIRECTORY & "/" & Year(dtmYM(i)) & "_" & Right("00"&Month(dtmYM(i)),2) &  "." & ZC_STATIC_TYPE & """>" & Year(dtmYM(i)) & " " & ZVA_Month(Month(dtmYM(i))) & " (" & objRS(0) & ")" +"</a></li>"

  c_system_base.asp文件的修改:

  522-525行修改为:

s=ZC_STATIC_DIRECTORY & "/" &y&"_"&Right("00"&(m-1),2) & "." & ZC_STATIC_TYPE
t=ZC_STATIC_DIRECTORY & "/" &y&"_"&Right("00"&(m+1),2) & "." & ZC_STATIC_TYPE
If m=1 Then s=ZC_STATIC_DIRECTORY & "/" &(y-1)&"_12" & "." & ZC_STATIC_TYPE
If m=12 Then t=ZC_STATIC_DIRECTORY & "/" &(y+1)&"_01" & "." & ZC_STATIC_TYPE

  528行修改为:

strCalendar=strCalendar & "<p class=""y""><a href="""&ZC_BLOG_HOST &s&""">&lt;&lt;</a>  <a href="""& ZC_BLOG_HOST &ZC_STATIC_DIRECTORY & "/"&y&"_"&right("00"&m,2)& "." & ZC_STATIC_TYPE&""">"&y&"·"&m&"</a>  <a href="""&ZC_BLOG_HOST &t&""">&gt;&gt;</a></p>"

  c_system_lib.asp文件的修改:

  33行修改为:

Url = ZC_BLOG_HOST & ZC_STATIC_DIRECTORY & "/" & Alias & "." & ZC_STATIC_TYPE

  1579行修改为:

s=ZC_BLOG_HOST & "catalog.asp?"& t &"page=1"

  1598行修改为:

s=ZC_BLOG_HOST & "catalog.asp?"& t &"page="& i

  1609行修改为:

s=ZC_BLOG_HOST & "catalog.asp?"& t &"page="& intAllPage

  Z-Blog 1.6 全部评论RSS输出插件点击下载

  安装方法:将sydication.asp文件覆盖原来的文件即可。

  全部评论的RSS输出地址是:sydication.asp?cmt=0

2006年8月6日星期日

Google的九个令人烦恼的事实

  前言:这是一篇转载的翻译的文章,原文作者感觉相当偏激,文章的主要观点也缺少有力的证据,但由于此文流传较广,因此我将单独论述一下这篇文章的错误观点。

  关于cookie的安全性,任何网站都可以发布cookie,而不仅仅是Google,包括百度和Yahoo都在使用cookie,我们也完全可以在浏览器设置不接收cookie,即使接收了,也没有明显的证据证明cookie能威胁本地系统的安全。

  关于Google收集个人搜索信息问题,这些信息也许属于隐私,但是我们相信Google会对用户负责的,一个典型的关于搜索资料个人隐私的案例是,为打击网上儿童色情犯罪,美国司法部曾经要求各个搜索引擎提供部分搜索内容,微软和Yahoo都配合了司法部,只有Google对抗美国政府,为了保护用户的隐私,拒不提供搜索请求名单,从而被美国政府告上法庭。然而,法庭的宣判结果却是有利于Google的,Google的这次行为不仅仅赢了美国政府,还赢得了用户的尊敬。因此,如果Google的竞争对手根据这个来攻击Google的话,那实在太不恰当了。

  在美国窃听门事件发生以来,以及近来国内对网络监控的加强,让我不得不钦佩Google公司对它坚守的原则所作出的努力。Google有自己的法则,不会随意倾斜和妥协,这是大部分公司例如微软、Yahoo都无法做到的,至于国内那些纯粹源于商业利益而驱动发展的百度、3721等等比起Google来简直就是小丑一般,不值一提。

  是的,国内永远出不了Google这样的公司,百度和3721热衷于开发流氓软件来强奸用户的浏览器,热衷于将用户搜索信息改变为搜索竞价广告。在他们眼里从来没有“邪恶”这个概念,为了赚钱他们什么事情都做的出来。保护网民的利益?百度们强奸网民还嫌速度慢呢。

  以下是译文:

Google的九个令人烦恼的事实

  很明显,Google不断地在搜集每个人的信息,却拒绝告诉我们为什么这样干。这对我们来说早就不是什么新鲜事了。在Google不能控制搜索结果页是什么样子的时候,他们却能控制谁在什么时候看什么内容。

  Google are clearly gathering information about us but refuse to tell us why. It's nothing new to us, but while they cannot control normal SERPs, they do however control who is viewing what and when.

  我们在页面上运行Google广告是为了生存。但这就意味着我们不应该把下面的信息与你分享吗?如果你知道别的方法可以给我们网站支持,请和我联系。

  We run Google adverts in order to survive. Does this mean we shouldn't share the information below? If you know an alternative way to sustain costs please get in touch.

  如果你察看包含Google Adsense的网页,Google就会追踪你的隐私。但请注意,Google追踪你隐私的办法不止于此。

  Please note, Google does not track you by simply viewing pages containing their adverts.

  1、不死的cookie:

  1. Google's immortal cookie:

  在各家搜索引擎中,Google第一个使用到2038年才过期的cookie。那个时候网站还被禁止使用永久有效的cookie。现在,各家搜索引擎服务提供商都使用永久有效的cookie。因为没有人对这一点有异议,因此Google的行为为整个行业设定了标准。Google的cookie在你的硬盘上放置一个唯一的标识数。不管什么时候,只要你打开Google的网页,如果你的硬盘上没有Google的cookie,Google就会给你放一个。如果你有了,Google就会读取你的标识数并做记录。

  Google was the first search engine to use a cookie that expires in 2038. This was at a time when federal websites were prohibited from using persistent cookies altogether. Now it's years later, and immortal cookies are commonplace among search engines ; Google set the standard because no one bothered to challenge them. This cookie places a unique ID number on your hard disk. Anytime you land on a Google page, you get a Google cookie if you don't already have one. If you have one, they read and record your unique ID number.

  2、Google记录一切他们能记录的东西

  2. Google records everything they can:

  你每做一次搜索,Google就会记录cookie的标识数和递交搜索的IP地址,时间日期,搜索关键词和浏览器配置。Google越来越可能提供基于你IP地址优化的搜索结果,因为IP地址分配和物理位置是有关系的。

  For all searches they record the cookie ID, your Internet IP address, the time and date, your search terms, and your browser configuration. Increasingly, Google is customizing results based on your IP number. This is referred to in the industry as "IP delivery based on geolocation."

  3、Google永久保存他们记录的数据

  3. Google retains all data indefinitely:

  Google内部没有数据保留多久的规定。有证据表明Google能够很方便地接触到搜集和保存的全部用户信息。

  Google has no data retention policies. There is evidence that they are able to easily access all the user information they collect and save.

  4、Google不解释为什么他们需要这些数据

  4. Google won't say why they need this data:

  向Google发出隐私政策的查询总是得不到回应。当纽约时报询问Sergey Brin(Google创始人之一和总裁)Google有没有因为隐私政策信息而受到法庭传唤时,他不予置评(2002-11-28)。

  Inquiries to Google about their privacy policies are ignored. When the New York Times asked Sergey Brin about whether Google ever gets subpoenaed for this information, he had no comment.

  5、Google雇佣间谍

  5. Google hires spooks:

  Matt Cutts,一位重要的工程师,曾经为National Security Agency(1、2)工作。Google希望能够雇佣更多的人来对搜集到的数据进行调查,这样他们就能向华盛顿的间谍们组织叫卖值钱的信息。

  Matt Cutts, a key Google engineer, used to work for the . Google wants to hire more people with security clearances, so that they can peddle their corporate assets to the spooks in Washington.

  6、Google工具栏是间谍软件

  6. Google's toolbar is spyware:

  如果你允许使用高级选项,那么你看的每一个网页都会被工具栏记录并且传送到Google服务器。安装工具栏时候的隐私策略已经承认了这一点,不过那仅仅是因为可能的起诉。Alexa的工具栏干了同样的事情却没有在隐私策略中声明,从而输掉了一桩官司。更糟的是,Google工具栏不会在升级之前询问你的意见,它总是静悄悄的就完成了升级。这意味着,一旦你安装了Google工具栏,每一次你连接到Google网页(一天里有很多次吧),Google就对你的硬盘有完全的访问权限。大多数软件供应商,甚至微软都会询问你是否需要升级。Google不是这样。任何自动升级的软件意味着大量潜在的安全隐患。

  With the advanced features enabled, Google's free toolbar for Explorer phones home with every page you surf, and yes, it reads your cookie too. Their privacy policy confesses this, but that's only because Alexa lost a class-action lawsuit when their toolbar did the same thing, and their privacy policy failed to explain this. Worse yet, Google's toolbar updates to new versions quietly, and without asking. This means that if you have the toolbar installed, Google essentially has complete access to your hard disk every time you connect to Google (which is many times a day). Most software vendors, and even Microsoft, ask if you'd like an updated version. But not Google. Any software that updates automatically presents a massive security risk.

  (译者按:Google Desktop呢?)

  7、Google的网页快照是非法的

  7. Google's cache copy is illegal:

  依据第九巡回法庭将美国版权法应用于互联网的判例判断,Google的网页快照似乎不合法。唯一避免网站被Google保存快照的办法就是在每一个页面里面加上noarchive元标记。浏览者喜欢网页快照,但是网站管理员们不喜欢。很多网站站长已经删除了网站上有问题的内容,却发现这些内容依然存活于网页快照。网页快照应该是可以选择加入或不加入,而不是现在这样,只能选择退出或不退出。

  Judging from Ninth Circuit precedent on the application of U.S. copyright laws to the Internet, Google's cache copy appears to be illegal. The only way a webmaster can avoid having his site cached on Google is to put a "noarchive" meta in the header of every page on his site. Surfers like the cache, but webmasters don't. Many webmasters have deleted questionable material from their sites, only to discover later that the problem pages live merrily on in Google's cache. The cache copy should be "opt-in" for webmasters, not "opt-out."

  8、Google不是你的朋友

  8. Google is not your friend:

  到目前为止,绝大多数网站访问量的75%都来自于Google。如果网站站长要增加流量,他们得先问问Google同不同意。如果站长们想利用Google 半保密半公开的算法中的某些漏洞来得利,他们很快就会被Google惩罚,流量完全没有了。Google没有发布详细公开的惩治流程。对被处罚的网站来说,也找不到任何上诉的途径。Google的行为根本是无法预计的。大多时候Google甚至都不回复网站站长的信件。

  By now Google enjoys a 75 percent monopoly for all external referrals to most websites. Webmasters cannot avoid seeking Google's approval these days, assuming they want to increase traffic to their site. If they try to take advantage of some of the known weaknesses in Google's semi-secret algorithms, they may find themselves penalized by Google, and their traffic disappears. There are no detailed, published standards issued by Google, and there is no appeal process for penalized sites. Google is completely unaccountable. Most of the time Google doesn't even answer email from webmasters.

  9、Google是隐私定时炸弹

  9. Google is a privacy time bomb:

  Google每天承担2亿次的搜索,其中大多数来自美国以外。由此可见,Google已经积累了足可以引发一场隐私灾难的数据。华盛顿那些新上任的负责数据挖掘的官僚做梦都想的高效率早就被Google实现了。

  With 200 million searches per day, most from outside the U.S., Google amounts to a privacy disaster waiting to happen. Those newly-commissioned data-mining bureaucrats in Washington can only dream about the sort of slick efficiency that Google has already achieved.

  原文:Disturbing Facts About Google,译文来自cnBeta。