2009年6月28日星期日

谷歌被阴谋陷害之谜

  这两天看到Google Docs上有匿名人士写的一篇文章,称根据谷歌趋势和Google Insights来分析,谷歌上搜索“儿子”后出现的低俗内容都是之前人为刷关键字形成的,为了验证真伪,我也通过使用Google TrendsGoogle insights对“儿子”这个关键词进行了分析。

  根据Google Trends的显示,“儿子”的搜索量在6月17日的时候还非常低,在18日的时候就开始上扬,6月19日达到了顶峰,而央视新闻联播和焦点访谈抨击谷歌的节目正好是在6月18日晚上播出,因此“儿子”的搜索量剧增完全有可能是因为大量观众看完新闻后进行的搜索而产生的,我记得我自己当时看完新闻后就搜索过两次,相信对此关注的网民都会进行一番搜索,从而导致其搜索量的剧增。而下面的新闻引用量的增长恰好和上面的搜索量同步,说明新闻媒体也是在6月19日才大量报道这一新闻的。

谷歌真的被陷害了吗?

Google Trends上关于“儿子”的三十天搜索数据

搜索儿子

Google Trends上关于“儿子”的“搜索建议关键词”的三十天搜索数据

  支持Google的网友的主要根据是下面这张图,这也是比较令我困惑的地方,从这张图上看,的确是这几个关键字从11号开始搜索量上升,并且持续到17号,并且只有北京地区有同时搜索这几个关键词的行为。

搜索儿子

  按道理来说,Google Insights应该和Google Trends的数据是相同的,但是同样的关键字,我在Google Trends上进行查询,却是另一个结果,Google Trends显示这几个关键词在17号的搜索还是0,18号开始猛增,同时搜索城市包括北京、广州、上海三个城市,这两个系统按道理来说都是调用Google的数据中心,为什么同一个数据却出现不同的结果,这也是令我困惑的地方。

搜索儿子

  我在稍后的一篇文章中指出,Google Insights的数据真实性存在极大的疑问,使用Google Insights在全球范围内和单独在北京地区搜索该关键字,呈现出截然不同的两个结果,如下图所示。 

搜索“儿子与情人”

Google Insights搜索“儿子与情人”(全球范围)

搜索“儿子与情人”

Google Insights搜索“儿子与情人”(北京地区)

  从上图可见,单独以北京地区范围搜索“儿子与情人”,会发现其数据和全球范围Google Insights搜索“儿子与情人”的数据有极大出入,北京地区的Google Insights数据呈现完整的曲线,顶峰是6月18日,与Google Trends的曲线基本相同,北京拥有大量网络用户,并曾被匿名用户指责刷数据,但Google Insights这两个曲线明显呈现自相矛盾的地方,很明显,Google Insights对于该关键字搜索的全球数据真实性存在极大的疑问。

  因此,说谷歌搜索“儿子”的信息是“刷”出来的,并没有足够的证据,恰恰相反,反面的证据倒是不少,我在2007年2月,谷歌“搜索建议”刚刚上线的时候,我就曾经截过一幅图,下图就是那时候搜索“儿子”所产生的“搜索建议”,说明搜索这个关键词的确有些问题。

搜索儿子

2007年2月搜索“儿子”截屏

  对于新闻联播和焦点访谈的报道模式以及采访形式,很多人都很反感,因为其对于Google的不良信息有很多夸大其辞和片面的说法,并且后来还出现Google被域名劫持的事件,令大家都很气愤,但是己所不欲、勿施于人,如果我们采用CCTV的形式来反驳CCTV,甚至用一些片面或者带有倾向性的言论进行误导,这反而可能会使事情变得更糟,他们说的谎话已经够多了,如果我们也用谎话来回击他们,那和他们有什么不同呢?