2007年5月21日星期一

加盟网站、复制内容和搜索引擎

  (本文为话题广告)这篇文章主要讲述目前流行的加盟网站(Affiliate Program)存在的内容复制的问题,以及搜索引擎可能采取的对策,通过具体的示例来分析这种加盟网站可能存在的风险。

  介绍例子之前,我先介绍一下客齐集这个网站。客齐集是美国著名电子商务公司EBAY的一个子站中的中文版本,它是一种分类信息网站,主要功能是向用户提供发布和查询信息的服务。客齐集在全球二十多个国家开通数百个城市的分类信息业务,在中国,客齐集目前也已在上海、北京、广州、深圳、杭州、成都等几十个城市开通分类信息服务。其数据量非常庞大。

  我今天要讲的主要是客齐集的一个很有争议的功能:频道定制栏目。这个功能号称是“分布式电子商务模式”,客齐集为电子商务应用的主站,各个中小网站通过分类频道的方式形成“分布式”应用,从一个角度来看,客齐集、成员网站都获得了收益,但是从搜索引擎的角度来看,客齐集的加盟网站和搜索引擎两者之间产生一定程度上的利益冲突。并在一个月前发生了百度封杀分类频道的事件。

  分类频道是这种分布式应用的表现形式,简而言之,客齐集分类频道就是让很多小站长通过修改域名DNS的方式,在自己的网站上增加几乎完全相同的分类频道,这样就能在自己的网站上快速形成一个栏目。据了解客齐集频道定制服务推出不到一个月已经有超过4000个网站加入,并以每天超过200个新网站的速度发展。

  值得注意的是,这种分类频道的定制和以往一些应用有所不同。这种分类频道的定制对于个人网站来说比较友好,定制内容也很灵活。为了测试其功能,我自己也注册了一个客齐集的联盟进行试用(域名我就不说了),只需要简单设置一个CNAME域名,就可以得到至少三十万个页面,如果全部页面都被搜索引擎索引,那么会有接近百万个页面的庞大的分类网站。在网站设置上,可以自定义头部代码,侧栏代码,底部代码;还可以方便设置列表页和信息页的代码,增加Adsense广告代码;通过CSS的设置,还可以将客齐集的LOGO图标隐藏。

  从加盟的个人网站的角度来看,只需要简单设置一下CNAME域名,瞬间就得到数十万页的分类信息内容,还可以增加自己的导航图标和广告,自己不用更新,里面的内容还会自己更新,如果这些页面被搜索引擎索引的话,可能还会带来一些流量以及广告收入,这个算盘还真不错。

  从客齐集来讲,这种加盟频道的方式可以有效扩大其知名度,越多人能访问这些内容,自己得到的也越多,损失的只是微不足道的流量。虽然从SEO的角度看,这种方式会在网络上产生大量复制内容,但由于每个分类网站都会给客齐集主站一个链接,这样就保证了客齐集主站具有很高的信用度,因此这些复制内容对主站自身的分类信息不会产生负面影响。

  相对于两方面都收益的联盟,搜索引擎就面临困难的抉择。显然,这是大规模的“复制内容”,也就是说两个或多个网站的网页内容几乎完全相同,或非常相似。搜索引擎必须判断并找到原始版本,然后把其他的复制网页忽略。但是如果页面内容非常庞大,多达数十万页,那么搜索引擎的判断就要耗费大量资源,按照客齐集数千个加盟网站的规模,这些复制内容充斥着互联网,数目极为庞大。

  搜索引擎的抉择是艰难的,搜索引擎最喜欢的是有价值的网页,不喜欢那些高度重复性的内容。对于非常关注用户搜索体验的搜索引擎来说,通常会倾向于对复制内容进行降权甚至惩罚。上个月,百度就痛下杀手,将客齐集的所有联盟网站从百度索引中删除了,这意味着那些联盟网站再也不会从百度中得到任何流量。

  从外界的评论上看,基本上都认为百度的做法没有什么不妥。对于这种复制网页的行为,我也觉得不是一个恰当的做法。道理其实很简单,设置这种“分类定制频道”无非就是想从搜索引擎中获得流量,而大多数人只需要设置一个子域名就可以“获得”数以十万计的海量页面内容,如果这些重复的内容被搜索引擎索引并展示给搜索的用户,那么用户的体验是什么样的呢?对于那些辛辛苦苦勤劳写作的人们来说,这种“不劳而获”的做法公平吗?很显然,搜索引擎为了使得用户获得更好的搜索体验,很有可能会将这些重复内容全部删除,百度就是这么做的,Google目前还没有做出激进的删除行为,可能的原因是其索引算法会自动将复制内容列入“补充材料”或者自动降权。

  因此,加盟这种分类网站虽然有可能获得一些流量,但是也有风险。

  1. 如果使用主域名加入其分销联盟计划,主域名会被百度封杀。
  2. 如果使用子域名加入,子域名也会被百度封杀,但现在还看似乎没有影响主域名。对于Google来说,加盟的网页内容很可能会被加入Google的补充材料

  分类信息网站之所以引人注目,主要原因是其贴近人们的日常生活。就连Google也推出“Google生活搜索”这样的分类信息搜索,可见其重要性。然而,制造垃圾信息是一种罪过,如果分类信息的内容非常好,又何必浪费用户的时间在那些复制内容的页面上呢?

文章声明