2007年5月22日星期二

加盟网站、复制内容和搜索引擎

  (本文为话题广告)这篇文章主要讲述目前流行的加盟网站(Affiliate Program)存在的内容复制的问题,以及搜索引擎可能采取的对策,通过具体的示例来分析这种加盟网站可能存在的风险。

  介绍例子之前,我先介绍一下客齐集这个网站。客齐集是美国著名电子商务公司EBAY的一个子站中的中文版本,它是一种分类信息网站,主要功能是向用户提供发布和查询信息的服务。客齐集在全球二十多个国家开通数百个城市的分类信息业务,在中国,客齐集目前也已在上海、北京、广州、深圳、杭州、成都等几十个城市开通分类信息服务。其数据量非常庞大。

  我今天要讲的主要是客齐集的一个很有争议的功能:频道定制栏目。这个功能号称是“分布式电子商务模式”,客齐集为电子商务应用的主站,各个中小网站通过分类频道的方式形成“分布式”应用,从一个角度来看,客齐集、成员网站都获得了收益,但是从搜索引擎的角度来看,客齐集的加盟网站和搜索引擎两者之间产生一定程度上的利益冲突。并在一个月前发生了百度封杀分类频道的事件。

  分类频道是这种分布式应用的表现形式,简而言之,客齐集分类频道就是让很多小站长通过修改域名DNS的方式,在自己的网站上增加几乎完全相同的分类频道,这样就能在自己的网站上快速形成一个栏目。据了解客齐集频道定制服务推出不到一个月已经有超过4000个网站加入,并以每天超过200个新网站的速度发展。

  值得注意的是,这种分类频道的定制和以往一些应用有所不同。这种分类频道的定制对于个人网站来说比较友好,定制内容也很灵活。为了测试其功能,我自己也注册了一个客齐集的联盟进行试用(域名我就不说了),只需要简单设置一个CNAME域名,就可以得到至少三十万个页面,如果全部页面都被搜索引擎索引,那么会有接近百万个页面的庞大的分类网站。在网站设置上,可以自定义头部代码,侧栏代码,底部代码;还可以方便设置列表页和信息页的代码,增加Adsense广告代码;通过CSS的设置,还可以将客齐集的LOGO图标隐藏。

  从加盟的个人网站的角度来看,只需要简单设置一下CNAME域名,瞬间就得到数十万页的分类信息内容,还可以增加自己的导航图标和广告,自己不用更新,里面的内容还会自己更新,如果这些页面被搜索引擎索引的话,可能还会带来一些流量以及广告收入,这个算盘还真不错。

  从客齐集来讲,这种加盟频道的方式可以有效扩大其知名度,越多人能访问这些内容,自己得到的也越多,损失的只是微不足道的流量。虽然从SEO的角度看,这种方式会在网络上产生大量复制内容,但由于每个分类网站都会给客齐集主站一个链接,这样就保证了客齐集主站具有很高的信用度,因此这些复制内容对主站自身的分类信息不会产生负面影响。

  相对于两方面都收益的联盟,搜索引擎就面临困难的抉择。显然,这是大规模的“复制内容”,也就是说两个或多个网站的网页内容几乎完全相同,或非常相似。搜索引擎必须判断并找到原始版本,然后把其他的复制网页忽略。但是如果页面内容非常庞大,多达数十万页,那么搜索引擎的判断就要耗费大量资源,按照客齐集数千个加盟网站的规模,这些复制内容充斥着互联网,数目极为庞大。

  搜索引擎的抉择是艰难的,搜索引擎最喜欢的是有价值的网页,不喜欢那些高度重复性的内容。对于非常关注用户搜索体验的搜索引擎来说,通常会倾向于对复制内容进行降权甚至惩罚。上个月,百度就痛下杀手,将客齐集的所有联盟网站从百度索引中删除了,这意味着那些联盟网站再也不会从百度中得到任何流量。

  从外界的评论上看,基本上都认为百度的做法没有什么不妥。对于这种复制网页的行为,我也觉得不是一个恰当的做法。道理其实很简单,设置这种“分类定制频道”无非就是想从搜索引擎中获得流量,而大多数人只需要设置一个子域名就可以“获得”数以十万计的海量页面内容,如果这些重复的内容被搜索引擎索引并展示给搜索的用户,那么用户的体验是什么样的呢?对于那些辛辛苦苦勤劳写作的人们来说,这种“不劳而获”的做法公平吗?很显然,搜索引擎为了使得用户获得更好的搜索体验,很有可能会将这些重复内容全部删除,百度就是这么做的,Google目前还没有做出激进的删除行为,可能的原因是其索引算法会自动将复制内容列入“补充材料”或者自动降权。

  因此,加盟这种分类网站虽然有可能获得一些流量,但是也有风险。

  1. 如果使用主域名加入其分销联盟计划,主域名会被百度封杀。
  2. 如果使用子域名加入,子域名也会被百度封杀,但现在还看似乎没有影响主域名。对于Google来说,加盟的网页内容很可能会被加入Google的补充材料

  分类信息网站之所以引人注目,主要原因是其贴近人们的日常生活。就连Google也推出“Google生活搜索”这样的分类信息搜索,可见其重要性。然而,制造垃圾信息是一种罪过,如果分类信息的内容非常好,又何必浪费用户的时间在那些复制内容的页面上呢?

文章声明

2007年5月21日星期一

Google搜索敏感关键字的新技术

  最近使用Google搜索的时候,发现了一个奇怪的现象,就是在某些特殊的时段,使用Google搜索任意一个关键词,包括以前不能搜索的一些“非法”关键词,都能搜索成功,并且搜索过程中不会出现页面中断的情况。

  以前大家都知道,Google并不是什么词语都可以搜索的,搜索某些特定的关键词的时候,会出现页面无法访问的情况,之后一段时间就无法访问Google。Google一直试图解决这个问题,在去年11月份时,Google通过类似域名重定向功能实现正常访问,不过使用的方法是Google搜索敏感关键字后会自动转向Google.cn域名,然后在页面上提示:“www.google.com暂时无法访问,本页搜索结果来自www.google.cn”。而这时Google.COM的确也无法访问了。

  我个人觉得这种方法显然不很友好,对于不知内情的网民来说,会觉得Google服务不稳定,并且降低访问www.google.com的意愿(谁愿意访问不稳定的网站)。因此那种跳转也是为了应付“Google搜索南京大屠杀”的临时解决方案而已。

  然而令人惊讶的是,在某些时候进行Google搜索,我发现似乎无论在Google.COM搜索任何“敏感关键字”(屠杀、钓鱼岛)都可以返回正常的结果,从用户的角度来看,目前的搜索方式是一个很良好的用户体验,不会出现“该页无法访问”的情况,具体Google使用了什么技术来实现这样的功能,我不很了解其技术细节,不过显然,目前这种技术方案是最理想的,用户从前台看还是访问google.com的网站,而且的确任何关键字都可以搜索,没有出现中断等不友好的现象。

  虽然直接通过Google网站搜索正常了,但是安装了Google工具栏,从工具栏中搜索敏感关键字依旧出现“页面无法访问”的情况,“网页快照”依旧还是不能访问,图片搜索翻几页就全是红叉叉的现象依然存在。Google需要完善的事情还很多啊。

  为了证明关键字并没有选择错误,我访问英文Yahoo搜索同样的关键字,结果显示“该页无法访问”,说明关键字的确还是被过滤的状态,之后我Ping了一下Google.COM的IP,发现会出现www-china.l.google.com域名的字样,返回的IP地址66.249.89.99,查询得到的结果似乎是美国。

  大家也可以在浏览器里打开Google.com,看一看搜索“屠杀”等关键字是否能正常返回结果,然后通过Yahoo.com搜索一下看看是什么结果,希望这并不只是我一个地方能正常显示。

  产生这种现象的原因,我推测,一种可能是长城防火墙升级了,对于Google的IP放开不进行审查了,或者审查的条件放宽松了,一种可能是Google通过技术手段绕开了防火墙,如果是这个的话,我不得不感叹,技术的发展是日新月异的,没有什么东西是技术上不能实现的。

2007年5月19日星期六

FeedBurner将被Google收购?

  Feedburner最近是消息不断,首先是Feedburner推出了中文版本,进入FeedBurner首页后点“languages”,就可以选择简体中文。另外一则未经证实的消息是Google即将收购FeedBurner。

  中文版的首页字体设置的不太好,看来只是把文字换为中文了。大部分文字翻译为中文了,一部分还没有翻译,不过翻译的质量我就不敢恭维了,比如“内容优化”页面的这一段“给你的种子安上飞毛腿-把你的订阅链接合并为一个种子可以让你的作品让尽可能多的观众欣赏,它能在任何阅读器、桌面、网页、移动设备上被浏览”。翻译的是不是让人摸不清头脑?

FeedBurner中文版

  不过总的来说,有了中文版本,对于很多不懂英文的用户来说,可以更方便的使用FeedBurner的服务,对于扩大FeedBurner在中国的影响力也是有好处的。不过中文版本的翻译质量还需要提高啊。

  另一则未经证实的消息是webleon那里转发的,说Google有意收购FeedBurner,收购价格约为1亿美元,不知道这个消息是否可靠。

  对于我来说,我一直在用FeedBurner的服务,我还不能确定FeedBurner的这一连串行为会有什么结果,如果FeedBurner能在保持服务稳定性的前提下进入中国,会吸引大众的眼球,但也可能会被有关部门注意了,要是那样的话就不好了。

Google生活搜索试用

  中文的Google实验室又多了一个新的成员:Google生活搜索。搜索内容包含房屋、工作、火车票(为啥没有飞机票?)、物品、餐饮的信息搜索。

  读者Blue在投递中指出,“Google生活搜索是专门针对中国市场,可以搜索房屋,工作,火车票,物品,餐饮,可以选择大陆三十多个城市,虽然地址是.cn,但进入搜索时发现地址是.com,利用的主站数据,和网站导航,热榜一样,在索引数据库的基础上再度深挖而成,没有多少创新。但感觉今年上半年谷歌新产品出产速度的确较快,急于扩展更多市场。这块领域好像百度还未涉足。”

  经过初步的试用,发现这个生活搜索会对国内各个分类信息网站产生一些影响,做分类信息的网站估计要高兴一阵了。我估计Google生活搜索的工作方式是,通过搜索引擎对于指定的分类信息网站进行数据收录,然后对收录过来的信息进行数据挖掘,聚合而形成一类新的数据内容供大家搜索。

  这种发展思路和百度有一些不同,百度的招牌产品例如百度知道、百度贴吧、百度百科等,都是走社区化经营的路线,通过社区的人气来产生网站的粘度,通过网民自己来贡献新的内容,这些内容的不断更新来行程一个人与人交流的社区。而Google则通过程序的算法方式进行数据挖掘,通过程序自动产生内容,这两种发展方式的一个很大不同在于,百度通过这些产品给自己带来流量,而Google则为别人带去流量。

2007年5月18日星期五

Google Analytics新版试用

  今天收到Google Analytics发来的一封邮件,说Google Analytics(分析)报告界面新版本现已发布了。直接登录后就可以看到新版本,过度期间还会保留旧的报告界面,无论选择哪一个界面,数据和配置设置均不受影响。

  我于是马上登录进去看了一下,果然已经升级到了新版本,初步试用了一下,感觉用户UI比原来有了很大的飞跃,显示和操作更为直观了,首页还可以自定义报告内容,和自定义主页类似,很贴心的选择。

  当然,最令我感到方便的是电子邮件和导出报告功能,几乎所有的报告都可以发送邮件,设置后系统会每天自动发送给我电子邮件,而不必我天天访问页面来查看报告,这是一个令人振奋的功能,原先我不得不用StatCounter来发送邮件报告。StatCounter只能发送文本格式的简单报告,而Google Analytics却可以用PDF(PDF的报告看起来太漂亮啦)、XML、CSV、制表符分隔值这四种格式发布复杂的报告。就凭这一点,我就可以把我原来设置的StatCounter扔调了。

  AdWords的广告报告界面也更为直观了,做AdWords的可以更为方便的查看自己的报告信息了。希望以后也能增加Adsense的广告统计。

  现在,个人网站没有什么理由不用Google Analytics了,如果害怕Google Analytics影响网站速度,那么可以将其代码放在页面最底部。至少相比国内那些包含木马病毒的网站统计来说,Google Analytics是强太多了。Google Analytics还有很多使用技巧,完全掌握后,Google Analytics就是一个完全免费的专业网站分析软件。

2007年5月17日星期四

Feed托管服务FeedTea试用

  今天收到feedtea的公关经理的邮件,邀请我试用一下FeedTea的服务,因此,我晚上就上这个网站注册试用了一下。

  FeedTea是一个新的Feed托管服务,和FeedBurner以及FeedSky的用途是一样的,是一个基于.NET开发的一个Feed服务。从界面功能上看,和FeedSky的界面非常类似,熟悉FeedSky的会很容易操作。FeedTea多了一项功能是Feed合烧,也有免费的类似FeedSky的绑定域名功能,不过我还没设置成功。

  使用的过程中,感觉这个Feed服务还有不少功能上的BUG,包括“使用帮助”和“关于我们”都没有内容,应该是还处于测试阶段的服务,整体上看,如果将来其各个功能都能正常稳定的运行,那也是Feed托管的一个不错的选择。

  做为Feed托管服务,我觉得最重要的应该是稳定性,Feed能够稳定的发布,并且发表文章后能够及时抓取到,这样的Feed托管才有最基本的价值,这些东西都搞好之后,再开发一些有趣的扩展来在使用功能上进行拓展。

  对于寄托在各个BSP上的博客作者来说,使用Feed托管可以减少博客搬家时候的损失,并且能较为简便的得到订户统计,对于流量访问上的节约,我觉得只有Feed量特别大的用户才会感觉有意义。

  我目前使用的是FeedBurner的服务,当然我有点后悔一开始没有使用Feed Domain,不过总的来说FeedBurner还是比较令人满意的。如果大家一开始就使用子域名方式发布Feed,那么现在就可以自由地在FeedBurner,FeedSky,FeedTea中无缝切换且不会损失订户,那将是一个不错的选择,如果各个Feed托管服务都不满意,那么还可以绑定到自己的服务器上做为最后选择,就像我的feed.williamlong.info一样,出了没有统计功能外,显示效果也不错的,Z-Blog用户只要也使用类似我Feed中的xsl样式,也可以做到友好浏览的界面。

2007年5月16日星期三

共享软件的开发和营销策略

  本文主要讲述的是,如何通过自己的产品(无论是共享软件也好,网站服务也好)进行盈利的一个规划,虽然软件制作和网站推广不太一样,但总体规划思路还是类似的。

  共享软件和服务网站正变得越来越像,很多Web 2.0网站实际上和共享软件有相同的本质,只是外在表现形式不同而已,现在有一个时髦的名词是SaaS(软件即服务),说软件正变得越来越像一个网络服务,因此,对于软件和网站的规划和营销应该是同样的思路和方法。

  路线的选择

  首先是选择国内市场还是国际市场。不同的市场发展道路是不同的。相对来说,国内市场的价格竞争非常严酷,产品销售靠个人的力量并不容易完成。国际市场有较为合理的软件产品销售价格,回报相对丰富一些。

  因此如果英文过关的话,软件或者服务产品,优先选择的是国际市场。这里面有不少先驱者的成功案例,不少人做软件走国际路线,月入数万美元,而几乎完全相同的软件在国内却销售不出去。这里的原因很多,主要是国际市场要比国内市场优越和规范得多。其广告价格或者产品价格比国内至少高十倍以上,这样得到的结果是,销售同一套软件,在国际上的收入比国内收入高十倍,同样一个网站广告的点击,国际的IP比国内的IP价格也高十倍。举个例子,共享软件作者周奕前辈的一个很简单的MP3转化为CD的软件,当年就创下了月入四万美元的记录。

  产品的选择

  产品的选型很重要,早规划制作一个产品的时候,首先要了解同类产品在国际或者国内的市场有多大?主要的竞争对手是谁?有没有处于垄断地位的对手?如果你发现有一个非常强大的对手也在制作同样的产品,并且已经垄断了大部分市场,那么就不要去做同类的产品了。

  潜在竞争对手

  好了,如果你已经选择了一个不错的产品,市场上没有什么竞争对手,销售也非常不错,那么这时候你应该保持低调作风,并注意潜在的竞争对手是否介入相关市场。除非你的产品具有“无法模仿”的特性。

  还是举周奕的例子,当月收入超过四万美元的时候,就买了“宝马”轿车,更致命的是在CSDN上写了很多篇文章介绍自己产品的成功之路,甚至包括详细的市场推广技术、渠道策略等等,这对于中国的海外共享软件发展的推动作用是很大的,海外共享软件作者呈现指数增长,但是对于周奕自己来说却是一个令其后悔不已的决定,一夜之间冒出了数百个和自己产品同类型的软件,有的做的还更好看,自己产品的销售额直线下降,对于越来越多的仿制品,周奕不得不放弃原有的域名,而去开发一个神秘的新产品,这个产品估计就不会再告诉其他人了。

  对于中国这个人力资源极为丰富的国家,潜在的竞争对手非常多,因此保持低调,是保护自己的一个基本法则,就像某人所说的,“闷声发大财”的。

  广告烧钱

  有时候,我们会遇到销售额或者网站流量总是上不去,这时候我们应该“烧钱”了。

  做海外产品,烧钱的主要方法是Google Adword或者其他网络广告,如何烧钱也是一门学问,其基本策略就是烧最少的钱获得最好的效果。这里涉及到的知识非常多,大家可以参考一下“Google AdWords广告的12个技巧”这篇文章。

  投资理财

  产品销售后,每月应该也有几千美元的收入了,接下来该怎么做呢。

  钱是可以生钱的,可以生钱的钱叫做资本。如果你把得到的美元都放在银行,那么它每天都在贬值,去年的这个时候,1000美元可以换取8276元人民币,现在只能换7800元,因此我建议当前情况下,将大多数美元转换为人民币,投入国内的股市或者房地产中,进行股票投资或者房地产投资,是一个不错的投资理财思路。

  但是我也不建议将美元全部换成人民币,因为美国毕竟是全球经济最发达的国家,持有美元的风险还是低于持有人民币的风险,合理利用没有去做一些低风险的基金,也可以获得不错的收益,足可以弥补美元贬值造成的损失。

  另外一种较高风险的投资是炒外汇,炒外汇和炒股一样具有很大风险,需要具有一定的金融知识和国际消息,如果资金量不够大,又没有足够的时间关注国际形势的千变万化,是不适宜炒外汇的。

  好了,今天就先说这么多,如果你对于产品规划和盈利有什么好的想法,请也留言告诉我。

  注:本文已经发表在《程序员》杂志2007年9月刊