2007年5月25日星期五

谷歌拼音输入法的工具栏

  今天我重新安装了个操作系统,然后打算下载安装一下谷歌拼音输入法,安装拼音输入法的时候,中间竟然出现了一个以前我没有碰到过的界面,如下图所示:

谷歌拼音输入法的工具栏

  以前我也曾经听说过谷歌拼音输入法安装工具栏的事情,不过我以前每次安装都没有出现这种情况,因此我以为这是竞争对手的造谣。今天重新安装系统才知道,原来这个安装程序还是“智能化”的呢,检测到系统没有安装工具栏,才提示安装,以前没有提示我安装,是因为我老早就安装过工具栏了。

  不重新安装系统,我还真无法发现谷歌输入法的小秘密呢。

  当然,国内的紫光输入法也会安装百度工具栏,谷歌的本地化大概是向这些厂商看齐呢,搜狗输入法以前都没有安装工具栏,看到谷歌的好榜样,大概下一版本的搜狗拼音也会上工具栏这个项目了。

  我目前安装的环境是Windows XP SP2,IE为7.0版本,全新系统。以前是在Windows 2000 Server,IE6下安装的。大家不信的话可以自行验证一下。

Z-Blog文章投票插件

  昨天看到软件兔那里有做了个Z-Blog插件文章投票的插件,感觉比较实用,但是具体在我的Blog上安装了一下,却发现不少错误,导致评分系统无法正常工作,因此不得不将这个插件停用。

  今天我安装调试了一下这个插件,发现主要有两个问题:

  一个错误是数组越界问题,ID号码为100的整数倍的文章被评分,则同组的100篇文章再次评分时全部出现数组越界错误。

  令一个问题是,ID为100的整数倍的文章不能被评分。

  仔细查看了一下,里面的算法有点问题,修改起来也不太好修改,干脆换个算法吧。

  于是我将这个投票插件的缓存文件生成方式进行了修改,不是100篇文章生成一个文件,而是每篇文章都生成一个文件,虽然生成的文件较多,但是上面两个问题就很好解决了。另外单个文件对于大并发量用户访问不会出现写文件被锁定的问题。

  目前,我已经将这个修改后的插件安装好了,大家可以测试一下评分插件是否工作正常,如果你也使用Z-Blog系统,那么也可以很轻松的安装这个插件,插件下载地址请点这里,插件安装说明请参见zip文件内的readme.txt文件。

2007年5月24日星期四

Google确认收购FeedBurner

  刚刚看到TechCrunch上的消息,确认Google收购Feedburner的事情确实存在,并且已经接近了尾声,收购价格是1亿多美元的现金。

  FeedBurner成立于2003年,曾经获得过两次风险投资,我在2006年初的时候开始使用FeedBurner的服务,使用了这一年多来,感觉这是一个功能强大且相当稳定的服务,我个人来说很喜欢这个Feed服务,真没想到FeedBurner这么快就贱卖给了Google。

  看着我喜欢的服务一个个地被卖给了Yahoo(如del.icio.us)和Google(如FeedBurner),我心里不知道是什么滋味,Web 2.0网站的最后出路,难道都是卖了自己吗?

  Google和FeedBurner有一项业务是重合的,就是Feed广告,Google的是Adsense for feeds,而FeedBurner的是Feedburner Ad Networks。当然,我对两者合并后的RSS广告也不报什么希望,Feedburner广告对于不同地理位置的用户采用不同的费率,而Adsense for Feed根本就不让中文用户申请。总之,Feed广告目前对于中文用户来说还是收益很小的。

DIGG和网摘的组合

  (本文为话题广告)细心的读者应该会发现月光博客今天的页面增加了一些功能,就是文章底部增加了投票的按钮,每个人都可以对文章进行投票,这种投票实际上也是一种最基本的DIGG。

  国内的DIGG类的网站一直发展的不是很理想,没有出现类似DIGG那种规模的网站,这里有很多原因,就像KESO在“Digg假象”说的一样,用户量小,则提交的资源就缺少价值,而用户量一大,不同的用户兴趣相差甚远,则更加众口难调。

  今天介绍一个广告话题是“趣摘网”,趣摘网是投资Del.icio.us的美国投资商在国内投资的第一家网站。目前,趣摘网的模式已经超越了纯网摘或digg的功能,是国内第一个引入国外成功网站www.stumbleupon.com模式的网站。

  趣摘网所提供的服务区别于传统的上网模式,传统的上网浏览方式是 : 在浏览器中输入网址,然后点击链接来上网的浏览。与这种传统的上网 方式不同,趣摘网提供的浏览器插件,让用户只需要点“下一页”,就能浏览一个个精彩的网页了。每一个网页都是由用户提交,并且被更多的用户顶上来的精彩网页。

  我最早了解趣摘网,是从他们站长的文章“做web2.0还不如做黄色网站”了解到的,该站长感慨到“一个上线1个月的小小的黄色网站,其流量居然快赶上了辛辛苦苦作了快半年的趣摘网”,于是他心中很是愤愤不平,并由此得出一个结论:“一群赤裸的女人,肯定能够造就一个不伟大但是流量很大的网站。”

  其实趣摘网也不必妄自菲薄,那些黄色网站的流量固然很大,但是他们的价值很小,网站没有价值,流量也没有价值。一个好的网站,应该拥有高质量的用户,这些用户又能够产生高质量的商业价值。

  趣摘网的特色是网摘+DIGG,用户推荐的越多,页面就越有价值,我在自己博客里添加“文章投票功能”也是为了获得用户眼中的文章价值,热心用户对于文章的评价积累,可以指导新用户在最快的时间内看到最好的文章。通过这些用户提交的文章评价,我还可以改造现有的“热文排行算法”,通过用户的投票让最好的文章显示在新用户眼前。当然,这种模式必须是在一个兴趣大致相同的固定的用户圈里才能行程,如果用户量增大到一定程度,势必会造成众口难调的DIGG局面,这也是所有DIGG网站都面临的一个问题。

  虽然趣摘网定位的目标用户是20岁-40岁的之间的白领,走的是娱乐化的道路,因此对于我这种惯用Del.icio.us的用户来说就有点不合口味了,就网摘功能来说,del.icio.us几乎是完美的,而我以前介绍的“百度搜藏”也是定位在不习惯del.icio.us的用户,而DIGG.COM已经把DIGG模式做到了极限。所以,我觉得趣摘网最好能模仿一下DIGG,每个分类都有一个良好的浏览地址和RSS订阅地址,让不同的用户可以快速订阅和浏览适合自己胃口的文章,这也是一个让用户更容易访问的方法,走大众路线不一定非得把页面做的花里胡哨的,提高用户的浏览体验也是一个好方法。

2007年5月23日星期三

AdSense的交叉牟利和无效点击

  先报告两条Google Adsense的新闻,一条是“Google开始清理利用AdWords获取AdSense非法利益的用户”,就是某些用户购买了大量格价极低的广告关键词,在AdWords里投放广告,从中获得巨额的流量;然后又注册了AdSense,建立起完全针对AdSense广告的网站(MFA,Made for AdSense),并且在这些网站上面设计了高价格的关键词,通过两者差价获利。另一则新闻是“谷歌中国后院起火,铁杆粉丝公堂对簿”,Google Adsense的一些支持者和推广者也对中文AdSense失望了,adsenser论坛的管理员小龙在上海起诉Google的所谓“无效点击”,指出Google Adsense的无效点击判断和处理方式已经严重偏离了正常范围,发布者账号被停止,理由是无效点击;发布者收入被调整,理由是无效点击;这些无效点击的判断没有任何解释,理由是Google的算法具有专有性。

  对于通过同时做AdWords和AdSense,通过两者的差价进行牟利,我以前也曾经推荐过,因为AdSense的计划政策里并没有禁止这么做,更何况中文AdWords的广告价格更低得离谱,甚至低于百度主题推广的价格,因此我才推荐大家申请Adwords广告来获得大量流量。

  现在既然Google认为同时做AdWords和AdSense有所不妥,那就应该适当提高中文AdSense的底价了,8分钱一个点击的价格比百度3毛钱的底价还低的多,只要存在这么低的广告价格,通过AdWords套取流量的做法就无法从根本上避免和杜绝。

  而AdSense的所谓的“无效点击”也存在很多问题,广告发布者要通过各种方法来避免被AdSense误判为无效点击,很多人帐号被关闭了都不明白是怎么回事,可能他只是在网吧里上了一下网,就会被误判,由于语言和地理区域的差异,通常情况下即使误判了,广告发布者也难以申诉恢复帐号。这次Google的拥护者都开始起诉Google了,说明这种误判的情况已经越来越严重了。

  当然,中文网络环境是非常糟糕的,很多广告发布者喜欢使用一些低级的方法作弊,也是导致“误判”情况增多的一个因素,同时,申请AdSense通常比申请百度主题推广要容易一些,也是广告帐户被滥用的一个因素,因此,现在已经是时候了,Google应该在中文网络的“无效点击”的误判上有所行动,还那些被冤屈的无辜者一个清白。

2007年5月22日星期二

加盟网站、复制内容和搜索引擎

  (本文为话题广告)这篇文章主要讲述目前流行的加盟网站(Affiliate Program)存在的内容复制的问题,以及搜索引擎可能采取的对策,通过具体的示例来分析这种加盟网站可能存在的风险。

  介绍例子之前,我先介绍一下客齐集这个网站。客齐集是美国著名电子商务公司EBAY的一个子站中的中文版本,它是一种分类信息网站,主要功能是向用户提供发布和查询信息的服务。客齐集在全球二十多个国家开通数百个城市的分类信息业务,在中国,客齐集目前也已在上海、北京、广州、深圳、杭州、成都等几十个城市开通分类信息服务。其数据量非常庞大。

  我今天要讲的主要是客齐集的一个很有争议的功能:频道定制栏目。这个功能号称是“分布式电子商务模式”,客齐集为电子商务应用的主站,各个中小网站通过分类频道的方式形成“分布式”应用,从一个角度来看,客齐集、成员网站都获得了收益,但是从搜索引擎的角度来看,客齐集的加盟网站和搜索引擎两者之间产生一定程度上的利益冲突。并在一个月前发生了百度封杀分类频道的事件。

  分类频道是这种分布式应用的表现形式,简而言之,客齐集分类频道就是让很多小站长通过修改域名DNS的方式,在自己的网站上增加几乎完全相同的分类频道,这样就能在自己的网站上快速形成一个栏目。据了解客齐集频道定制服务推出不到一个月已经有超过4000个网站加入,并以每天超过200个新网站的速度发展。

  值得注意的是,这种分类频道的定制和以往一些应用有所不同。这种分类频道的定制对于个人网站来说比较友好,定制内容也很灵活。为了测试其功能,我自己也注册了一个客齐集的联盟进行试用(域名我就不说了),只需要简单设置一个CNAME域名,就可以得到至少三十万个页面,如果全部页面都被搜索引擎索引,那么会有接近百万个页面的庞大的分类网站。在网站设置上,可以自定义头部代码,侧栏代码,底部代码;还可以方便设置列表页和信息页的代码,增加Adsense广告代码;通过CSS的设置,还可以将客齐集的LOGO图标隐藏。

  从加盟的个人网站的角度来看,只需要简单设置一下CNAME域名,瞬间就得到数十万页的分类信息内容,还可以增加自己的导航图标和广告,自己不用更新,里面的内容还会自己更新,如果这些页面被搜索引擎索引的话,可能还会带来一些流量以及广告收入,这个算盘还真不错。

  从客齐集来讲,这种加盟频道的方式可以有效扩大其知名度,越多人能访问这些内容,自己得到的也越多,损失的只是微不足道的流量。虽然从SEO的角度看,这种方式会在网络上产生大量复制内容,但由于每个分类网站都会给客齐集主站一个链接,这样就保证了客齐集主站具有很高的信用度,因此这些复制内容对主站自身的分类信息不会产生负面影响。

  相对于两方面都收益的联盟,搜索引擎就面临困难的抉择。显然,这是大规模的“复制内容”,也就是说两个或多个网站的网页内容几乎完全相同,或非常相似。搜索引擎必须判断并找到原始版本,然后把其他的复制网页忽略。但是如果页面内容非常庞大,多达数十万页,那么搜索引擎的判断就要耗费大量资源,按照客齐集数千个加盟网站的规模,这些复制内容充斥着互联网,数目极为庞大。

  搜索引擎的抉择是艰难的,搜索引擎最喜欢的是有价值的网页,不喜欢那些高度重复性的内容。对于非常关注用户搜索体验的搜索引擎来说,通常会倾向于对复制内容进行降权甚至惩罚。上个月,百度就痛下杀手,将客齐集的所有联盟网站从百度索引中删除了,这意味着那些联盟网站再也不会从百度中得到任何流量。

  从外界的评论上看,基本上都认为百度的做法没有什么不妥。对于这种复制网页的行为,我也觉得不是一个恰当的做法。道理其实很简单,设置这种“分类定制频道”无非就是想从搜索引擎中获得流量,而大多数人只需要设置一个子域名就可以“获得”数以十万计的海量页面内容,如果这些重复的内容被搜索引擎索引并展示给搜索的用户,那么用户的体验是什么样的呢?对于那些辛辛苦苦勤劳写作的人们来说,这种“不劳而获”的做法公平吗?很显然,搜索引擎为了使得用户获得更好的搜索体验,很有可能会将这些重复内容全部删除,百度就是这么做的,Google目前还没有做出激进的删除行为,可能的原因是其索引算法会自动将复制内容列入“补充材料”或者自动降权。

  因此,加盟这种分类网站虽然有可能获得一些流量,但是也有风险。

  1. 如果使用主域名加入其分销联盟计划,主域名会被百度封杀。
  2. 如果使用子域名加入,子域名也会被百度封杀,但现在还看似乎没有影响主域名。对于Google来说,加盟的网页内容很可能会被加入Google的补充材料

  分类信息网站之所以引人注目,主要原因是其贴近人们的日常生活。就连Google也推出“Google生活搜索”这样的分类信息搜索,可见其重要性。然而,制造垃圾信息是一种罪过,如果分类信息的内容非常好,又何必浪费用户的时间在那些复制内容的页面上呢?

文章声明

2007年5月21日星期一

Google搜索敏感关键字的新技术

  最近使用Google搜索的时候,发现了一个奇怪的现象,就是在某些特殊的时段,使用Google搜索任意一个关键词,包括以前不能搜索的一些“非法”关键词,都能搜索成功,并且搜索过程中不会出现页面中断的情况。

  以前大家都知道,Google并不是什么词语都可以搜索的,搜索某些特定的关键词的时候,会出现页面无法访问的情况,之后一段时间就无法访问Google。Google一直试图解决这个问题,在去年11月份时,Google通过类似域名重定向功能实现正常访问,不过使用的方法是Google搜索敏感关键字后会自动转向Google.cn域名,然后在页面上提示:“www.google.com暂时无法访问,本页搜索结果来自www.google.cn”。而这时Google.COM的确也无法访问了。

  我个人觉得这种方法显然不很友好,对于不知内情的网民来说,会觉得Google服务不稳定,并且降低访问www.google.com的意愿(谁愿意访问不稳定的网站)。因此那种跳转也是为了应付“Google搜索南京大屠杀”的临时解决方案而已。

  然而令人惊讶的是,在某些时候进行Google搜索,我发现似乎无论在Google.COM搜索任何“敏感关键字”(屠杀、钓鱼岛)都可以返回正常的结果,从用户的角度来看,目前的搜索方式是一个很良好的用户体验,不会出现“该页无法访问”的情况,具体Google使用了什么技术来实现这样的功能,我不很了解其技术细节,不过显然,目前这种技术方案是最理想的,用户从前台看还是访问google.com的网站,而且的确任何关键字都可以搜索,没有出现中断等不友好的现象。

  虽然直接通过Google网站搜索正常了,但是安装了Google工具栏,从工具栏中搜索敏感关键字依旧出现“页面无法访问”的情况,“网页快照”依旧还是不能访问,图片搜索翻几页就全是红叉叉的现象依然存在。Google需要完善的事情还很多啊。

  为了证明关键字并没有选择错误,我访问英文Yahoo搜索同样的关键字,结果显示“该页无法访问”,说明关键字的确还是被过滤的状态,之后我Ping了一下Google.COM的IP,发现会出现www-china.l.google.com域名的字样,返回的IP地址66.249.89.99,查询得到的结果似乎是美国。

  大家也可以在浏览器里打开Google.com,看一看搜索“屠杀”等关键字是否能正常返回结果,然后通过Yahoo.com搜索一下看看是什么结果,希望这并不只是我一个地方能正常显示。

  产生这种现象的原因,我推测,一种可能是长城防火墙升级了,对于Google的IP放开不进行审查了,或者审查的条件放宽松了,一种可能是Google通过技术手段绕开了防火墙,如果是这个的话,我不得不感叹,技术的发展是日新月异的,没有什么东西是技术上不能实现的。