2010年9月13日星期一

从信息流动角度看搜索引擎优化SEO

  打开Google或者百度,在搜索框里填入“城市名+SEO”,你会发现几乎每个大中城市都有了一个所谓的SEO网站(博客)。SEO,全称是Search Engine Optimization,一般译为搜索引擎优化。通常可以将搜索引擎优化理解为通过某些行为(网站优化)提高网站在搜索引擎的排名从而提高网站曝光率的活动的总称。

  但是,就目前来看,更多的人把搜索引擎优化看成一种驯服甚至玩弄搜索引擎的手段,妄想通过控制搜索引擎的结果来控制营销,达到暴利的目的。不可否认,在当今,的确有很多人通过搜索引擎优化或者搜索引擎优化培训达到了“富起来”的目标。但是,搜索引擎优化的本义吗?

  互联网与信息流动

  如果不深究因特网、互联网、或者是所谓的万维网之间的区别,统称为互联网,那么,有个问题就摆在我们面前——它(互联网)是干嘛用的?

  对于互联网而言,它传递的是信息。我们之所以通过互联网传递信息,是因为信息也是生产力,换句话说,信息就是财富。以往需要信件、报纸才能传递的信息,通过互联网可以即时传递到世界上的每一个角落。信息的传递,既有私密的形式,诸如电子邮件,也有公开的形式,也就是信息展示(公开网站)。

  对于私密的信息交流而言,传递的速度非常重要。从电子邮件到后来的点对点即时通讯,都是传递速度的提升(加快了信息的反馈速度)。而对于公开形式的信息展示(公开网站)而言,既是信息的组成部分,也是信息流动的载体。作为信息的组成部分,网站自身需要向访问者提供大量的信息;作为信息流动的载体,网站需要向访问者提供补充链接以供进一步查询。因此,互联网存在的意义就在于它带来了信息的快速流动。

  搜索引擎与信息流动

  在互联网早期,是不需要搜索引擎的。搜索引擎的出现,源于两个因素:(公开的)信息量过大;(公开的)信息流动速度太慢。信息量过大是因为单个网站提供的信息增多,网站数量上升。信息流动速度太慢是因为信息量过大,用户无法通过网站出站链接快速获得信息(信息爆炸的雏形)。这时候,搜索引擎应运而生。而搜索引擎的出现,改变了信息流动的形式。

  首先,搜索引擎从形式上模仿了用户访问互联网的形式:通过一个网站的链接抵达另一个网站。其次,以Google为代表的搜索引擎,建立了庞大的数据库,将各个网站的信息“拍照留存”供用户查询,自身作为用户和网站之间的中介存在。只需要一次关键词搜索用户就可以直达目标网页,没有必要通多个网站(往往是从一个网站目录大全出发,比如互联网早期出现的雅虎目录)一点点的手动寻找信息。搜索引擎提供的关键词检索赋予了用户直达目标网站的能力,从某种程度上讲,解决了信息量过大和信息流动速度过慢的问题。

  搜索引擎优化(SEO)与信息流动

  搜索引擎优化的出现是一种进步。

  搜索引擎毕竟是一套程序,只能根据预先的设定工作。由于互联网上的信息越来越多,信息的形式越来越复杂,如何从浩如瀚海的互联网中挑选出最符合用户需求的信息(这是加快信息流动的重要途径),称为搜索引擎必须面对的问题。为此,无数工程师设计出各种算法来区分网页的相关性,进行机器识别。

  由于软硬件的限制,搜索引擎拥有了和真人不同的收录特性,比如,只能检索文字信息,对图形、音频、视频甄别能力非常低。对于文字信息,由于语义判断存在难以克服的困难,如何甄别重点词语成了难题。无论是西方的Google还是本土的百度,都无法做到分词上的尽善尽美,各种瑕疵严重降低了搜索结果的准确性,从信息流动的角度来看,不利于信息流动。

  此时,对网站本身进行优化,使之对真人访问友好,对搜索引擎也友好,就成了加速信息流动的客观要求。作为提供信息的网站,渴望获得尽可能多的定向流量,那么,就必须帮助搜索引擎提高搜索效率,加快信息流动。只有信息流动速度加快,才能获得更多的定向流量。协助搜索引擎,就是帮助自己发展,这应该成为网站所有者的共识。

  理想的搜索引擎优化应该立足信息流动。

  理想的搜索引擎优化需要做到两个方面:第一,参与信息流动,加速信息流动;第二,协助搜索引擎,而不是绑架搜索引擎。所谓的参与信息流动,就是提供优质的信息,而且最好是原创的信息,加速信息流动,就是主动链接相关的信息,通过链接展示其他人拥有的优质资源。协助搜索引擎,就是主动修改诸如网页标签等各种信息,使之便于搜索引擎收录和检索。但是,就目前来看,网上的诸多搜索引擎优化师(SEOer)的所作所为,近乎绑架搜索引擎,其行为造成的后果就是严重干扰了信息的正常流动,危害整个互联网的健康。一旦被搜索引擎惩罚,这类SEOer没有资格抱怨。

  许多优化技术在理论上并不可靠

  从信息流动的角度看,现有的大量的搜索引擎优化技术都是不可靠的。对于网站优化而言,只需要做到信息原创、信息充足、搜索引擎可读、链接合理就可以(做到这几条并不难,更不需要很高的技术)。信息流动包括“信息”和“流动”两个词,而大量的原创信息满足了“信息”,搜索引擎可读和链接合理满足了“流动”。只有满足信息流动的要求,才能获得用户和搜索引擎的认可。

  搜索引擎的存在价值,搜索引擎的算法目标,就是加速信息流动。为了这个目标,工程师作出了各种设计,复杂的算法考虑了无数个因素。这些因素不是任何一个搜索引擎优化师或者小型组织可以完全掌握的。搜索引擎考虑这么多因素,完全是因为搜索引擎是死的,所以它很笨,需要一点点分析这些因素。而网站所有者是真实的人,完全可以绕开搜索引擎的“歧路”直达目标:加速信息流动。因此,现有的许多搜索引擎优化技术在理论上并不可靠,从一开始,很多所谓的搜索引擎优化技术的方向就错了。

  注:此文参考了霍炬的文章《Google百度和谷歌的那些事》,再此表示感谢。

  来源:立柱博客投稿,原文链接