2014年8月19日星期二

解读《百度网页质量白皮书》潜台词

  前阵子不知道谁说百度的流量份额下降了很多,360的上升了不少,数据来源很明确,但是数据的真实性谁也搞不清楚。如果百度流量份额真的下降了,是不是因为搜不出好东西来了?把搜索引擎数据库填满的,不是那寥寥无几的大网站,而是数不尽的中小网站。中小网站对于百度的意义,就像中小卖家对于淘宝的意义。所以如果百度不伺候好这些长尾网站,能搜的东西可能真的越来越少了。

  老套白皮书的新解读

  当然,百度站长平台一直都很努力的,最近就推出了《百度搜索引擎网页质量白皮书》PDF版,总共18页。它就是想告诉你什么样的网页是好网页,什么样的网页是差网页,而且中间还分好坏的级别,并且有案例可以参考。

  如果你已经从事SEO好些年了,看完这份白皮书之后,你会有一种“看了等于没看”的感觉。这些东西很有道理,所以你可以理解为老生常谈。白皮书还是那份白皮书,但你解读它的角度可以不一样。仔细看的话,你也会发现一些新东西。比如以下几个:

  1、增加了浏览体验考核

  它这里只是说用户浏览体验,没有说用户体验。也就是说,它只强调视觉层面的东西。这算是用户体验的一个分支,但是这次百度没有说一些含蓄的行话套话,而是直接指明了影响浏览体验的两大敏感因素:排版和广告。

  对于排版,百度说要排版合理、版式美观、易于浏览和阅读。

  我的理解是行间距和段落间距要疏松一点,多进行分段,大小标题和列表穿插其中,使内容富有层次感。

  对于广告,百度说广告不能混杂在内容当中,而且广告语内容的匹配度要尽量高。它还用一张“影响网页质量的要素图”明示了广告对用户体验的影响太猖狂了:

网页应该提供独特价值

  有人说文章有料就不要在意排版这些细节,但是大部分用户在意,搜索引擎在意,所以最好还是重视起来,好好给网页整整容。有时候一个人什么都没做错,错就错在长得太丑了。网页也一样,视觉化营销应该作为浮躁风气下的新武器,因为在大数据时代,实在有太多的数据,用户的眼球已经被蹂躏得筋疲力尽了。

  2、关于可访问性

  白皮书提到,百度希望网页不要设置太多的阅读障碍,尽量能够让用户直接获取网页信息或资源,不要过分使用注册、登录、安装插件等等限制手段。

  这里会存在一个悖论:限制越多的资源往往质量越高,但是限制太多又会影响用户体验,顺便影响搜索表现。

  如果听百度的,一切以用户为中心,不设限制,但是目前互联网上版权意识又太薄弱,自己的知识产权很容易受到损害。

  再三考量之后,很多人还是会选择设限,放弃迎合百度的胃口。搜索流量不能赚几个钱,还可能让自己的东西被抄袭一百遍,最后丢了尊严。

  这个问题其实很值得思考。现在卖文章的人越来越多了,往后卖其它内容的人可能也会越来越多。也就是说,以后真正的好内容可能就要直接花钱买了,在搜索引擎上是搜不到的,最后搜索引擎会渐渐演变为一个大众化的“基础知识库”,它只能停留在“百度一下,你就知道SEO”这个水平,而不能达到“百度一下,你就懂SEO”的水平。

  至于那些深刻见解、行业机密、系统性教程等等干货,只掌握在少数人手中(大众也不懂得怎么搜这些东西),市场供需关系也会让这些内容自动赚钱。

  所以,中小内容网站的可以考虑往这个方向去走:用大而全的内容从搜索引擎获取流量,用小而精的内容进行变现。

  3、没有提到原创与不原创

  几年前强调原创的力度比较大,于是各种心灵鸡汤、旅游心得、婚丧嫁娶这种圈子型文章以及死皮赖脸凑字数的专家文章噼里啪啦冒了出来。没有内容体系的原创和没有深度的原创都会造成无效信息的泛滥。

  所以,整篇《百度搜索引擎网页质量白皮书》甚至都没有出现“原创”两个字。

  实际上,原创根本就不是要紧的事。如果互联网上只有原创,就相当于线下只有生产厂家,没有运营商和推广渠道一样,那产品的影响力也是相当有限的。

  对于内容的输出,最根本的是保证价值输出,至于原创与否,搜索引擎和用户都不太想去追究了。

  无论出于什么目的,基本的内容路线都有三条:

  1、原创

  有实力的原创就是秀出专家魅力,没实力的原创就是制造垃圾。所以,走这条路线的,一般都是某领域的专家,也只有它们的原创才能生存。如果你本身没有对一个领域进行深入研究,仅仅想喷出自己的浅见,那还是算了吧,反正也创造不了价值。

  2、策选

  策选可以理解为策划+选择。如果说原创考验的是专业实力,那么策选考验的就是体系组合能力。网上有很多资源可以利用,对这些资源进行多种多样的组合加工,就可以有多种多样的变种内容。就像造房子,一堆砖头、沙石、钢筋水泥就摆在那里,最后决定房子造型的是你的构思和规划。内容体系就是构思和规划,也即是策选的过程。

  3、采集

  采集就是直接拿过来用,有些网站就是以干这事为生的,比如一些网页精算网站。目前,直接拿过来用还是相对容易的,版权追求还没有那么大的震慑力,但这并不等于你就可以为所欲为了,胡乱采集就相当于内容抢劫,是会遭报应的。走采集路线考验的是信息搜索能力和个人的眼光,你能找到多干的东西,并设立了怎样的准入门槛,都会最终决定你的内容影响力。

  随着内容的形式越来越复杂,原创与非原创的界限变得越来越模糊,搜索引擎判断原创和保护原创也会越来越吃力。所以,与其纠结于原创还是不原创的问题,还不如好好想想怎么打造属于自己的、独一无二的内容风格。比如百度的建议当中就有这么一个暗示:

网页应该提供独特价值

  所以,提供内容的时候,“找到自己–找到与用户互动的方式–勇敢做自己”可能也是一种生存哲学。

  内容狂人的春天已经到来

  通过百度的这份网页质量白皮书,我们也可以看到做内容的是挺有前途的。比如以下两组统计数据:

  1、截至 2014 年 5 月,统计数据显示,在百度网页搜索发现的海量网页中,优质网页仅占 7.4%,质差网页高达 21%,其余普通网页为 71.6%.

  2、从近一年的评估数据中我们发现,优质网页的绝对数量非常少,且几乎没有增长;普通网页的占比在下降,相应的,质差网页的比例却有明显上涨。

  优质网页数量偏低

  它的意思是:优质网页的数量太少了啦,而且增长太慢了啦!快快来做内容吧!内容狂人的春天已经到来了!

  内容狂人其实是最近才在网上出现的一个词,我最早是在微博看到的,完整的微博内容如下:

  「土豪」下一批土豪,将在85后—–95后中产生。他们分别出产于:1,社会化网络的深度患者;2,移动控;3,内容狂人;4,深夜开发者;5,手游沉迷患者;6,社交蛇精病患者;7,信用达人。

  以上概括了未来有可能在互联网上混得开的几类人,其中就包含内容狂人。个人觉得,内容狂人还是比较稳妥的一个方向,因为他并不完全是由互联网潮流冲起来的。

  那么,怎么做内容呢?

  一些大师会用一句“用心做内容”来回答这个问题。虽然这五个字很有道理,但是对很多人来说却只是个屁。也许太有道理的东西可操作性都不强,但是也不能每一步都拆着5小步那样去喂到观众的嘴里去。这里只提供一种参考的思路,觉得有用拿去,觉得没用就呵呵,觉得有害就绕道。

  结合当下互联网内容的一些特点,以下做内容的思路可以进行尝试:

  1、策划内容体系

  很多网站都有很好的网站结构,但是不一定有一个很严密的内容发布体系。网站结构是看得到的,内容体系是看不到的。它是背后以内容目的为导向,有规划地利用内容总纲和内容时间表的一个方案。这个体系因行业而异,根据用需求和市场走势来制定(如想了解更详细的方法,可以关注本博后续的分享)。

  2、使用多种内容形式

  文章是最基础的内容表达形式,但是如果你可以提供更多形式,比如音视频、PPT、电子书、信息图等等,一定可以让内容的整体效果更加出彩。有人觉得视觉化的内容太肤浅,但是它的需求却在不断膨胀。实际上,有些视觉化内容可以给读者留下更大的思考空间,表达效果可能会更好。

  3、形成独有的内容风格

  百度也提示了,要提供独特的价值,它的意思是让你Think different.世界上没有两片完全相同的树叶,也不应该有两个完全相同的网站。独有的,应该包括稀缺的内容、独有的语言风格、独有的内容形式、独有的网站形象等等,种种独有综合起来,不走寻常路,才能让别人记住你进而黏住你。

  4、构建内容生态

  内容生态听起来很玄乎的样子,其实就是做好内容的关联推荐。这个推荐包括站内相关内容的互相引用推荐,也包括站外优质内容引用推荐。每个网站的都不可能完美,要更好地满足用户需求,借用站外优质资源就是一个捷径(可是有些网站还是吝啬那些导出链接)。果壳网的模式应该成为一个楷模,它通过大量的引用构成了一个信任度很高的网站。一方面内容质量确实好,另一方面是站外的大环境支持了它。

  对于搜索引擎来说,好的内容不是很有深度的内容,而是很完整很详细的内容。所以,不要傻傻地奢望能用深刻独到的干货引来很多流量,这些干货还是留给真正有需要的人吧,不要被搜索引擎糟蹋了。

  来源:张飒的博客投稿,原文链接