2007年3月7日星期三

META标签的常见用法

  最近,Danny Sullivan谈到了如何处理的搜索引擎meta标签的问题,以下是一些关于在Google中如何处理这些问题的答案。

  多内容数值

  我们建议你把所有的Meta标签内容放在一个meta中。这将使得meta标签更易于读取并降低发生错误的概率。例如:

  <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">

  如果一行包含对个meta标签,我们将会累加标签的内容,例如,我们会将

  <META NAME="ROBOTS" CONTENT="NOINDEX">
  <META NAME="ROBOTS" CONTENT="NOFOLLOW">

  理解为:

  <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">

  如果内容的数值有冲突,我们将使用最严格的那个。所以,如果有个页面包含下面的meta标签:

  <META NAME="ROBOTS" CONTENT="NOINDEX">
  <META NAME="ROBOTS" CONTENT="INDEX">

  我们将只遵守noindex的数值。

  单词拼写规范

  Googlebot可以理解任何大小写的组合,所有大小写都是同样的效果。如果包含多内容的数值,数值之间需要使用逗号分隔。

  同时使用robots.txt和robots meta标签

  如果你同时使用了robots.txt文件和robots meta标签,如果robots.txt和meta标签有冲突,googlebot将使用限制更严的。具体来说:

  如果你在robots.txt里禁止了某一页,Googlebot永远也不会去索引那一页,也不会读取那一页的任何标识。

  如果你在robot.txt中允许,但是在页面中使用 meta 标签对其进行限制,那么Googlebots会访问那一页,读取里面的标签,但不会对其进行索引。

  有效的meta标签数值

  Googlebot可以对下面的标签进行如下的解读:

  NOINDEX - 阻止页面被列入索引。

  NOFOLLOW - 阻止对于页面中任何超级链接进行索引。(注,这不同于超级链接上的nofollow属性,那个属性只是组织索引单独的链接)

  NOARCHIVE - 不保存该页面的网页快照。

  NOSNIPPET - 不在搜索结果中显示该页面的摘要信息,同时不保存该页面的网页快照。

  NOODP - 在搜索结果中不使用Open Directory Project中的描述信息作为其摘要信息。

  NONE - 相当于“NOINDEX, NOFOLLOW”。

  数值NONE的含义

  据robotstxt.org的定义,下面的标记等价于 NOINDEX, NOFOLLOW 。

  <META NAME="ROBOTS" CONTENT="NONE">

  不过,有些网站站长使用这个标签来限制和组织所有搜索引擎来的内容索引。

  翻译人:William Long

  译文地址:META标签的常见用法

  英文原文:Using the robots meta tag

2007年3月6日星期二

免费网站流量统计服务

  Google Analytics是一个非常专业的流量统计服务,我在使用众多国内外服务后选中了她,由于目前网站统计分析软件众多,现在我就简要评述一下我所用过的一些网站流量统计服务和软件。

  所评测的流量统计分析服务应该包含如下功能的统计分析:独立访问数(访问网站的独立用户数目),页面浏览数(所有访问者浏览的页面数量),访问最多的页面,引用入口(用户从哪里过来的),弹出率(用户是在哪个页面退出的),用户客户端软硬件情况(操作系统、浏览器版本、显示分辨率等)。通过这些数据的二次统计分析,我们还可以得出一些数据背后的分析信息,例如通过页面总浏览数/独立访问数,可以得到每个用户访问时候的浏览页面总数目,用这个数目可以分析网站内容的“粘度”,内容质量越高,约吸引人,其数值就越高。

  在介绍之前,我先将统计分析服务进行一下分类,一类是网站日志驱动的,一类是网页代码驱动的。

  网站日志驱动的流量统计服务有不少,最大的好处是不用在网站内加入任何代码就可以完成日志分析,日志分析非常准确详细。缺点是耗费CPU较大,汇总数据速度很慢,对于大网站的长期汇总需要占用大量硬盘空间。

  1、AWStats :大名鼎鼎的AWStats是一套免费基于Perl的网站日志分析工具。这个工具界面较为友好,执行速度快,扩展功能众多,在国外空间使用apache服务器的,AWStats是当之无愧的首选。缺点是不支持某些编码的中文,日志需要大量空间,安装设置较为复杂,需要安装Perl,对IIS支持不是特别好,缺少更高层次的分析(例如Google Analytics)。

  2、FastStats Analyzer:我在IIS下使用这个GUI的软件可以直接分析网站日志文件,这个软件和AWStats不同,是GUI界面的,不支持WEB方式,安装和运行都非常简单,可以快速得出网站的汇总分析。缺点是速度较慢,对于大型网站日志速度更慢,同时也缺少更高层次的分析。

  网页代码驱动的服务不需要网站日志文件,只需要将一段代码加入到网站的所有页面中,就可以得出汇总分析报告。不过这样的调用比较占用统计网站自身的资源,因此对于大型网站一般都是收费服务,很多免费的统计工具因为流量的问题,只能对于小型网站进行统计分析。

  1、Google Analytics: 免费版版本有每月5百万综合浏览量的限制,但是,具备有效Google AdWords帐户的用户可无限制地进行综合浏览量跟踪(注册AdWords只需要50元开户费)。支持对于中大型网站的统计分析,没有广告。不像其他的免费分析工具,Google的分析不会通过添加广告代码或图标来获取流量。统计分析功能也很强大且专业,可以比较任一报告的任意两个日期范围,将某一月份的周五进行比较,或者将春季与秋季进行比较,还可以每天将统计报告以电子邮件的方式发送到用户信箱,非常方便实用。缺点是较为复杂的功能让普通用户无所适从。

  2、StatCounter:StatCounter的特别之处在于免费提供一个可隐藏的计数器,这是很非常难得的,对于中大型网站的统计也支持,不过就是数据会少一些。统计分析的功能比Google Analytics弱一些,不过比Google Analytics强的是支持定期邮件汇总报告,这个功能非常实用。

  3、百度统计:百度提供的免费网站流量统计工具,强力推荐。百度统计的速度很快,很适用于中文网站,对于大流量的网站也可统计,最为难能可贵的是,百度统计提供的是一个可隐藏的计数器,这点比雅虎统计要好的多。

  4、雅虎统计:中国雅虎提供的免费网站流量统计工具,速度很快,对于中文网站来说比较适用,不足之处在于提供的统计器不能隐藏,需要在页面上显示“雅虎统计”等字样,不甚美观。

  5、Clicki:国内的一个专为博客以及个人网站提供动态统计的Clicki系统,实时显示访问者详细信息以及反向连接来源信息。申请和使用都很简单,不过对于大流量的网站来说会拖慢网站显示速度。

  6、SiteMeter: 为网站提供免费统计服务,和其它免费统计不同的是,它可以每天发统计报告到用户的邮箱,很方便。

  总之,不显示图标的统计分析服务我见到的非常少,所以我基本上就只用上面几个,如果大家还用过其他什么好的统计分析服务,请也告诉我。

2007年3月4日星期日

Google Analytics(Google分析)使用技巧

  Google Analytics(Google分析)是Google的一款免费的网站分析服务自从其诞生以来,即广受好评。Google Analytics功能非常强大,只要在网站的页面上加入一段代码,就可以提供的丰富详尽的图表式报告。今天,我将总结一下加入代码的一些技巧,使用不同格式的urchinTracker代码,可以跟踪网站上一些特殊事件(例如不会产生综合浏览量的事件、JavaScript事件、文件下载、出站链接等),还可以跟踪制定属性的事件(例如Adsense、完整反向链接等)。当然,阅读这些技巧前请先阅读“Google分析师帮助中心”的主要内容。(后记:部分技巧在最新版本的Google Analytics中已经无法使用)

  一、统计非HTML的文件点击

  在网页文件中跟踪某一个链接,可以通过在链接 <a> 标记中添加onClick属性来实现,实例如下:

  <a href="http://www.williamlong.info/rss.xml" _fcksavedurl=""http://www.williamlong.info/rss.xml"" onClick="javascript:urchinTracker ('/rss.xml'); ">

  注意,使用这个属性,必须将 Analytics跟踪代码放在HTML代码前面,最好<body>的下面。

  二、跟踪Adwords

  Google Analytics官方已经直接支持跟踪Adwords,详细步骤请参看“如何将 Google Analytics(分析)帐户链接到 AdWords 帐户?”。

  另外,vdgraaf也提供了一个手动修改代码的方法,也可以实现同样功能,修改的例子是:

  _uacct = "**-******-*"; // your urchin code generated by Google Analytics

  if( document.referrer )
  {
   if( document.referrer.indexOf( 'google' ) != -1 )
   {
    var urlPattern = /(?|&)q=([^&]*)/;
    var aMatches = urlPattern.exec( document.referrer );
    if( aMatches != null )
    {
     urchinTracker( '/query/' + aMatches[2] );
    }
    else
    {
     urchinTracker();
    }
   }
   else
   {
    urchinTracker();
   }
  }
  else
  {
   urchinTracker();
  }

  然后在“内容优化”-“内容效果”-“内容细目”里查看目录query的信息,好可以将其内容与“优化市场营销”-“搜索引擎营销”-“按点击付费与自然转化”-Google比较一下Adwords数据。

  三、跟踪Adsense点击

  我们以前介绍过的Adsense追踪软件只是将用户点击记录下来,并不具备统计功能,如果我们想要对以往的广告点击进行统计,那么可以直接利用Google Analytics来实现统计功能。

  实现的大致方法是:

  在Google的Adsense广告下面增加如下语句

  <script type="text/javascript">
  function log() {
   urchinTracker ('/adsense');
  }
  var elements2;
  elements2 = document.getElementsByTagName("iframe");
  for (var i = 0; i < elements2.length; i++) {
  if(elements2[i].src.indexOf('googlesyndication.com') > -1) {
   elements2[i].onfocus = log;
  }
  }
  </script>

  修改好了以后,请大家不要点击Google广告进行测试,那样会被Google锁定帐户的,大家只要慢慢等待Google Analytics的统计信息即可。

  另外seobook也介绍了一个方法,原理是基本类似的。

  四、跟踪所有点出链接

  使用下面语句可以跟踪所有点出链接。

  window.onload = setAdsLinks;

  function setAdsLinks()
  {
   var Links = document.getElementsByTagName( 'A' );
   for( var i = 0; i < Links.length; i++ )
   {
    Links[i].onclick = function() {
     urchinTracker( this.href );

    }
   }
  }

  注意,使用这个代码需要将Google Analytics的统计代码放在页面的最前端,另外这种统计有一个副作用,就是如果网页的超级链接非常多的话,这些语句会影响浏览器的性能,甚至引起“假死”的状态。

  五、显示完整的反向链接

  统计来源的时候,Google Analytics只显示域名信息,我们可以通过修改统计代码,实现Google Analytics显示完整的反向链接

  _uacct = "**-******-*"; // 这些是Google Analytics产生的代码

  //用下面的代码替换原有的代码。
  if( document.referrer )
  {
   urchinTracker(document.referrer);
  }
  else
  {
   urchinTracker();
  }

  六、不修改代码显示完整的反向链接

  Google官方提供了一个不修改代码也可以显示完整来源的方法,就是在“优化市场营销”-“访问者群体细分效果”-“造访来源”,选中来源地址左边的图标,点“跨群体效果”,再点“内容”即可返回来源具体静态URL的数据,这个方法用于静态地址的来源,动态地址(例如搜索结果)用这个会不好用。

2007年3月3日星期六

逃离Google补充材料的五个技巧

  翻译人:William Long ,译文地址:逃离Google补充材料的五个技巧,英文原文:How to: Escape Google‘s Supplemental Index

  现在的Google Sandbox不幸有两个级别,你只有获得了Google的信任,才会得到网页排名。实际上,这时考虑网页排名为时尚早,因为网页首先必须被编入索引才有排名这个问题。因为,如果当你的页面大多数被归类于补充材料时,你其实并没有真正被索引!

  为什么页面会被归类于“补充材料”,究竟发生了什么事?显然,Google索引页面文件是非常挑剔的,据传她唯一感兴趣的站点是那些长期的、值得信赖的站点。

  “那么补充材料到底是什么?”

  我不会根据Google的官方答案来鹦鹉学舌,我总结了以下几条:

  •   Google补充材料会把页面打入西伯利亚的牢房。
  •   Google补充材料是和正常Google索引相对的。
  •   Google补充材料会被赋予极低的信任值。
  •   Google补充材料不会被用于任何重要的排名。

  现在,假定你的页面已经进入了Google的补充材料,这里有五个方法,可以助你尽快逃离这个地狱。

  1、给每个页面不同的标题。尽管这极其简单,但依旧很多人没有这么做。我们绝对没有理由不这样做,这有助于SEO,可读性提高,获得高点击率等。

  2、给每个页面不同的 META DESCRIPTION 标记。记得我们都以为META标记已经没用了,不,Google还在利用这些标记。让我们不要浪费时间了,只要给所有页面一个唯一的 META DESCRIPTION 就可以了,甚至只是复制一下标题内容到里面也可以。

  3、做到每页都具有良好的独特的内容。这个问题很常见,原因也有不少,最常见的是在不同的URL地址中有很多内容块是相同的,这通常是因为网站的CMS或者购物车造成的,一些内容较少的页面或者空白也会存在这样的问题,凭我的经验(可能权威性不够,只是我的猜测),一个页面要有至少100个字才能成为较为独特的内容。

  4、多增加一些权威度高的反向链接。链接通常是很有效的,少数几个来自已被评级的老域名的链接会使得一个新站具有更高的权威度,从一个高PageRank的网站获得链接的效果更佳。

  5、在站内页面中多建立内部链接。这可以让Google觉得你的网站并不是一个空架子,想想看,当一个只有20多页、数十个坏链接,而且这些无效链接百分之百是指向同一个页面。通常情况下,网站页面会被正常索引,不过大多数内部页面已经进入补充材料了。

  做到上面那些后,大致就可以恢复正常了。通常情况下最难的部分是建立外部的有效反向链接,以取得可信的权威度,这方面的知识可以参考我的其他相关内容。

工商银行的VIP卡

  今天去工商银行办理业务,发现了一个不错的小技巧,可以节省不少时间。

  工行目前是刷银行卡取号,不同的卡取出来的号码不同,使用VIP卡可以在专用VIP柜台办理业务,非常节省时间。将工行卡变成VIP卡很简单,只要往卡里存入5万元,银行卡就会自动变成VIP卡,这样就不用再排队办理业务了,之后可以再把钱取出来。

  成为VIP卡后,排队时间大为减少,比如今天,普通卡有十多人排队,而VIP卡没人排队,结果我直接就可以去柜台办理业务了。

  此技巧用于深圳的工商银行,其他地方是否也可以,我就不得而知。

  相比之下,我在招商银行的存款很多,却没有成为VIP客户,而办理金卡几乎样样都要多交钱,好在招行有网上银行,我可以少去柜台办理业务了。

  另外今天我也发现一个新问题,我先前曾报道了新的银行个人外汇管理办法的实施,这次去结汇美元,发现手续似乎和以前不同,银行要让我填一张表,要说明帐号里的外汇是怎么来的,不过他们说,填写“其他”就可以了。我记得在托收境外汇来的支票时,只要金额超过2000美元,银行就要求填写收入来源,现在结汇时候又要求填写,我觉得实在是多此一举了。

2007年3月2日星期五

34个原因让读者退订你的博客

  翻译人:William Long,译文地址:34个原因让读者退订你的博客,英文原文:34 Reasons Why Readers Unsubscribe from Your Blog

  很多人都在思考为什么他们的读者会退订他们的RSS Feed,这里总结了34个原因,试图解释一下用户退订的部分原因所在以及动机。

  34个用户退订RSS Feed的原因:

  1、文章更新太快(频繁发文导致用户信息过载)

  2、文章更新太慢(也许博客已经停止更新)

  3、RSS Feed是摘要输出

  4、博客更改了内容主题(无关主题的文章太多)

  5、大部分内容在其他地方见过(复制或转载内容)

  6、没有意思的内容

  7、不相关的内容

  8、作者过于自我,过于自我宣传、自吹自擂

  9、内容质量低劣

  10、长篇文章过多

  11、负面报道

  12、RSS Feed错误,特别是Feed总是每次重载最后的10-20篇文章

  13、攻击性的内容/人身攻击/歧视

  14、内容商业化(大量销售信息)

  15、文章标题不说明文章主要内容

  16、内容没有排版

  17、读者的自身兴趣转移

  18、不再有用或有价值

  19、文章内的链接很多,内容不够

  20、内容大多是广告

  21、不一致的写作(风格和重点)

  22、语法错误太多

  23、发现有其他更好的Feed

  24、视线太窄

  25、一直重复某个议题

  26、言语粗鲁

  27、博客不回应文章的评论

  28、没有图片

  29、信心或看法不足

  30、不知道这个博客是谁

  31、文章结尾太多混乱

  32、评论读者

  33、太多引用

  34、更换了原来的博主

  下面是我的一些简短的评论(我不想发表长篇大论)

  发布频率显然是一个重要的因素,有35%的受访者表示是因为文章发布太快而退订,28%的称文章发布太慢而退订。我猜想原因可能是,停止更新的Feed并没有打扰读者(在Google Reader中某个模式你会看不到不活动的Feed,除非其进行更新)。

  摘要输出也不被人喜欢,24%的受访者说,他们会退订那些只输出摘要的Feed。

  博客改变研究方向和话题也是一个焦点,22%的人放弃订阅是因为这个理由。

  关于内容,有趣的是我发现人们对文章的质量、相关内容及性质并不太关心。发布的形式和更新次数成为主要因素,而内容则成为了次要因素。

2007年3月1日星期四

Google地图更新澳洲航拍图

  据Google观光报道,近日,在澳大利亚日拍摄的悉尼的超高分辨率航拍图像被增添到了Google Maps中。Google在自己的电子邮件中也公布了包括鲨鱼湾沙滩、海滩上的男子、卢纳公园、海军舰艇、船舶的高楼大厦、炮台、圆形码头和一个令人震撼的飞行中的直升机!

飞行中的直升机

  但是我们也不甘示弱!所以这里我们发布自己认为最好的景点,比如下面这个孩子在荡秋千,地上的影子清晰可见……

孩子在荡秋千

  …一个草形成一个怪异的玻璃金字塔后面的草地上有“性+死亡”的文字…

性+死亡

  人们在一个漂浮在水面的乒乓球台上打乒乓球。

乒乓球台上打乒乓球

  澳大利亚日的活动和其余的Google航拍是不同的,因为他们预先宣布会有飞机飞过,甚至提供了跟踪,使你能知道何时飞机会飞到头顶。

  据《悉尼先驱晨报》报道,很多人想趁机好好发布一些免费广告,一家本地公司就花了一万澳元制作了一个巨大品牌标志,有些人甚至在做自己的政治宣传活动。

  不过,似乎这一切努力都是徒劳的,因为据报导说,这架飞机后来使用了和计划中不同的飞行航道,而且并没有在计划时间内飞抵,也没有拍摄那么多照片。

  在Bondi沙滩,我们发现不少Google卫星下的裸体图片的新作品(可能不久我们可能就要出“卫星下的一百大裸体图片”了)。

裸体照片

  经过数小时的搜寻,我们没有找到在这次航拍中发布私人广告的实际例子,当然,下面的除外:

广告

  最后需要说明的是:这些图片目前还没有更新到Google Earth上。

  翻译:William Long,译文地址:Google地图更新澳洲航拍图,原文:Google观光