2007年3月27日星期二

FeedBurner订阅数字排名

  FeedBurner做为一个最流行的RSS托管服务,已经注册了600,000个Feed,使用FeedBurner的服务可以很方便地跟踪Feed订阅统计,发布者还可以将这些订阅数字公布出来。

  虽然FeedBurner有各种有力的条件可以进行博客排行,但是由于某种原因,FeedBurner没有这么做,即使FeedBurner有数据,有能力,他们没有提供任何订阅排行榜的排序。虽然订阅数量并非衡量一个博客受欢迎程度的最佳指标,但是它有一定参考价值,如果FeedBurner提供这样的列表,那这个列表的重要性就可以和Technorati以及Alexa的排行相提并论了。

  尽管如此,有好事者如franticindustries,依旧根据四处搜集的方式整理出一份英文博客的订阅数字排行列表,这些订阅数字都是从一些热门博客的网站上获取到的。全部是英文,其中,订阅数目最多的四十个博客如下:

1. BoingBoing 

2. TechCrunch 

3. Simply Recipes 

4. Interesting Thing of the Day 

5. 43Folders 

6. Mashable 

7. DumbLittleMan 

8. 37signals 

9. John Battelle’s Searchblog 

10. CrunchGear 

11. Read/Write Web 

12. Coding Horror 

13. How to Change the World by Guy Kawasaki 

14. MicroPersuasion 

15. Duct Tape Marketing 

16. DiggNation 

17. GoogleOperatingSystem 

18. LifeHack 

19. TreeHugger 

20. FrenchMaidTV 

21. Small Business Trends 

22. Jeff Clavier’s Software Only 

23. A VC 

24. Search Engine Watch 

25. My Personal Finance Journey 

26. ProBlogger 

27. Chris Pirillo 

28. On The Media 

29. FeedBurner 

30. Vitamin 

31. UberGizmo 

32. Get Rich Slowly 

33. Web2Explorer 

34. ParentHacks 

35. Particle Tree 

36. Copyblogger 

37. Mac Mega Site 

38. Photoshop Killer Tips 

39. eHub 

40. French For Beginners 

41. MobileCrunch 

42. TheRssBlog  

  相比之下,月光博客的订阅数目为13888,可以排在第36位。

月光博客

  不过这样的排名可能意义并不大,因为很多人并没有使用Feedburner托管RSS Feed,还有一些人不会使用FeedBurner(比如徐静蕾),因此,technorati的博客排行(需要使用加密代理才能访问)可能会更有代表性一些。(via:franticindustrieswebleon

Del.icio.us的RSS输出优化

  据del.icio.us的官方博客报道,del.icio.us的RSS Feeds输出有了一些新的特色功能。据统计,大约有一半的del.icio.us的访问都是通过RSS Feeds实现。

  由于小的变化往往可产生大的影响,因此,官方的开发团队的对于Feeds的输出做了一些小的改善。这些改进包括以下特点:

  1. 在Feed的标题和内容中中加入标签说明;
  2. 在Feed中提供可让你的读者直接保存链接到del.icio.us;
  3. 在Feed中显示书签的保存数目,数目更新时并不会重复输出Feed;
  4. 在Feed中加入“更多”的链接,点击后可以查看链接在所有人的收录时的摘要、标签等;
  5. 提供更多有用的数据,较少一些多余的信息。

  最终RSS Feed在阅读器中的显示效果如下所示:

del.icio.us

 

2007年3月26日星期一

Panoramio图片数量超过百万

  据Panoramio的官方博客的爱德华.曼乔声称,Panoramio目前已经地理标注的图片已经超过一百万张了。

  爱德华.曼乔无不自豪的说,自从Panoramio网站于2005年10月开张以来,已经有300.000人注册,二月份更有超过4百万独立访客,产生了超过3千万的页面流量,可以想像这些流量让整个团队非常繁忙,特别是过去的三个月。从下面的图片我们就知道过去三个月来,Panoramio网站的巨大增长。(译者注:三个月前Google Earth新增了Panoramio地理图层)

Panoramio网站的巨大增长

  赫内斯昆卡一直在非常努力地优化Panoramio的两台服务器,成果斐然。现在即使在访问高峰期,网站的下载速度也保持稳定。Panoramio将会将现有的服务器翻一番,以便应付未来的告诉增长。

  Panoramio目前已经新增了8种语言,包括保加利亚语、挪威语、希腊语、芬兰语、斯洛文尼亚语、巴西葡萄牙语、波斯语和中文繁体。使用自己的语言访问Panoramio应该会感觉很好。

  未来Panoramio将提供更多新的特点,例如在Panoramio地图提供“热门”标签,人们可以通过照片的受欢迎程度来浏览最佳的照片。

  原文:Panoramio Blog,翻译:William Long

2007年3月25日星期日

Google用户说:Yahoo比Sex更好

  据dailydomainer的报道,在Google的搜索关键字的统计中Yahoo终于胜出,Google Trends(谷歌趋势)显示,在2006年的搜索统计中,“Yahoo”(雅虎)的搜索次数超过“Sex”(性),成为Google搜索排行榜的第一名。

Yahoo vs Sex

  雅虎似乎也正面临着类似的尴尬局面,在雅虎中搜索Google也越来越多。当在雅虎中搜寻“Google”的时候,雅虎很体贴地在结果页面上显示了第二个搜索框,仿佛在告诉大家:“喂,你眼前就有一个搜索引擎呢!”

Yahoo search

  一个令人费解的现象?一个奇怪的现象?

  施罗德有一个耐人寻味的解释:我注意到,近来很多用户已停止直接在浏览器中打出域名全名,而是开始使用Google来代替。他们不是录入“myspace.com”这个地址,而是在Google中录入“myspace”。

  我从我的同事和朋友们那里看到了这些搜索行为,但是这些真的就变成了Google搜索排名的前1000个结果。很多排名很靠前的搜索,如“bebo”,“ebay”,“yahoo”,“amazon”,“myspace”,“facebook”这些都不是真的是为了搜索,对于这些用户而言,他们大多都知道他们想访问哪个页面,但是他们就是想使用Google访问那里,而不是在地址栏输入。

  除了直接使用搜索引擎搜索的问题,另外还有两种可能的来源产生这些看似古怪的搜索:

  在FireFox的地址栏输入“yahoo”(没有.com后缀)一样可以进入Google搜索,并直接转向到搜索结果的最开头记录的地址,有些人是有意使用这个捷径,有些则是因为对域名一窍不通,并且相信这才是未来互联网的工作模式。

  Google toolbar(谷歌工具栏)已经安装在很多用户的电脑上,人们很容易混淆里面的地址栏和搜索栏。

  如果用户经常使用搜索引擎,用来搜索栏而不是地址栏,那么产生的结果就是,不仅仅使用搜索引擎来搜索某个公司名称,而且还会包括域名。所以就会出现以上那种情况。

  我们可以每天挑一个平均每月三万访客且没有广告的域名进行流量分析,看看到底有多少访客是通过搜索站点域名而过来的。这些统计数字证实了一个明显的趋势:越来越多的访问量来自于使用搜寻引擎(很大可能是搜索工具栏)而不是浏览器的地址栏。

  英文原文:Why “Yahoo” Is The #1 Search Term On Google

  中文翻译:William Long

2007年3月24日星期六

数据公钥加密和认证中的私钥公钥

  先前我曾经写了一篇“网站的安全登录认证设计”,可能是讲述的不够清楚,有一位读者就留言质疑到,“公钥顾名思义就是公开的啦,只要你愿意,谁都会有你的公钥,何来安全?应该是用网站的公钥加密,传到网站后,网站用自己的私钥解密吧”。

  这些密码学的概念容易被搞混淆,的确也情有可原。因为公钥、私钥、加密、认证这些都是较为复杂的问题,其概念不太容易理解,理解不透就容易产生各种似是而非的概念,为了让大家对于密码学有进一步的了解,这里我就详细解说一下公钥和私钥的具体作用和使用方法。

  加密和认证

  首先我们需要区分加密和认证这两个基本概念。

  加密是将数据资料加密,使得非法用户即使取得加密过的资料,也无法获取正确的资料内容,所以数据加密可以保护数据,防止监听攻击。其重点在于数据的安全性。身份认证是用来判断某个身份的真实性,确认身份后,系统才可以依不同的身份给予不同的权限。其重点在于用户的真实性。两者的侧重点是不同的。

  公钥和私钥

  其次我们还要了解公钥和私钥的概念和作用。

  在现代密码体制中加密和解密是采用不同的密钥(公开密钥),也就是非对称密钥密码系统,每个通信方均需要两个密钥,即公钥和私钥,这两把密钥可以互为加解密。公钥是公开的,不需要保密,而私钥是由个人自己持有,并且必须妥善保管和注意保密。

  公钥私钥的原则:

  1. 一个公钥对应一个私钥。
  2. 密钥对中,让大家都知道的是公钥,不告诉大家,只有自己知道的,是私钥。
  3. 如果用其中一个密钥加密数据,则只有对应的那个密钥才可以解密。
  4. 如果用其中一个密钥可以进行解密数据,则该数据必然是对应的那个密钥进行的加密。

  非对称密钥密码的主要应用就是公钥加密和公钥认证,而公钥加密的过程和公钥认证的过程是不一样的,下面我就详细讲解一下两者的区别。

  基于公开密钥的加密过程

  比如有两个用户Alice和Bob,Alice想把一段明文通过双钥加密的技术发送给Bob,Bob有一对公钥和私钥,那么加密解密的过程如下:

  1. Bob将他的公开密钥传送给Alice。
  2. Alice用Bob的公开密钥加密她的消息,然后传送给Bob。
  3. Bob用他的私人密钥解密Alice的消息。

  上面的过程可以用下图表示,Alice使用Bob的公钥进行加密,Bob用自己的私钥进行解密。

基于公开密钥的加密过程

  基于公开密钥的认证过程

  身份认证和加密就不同了,主要用户鉴别用户的真伪。这里我们只要能够鉴别一个用户的私钥是正确的,就可以鉴别这个用户的真伪。

  还是Alice和Bob这两个用户,Alice想让Bob知道自己是真实的Alice,而不是假冒的,因此Alice只要使用公钥密码学对文件签名发送给Bob,Bob使用Alice的公钥对文件进行解密,如果可以解密成功,则证明Alice的私钥是正确的,因而就完成了对Alice的身份鉴别。整个身份认证的过程如下:

  1. Alice用她的私人密钥对文件加密,从而对文件签名。
  2. Alice将签名的文件传送给Bob。
  3. Bob用Alice的公钥解密文件,从而验证签名。

  上面的过程可以用下图表示,Alice使用自己的私钥加密,Bob用Alice的公钥进行解密。

基于公开密钥的认证过程

  总结

  好了,上面就详细讲述了加密、认证、公钥、私钥这四个概念,明白这些概念后,你就应该对“网站的安全登录认证设计”一文所讲述的概念有了更清晰的了解了。

2007年3月23日星期五

抓虾即将支持目录阅读

  今天从“晨钟暮鼓”那里看到一个消息,抓虾实验室正在开发目录浏览的功能,这可真是一个好消息啊。

  我也算是抓虾的老用户了,对于抓虾不能目录浏览一直很不爽,因为我订阅的Blog有一百多个,如果一个一个点击观看,那实在是在考验我的耐性了,而Google Reader和Bloglines在这方面都做的很好。

  现在抓虾也终于打算开发这个功能了,这非常好。帮助用户节省时间,实际上就是帮助自己。

  在抓虾实验室中试用了一下这个目录浏览功能,感觉挺不错的,要是能加上类似Google Reader的快捷键就更能提高阅读效率了,希望抓虾的开发人员能考虑一下。

抓虾即将支持目录阅读

2007年3月22日星期四

Google的博客搜索排名分析

  今天在“谷歌治印”里看到一篇翻译Google Blogoscoped转载的Ionut Alex. Chitu修改的原创于seroundtable的文章(好大一个圈啊),讲的是Google博客搜索对于页面排名的一些分析,我这里谈一下我的看法。

  Google的BlogSearch默认是按照“相关度”(relevance)进行排序的,还有一种是按照时间排序。按照时间排序的规则很简单,就是最新的文章放在最前面。按照相关度排序,则是使用某种特殊的公式计算出一些参考分数,然后对这些分数进行排序。

  和原文说的一样,有利因素为正分,不利因素为负分。在有利因素中,应该还包括一个时间因素,据现在最近的文章其加分越高,反向链接也是一个重要参数,反向链接越多,加分越高。这两个因素应该是最为重要的因素。其他因素就是内容的相关性了,这实际上和普通网页搜索没有什么区别。

  Google博客排名的这个专利文档里面讲述的更为详细,不过我还没有仔细看过,有时间一定好好读一下,估计能学到不少东西。

  下面是关于Google Blogsearch排名规则的原文。

Google的博客排名专利

  Google在2005年年底的一份“博客排名文档”专利文件现在生效。(我没有在文件里看到过Google提及这个,但我知道一些在Google工作的工程师如Andriy Bihun, Jason Goldman and Vinod Marur.Google呈现了一组包括有利因素和不利因素的指标。为了清除Spammers,这个已经在Google博客搜索中上线了。不管怎样,从这可以窥探出Google是怎样想的。

  这里是一些对博客搜索有利因素:

  1. 博客的流行程度
  2. 是否存在于其它博客中“博客链接”里
  3. 大量的订阅数
  4. 标签的使用
  5. 在博客地址中包含的电邮地址和聊天记录(我在想Google是否把分析Gmail或Google Talk内容也用于这种用途?)

  博客或博客文章的PageRank(Google加入“博客文档”(例如一片文章)也许和PageRank没有关系(例如发表一篇新文章)。在这些情况下。新的博客文章可以把博客的PageRank保留下来和单独的PageRank为新文章确定下来)

  这里是一些不利因素:

  1. 文章在短暂时间内连续发表, 像自动的一样
  2. 在博客里发表重复的文章
  3. 使用在spam里经常出现的词汇
  4. 每片文章都是非常相似的长度
  5. 博客里的很多链接都是指向同一个网站的
  6. 包含很多广告

  当然,每个spammer同样也可以使用标签,并且有些很好的博客也有很多广告,所以我们可以把这些指标看成个别元素,缺少任何元素的存在或非存在都不能形成一个完整的好的博客。举个例子,Google可以根据其多少可见性来指定每属性几组点,通过属性的重要性来调整其价值,然后将它同某些人口进行比较来决定怎么来评定排名(或将它评定为spam)

  [经由 Ionut Alex. Chitu, 在 Search Engine Roundtable看到的.]

  原文:Google's Blog Ranking Patent , Translated by KEViN恺