2007年3月25日星期日

Google用户说:Yahoo比Sex更好

  据dailydomainer的报道,在Google的搜索关键字的统计中Yahoo终于胜出,Google Trends(谷歌趋势)显示,在2006年的搜索统计中,“Yahoo”(雅虎)的搜索次数超过“Sex”(性),成为Google搜索排行榜的第一名。

Yahoo vs Sex

  雅虎似乎也正面临着类似的尴尬局面,在雅虎中搜索Google也越来越多。当在雅虎中搜寻“Google”的时候,雅虎很体贴地在结果页面上显示了第二个搜索框,仿佛在告诉大家:“喂,你眼前就有一个搜索引擎呢!”

Yahoo search

  一个令人费解的现象?一个奇怪的现象?

  施罗德有一个耐人寻味的解释:我注意到,近来很多用户已停止直接在浏览器中打出域名全名,而是开始使用Google来代替。他们不是录入“myspace.com”这个地址,而是在Google中录入“myspace”。

  我从我的同事和朋友们那里看到了这些搜索行为,但是这些真的就变成了Google搜索排名的前1000个结果。很多排名很靠前的搜索,如“bebo”,“ebay”,“yahoo”,“amazon”,“myspace”,“facebook”这些都不是真的是为了搜索,对于这些用户而言,他们大多都知道他们想访问哪个页面,但是他们就是想使用Google访问那里,而不是在地址栏输入。

  除了直接使用搜索引擎搜索的问题,另外还有两种可能的来源产生这些看似古怪的搜索:

  在FireFox的地址栏输入“yahoo”(没有.com后缀)一样可以进入Google搜索,并直接转向到搜索结果的最开头记录的地址,有些人是有意使用这个捷径,有些则是因为对域名一窍不通,并且相信这才是未来互联网的工作模式。

  Google toolbar(谷歌工具栏)已经安装在很多用户的电脑上,人们很容易混淆里面的地址栏和搜索栏。

  如果用户经常使用搜索引擎,用来搜索栏而不是地址栏,那么产生的结果就是,不仅仅使用搜索引擎来搜索某个公司名称,而且还会包括域名。所以就会出现以上那种情况。

  我们可以每天挑一个平均每月三万访客且没有广告的域名进行流量分析,看看到底有多少访客是通过搜索站点域名而过来的。这些统计数字证实了一个明显的趋势:越来越多的访问量来自于使用搜寻引擎(很大可能是搜索工具栏)而不是浏览器的地址栏。

  英文原文:Why “Yahoo” Is The #1 Search Term On Google

  中文翻译:William Long

2007年3月24日星期六

数据公钥加密和认证中的私钥公钥

  先前我曾经写了一篇“网站的安全登录认证设计”,可能是讲述的不够清楚,有一位读者就留言质疑到,“公钥顾名思义就是公开的啦,只要你愿意,谁都会有你的公钥,何来安全?应该是用网站的公钥加密,传到网站后,网站用自己的私钥解密吧”。

  这些密码学的概念容易被搞混淆,的确也情有可原。因为公钥、私钥、加密、认证这些都是较为复杂的问题,其概念不太容易理解,理解不透就容易产生各种似是而非的概念,为了让大家对于密码学有进一步的了解,这里我就详细解说一下公钥和私钥的具体作用和使用方法。

  加密和认证

  首先我们需要区分加密和认证这两个基本概念。

  加密是将数据资料加密,使得非法用户即使取得加密过的资料,也无法获取正确的资料内容,所以数据加密可以保护数据,防止监听攻击。其重点在于数据的安全性。身份认证是用来判断某个身份的真实性,确认身份后,系统才可以依不同的身份给予不同的权限。其重点在于用户的真实性。两者的侧重点是不同的。

  公钥和私钥

  其次我们还要了解公钥和私钥的概念和作用。

  在现代密码体制中加密和解密是采用不同的密钥(公开密钥),也就是非对称密钥密码系统,每个通信方均需要两个密钥,即公钥和私钥,这两把密钥可以互为加解密。公钥是公开的,不需要保密,而私钥是由个人自己持有,并且必须妥善保管和注意保密。

  公钥私钥的原则:

  1. 一个公钥对应一个私钥。
  2. 密钥对中,让大家都知道的是公钥,不告诉大家,只有自己知道的,是私钥。
  3. 如果用其中一个密钥加密数据,则只有对应的那个密钥才可以解密。
  4. 如果用其中一个密钥可以进行解密数据,则该数据必然是对应的那个密钥进行的加密。

  非对称密钥密码的主要应用就是公钥加密和公钥认证,而公钥加密的过程和公钥认证的过程是不一样的,下面我就详细讲解一下两者的区别。

  基于公开密钥的加密过程

  比如有两个用户Alice和Bob,Alice想把一段明文通过双钥加密的技术发送给Bob,Bob有一对公钥和私钥,那么加密解密的过程如下:

  1. Bob将他的公开密钥传送给Alice。
  2. Alice用Bob的公开密钥加密她的消息,然后传送给Bob。
  3. Bob用他的私人密钥解密Alice的消息。

  上面的过程可以用下图表示,Alice使用Bob的公钥进行加密,Bob用自己的私钥进行解密。

基于公开密钥的加密过程

  基于公开密钥的认证过程

  身份认证和加密就不同了,主要用户鉴别用户的真伪。这里我们只要能够鉴别一个用户的私钥是正确的,就可以鉴别这个用户的真伪。

  还是Alice和Bob这两个用户,Alice想让Bob知道自己是真实的Alice,而不是假冒的,因此Alice只要使用公钥密码学对文件签名发送给Bob,Bob使用Alice的公钥对文件进行解密,如果可以解密成功,则证明Alice的私钥是正确的,因而就完成了对Alice的身份鉴别。整个身份认证的过程如下:

  1. Alice用她的私人密钥对文件加密,从而对文件签名。
  2. Alice将签名的文件传送给Bob。
  3. Bob用Alice的公钥解密文件,从而验证签名。

  上面的过程可以用下图表示,Alice使用自己的私钥加密,Bob用Alice的公钥进行解密。

基于公开密钥的认证过程

  总结

  好了,上面就详细讲述了加密、认证、公钥、私钥这四个概念,明白这些概念后,你就应该对“网站的安全登录认证设计”一文所讲述的概念有了更清晰的了解了。

2007年3月23日星期五

抓虾即将支持目录阅读

  今天从“晨钟暮鼓”那里看到一个消息,抓虾实验室正在开发目录浏览的功能,这可真是一个好消息啊。

  我也算是抓虾的老用户了,对于抓虾不能目录浏览一直很不爽,因为我订阅的Blog有一百多个,如果一个一个点击观看,那实在是在考验我的耐性了,而Google Reader和Bloglines在这方面都做的很好。

  现在抓虾也终于打算开发这个功能了,这非常好。帮助用户节省时间,实际上就是帮助自己。

  在抓虾实验室中试用了一下这个目录浏览功能,感觉挺不错的,要是能加上类似Google Reader的快捷键就更能提高阅读效率了,希望抓虾的开发人员能考虑一下。

抓虾即将支持目录阅读

2007年3月22日星期四

Google的博客搜索排名分析

  今天在“谷歌治印”里看到一篇翻译Google Blogoscoped转载的Ionut Alex. Chitu修改的原创于seroundtable的文章(好大一个圈啊),讲的是Google博客搜索对于页面排名的一些分析,我这里谈一下我的看法。

  Google的BlogSearch默认是按照“相关度”(relevance)进行排序的,还有一种是按照时间排序。按照时间排序的规则很简单,就是最新的文章放在最前面。按照相关度排序,则是使用某种特殊的公式计算出一些参考分数,然后对这些分数进行排序。

  和原文说的一样,有利因素为正分,不利因素为负分。在有利因素中,应该还包括一个时间因素,据现在最近的文章其加分越高,反向链接也是一个重要参数,反向链接越多,加分越高。这两个因素应该是最为重要的因素。其他因素就是内容的相关性了,这实际上和普通网页搜索没有什么区别。

  Google博客排名的这个专利文档里面讲述的更为详细,不过我还没有仔细看过,有时间一定好好读一下,估计能学到不少东西。

  下面是关于Google Blogsearch排名规则的原文。

Google的博客排名专利

  Google在2005年年底的一份“博客排名文档”专利文件现在生效。(我没有在文件里看到过Google提及这个,但我知道一些在Google工作的工程师如Andriy Bihun, Jason Goldman and Vinod Marur.Google呈现了一组包括有利因素和不利因素的指标。为了清除Spammers,这个已经在Google博客搜索中上线了。不管怎样,从这可以窥探出Google是怎样想的。

  这里是一些对博客搜索有利因素:

  1. 博客的流行程度
  2. 是否存在于其它博客中“博客链接”里
  3. 大量的订阅数
  4. 标签的使用
  5. 在博客地址中包含的电邮地址和聊天记录(我在想Google是否把分析Gmail或Google Talk内容也用于这种用途?)

  博客或博客文章的PageRank(Google加入“博客文档”(例如一片文章)也许和PageRank没有关系(例如发表一篇新文章)。在这些情况下。新的博客文章可以把博客的PageRank保留下来和单独的PageRank为新文章确定下来)

  这里是一些不利因素:

  1. 文章在短暂时间内连续发表, 像自动的一样
  2. 在博客里发表重复的文章
  3. 使用在spam里经常出现的词汇
  4. 每片文章都是非常相似的长度
  5. 博客里的很多链接都是指向同一个网站的
  6. 包含很多广告

  当然,每个spammer同样也可以使用标签,并且有些很好的博客也有很多广告,所以我们可以把这些指标看成个别元素,缺少任何元素的存在或非存在都不能形成一个完整的好的博客。举个例子,Google可以根据其多少可见性来指定每属性几组点,通过属性的重要性来调整其价值,然后将它同某些人口进行比较来决定怎么来评定排名(或将它评定为spam)

  [经由 Ionut Alex. Chitu, 在 Search Engine Roundtable看到的.]

  原文:Google's Blog Ranking Patent , Translated by KEViN恺

百度日文初步评测

  近日,架设于日本的百度日文搜索引擎开始了系统测试。这是百度进军国际市场的第一步。目前百度日文网站(www.baidu.jp)已经可以访问,已经具有网页、图片两个搜索产品,我于是就对百度日文进行了一些初步的评测。

  一、域名的选择

  百度日文选用了baidu.jp的域名,而没有选用baidu.co.jp的域名,可能是一个失误,co.jp只有公司才可以注册的三级域名,而jp则是包括个人可以注册的二级域名。目前日本公司普遍都使用co.jp域名,日本的搜索引擎也普遍使用co.jp域名,比如Google使用google.co.jp的域名,Yahoo使用yahoo.co.jp的域名,微软使用msn.co.jp域名。因此百度在日本使用“baidu.jp”这样的域名可能是一个失误。

百度日文的首页

  更新:读者Jason发来一段他翻译的最新新闻,说被抢注的baidu.co.jp可能会归还百度。新闻如下:

  日本知识产权财产仲裁中心于16日,下达了如下命令:之前的baidu.co.jp是一家叫CBC的公司提前注册了,现在被命令将此domain还给baidu.jp公司。

  仲裁上声明,CBC是2006年12月7日登陆了这个domain,同年百度公司12月末,通过代理人曾经向CBC所要过此domain,但是被CBC拒绝了。

  CBC是一家从事自行车,手表,还有中国料理的公司。其公司的主要负责人是中国人。CBC主要的主张是:“baidu此拼音在中文中有多次数次的含义,所以只要是中国人都愿意注册此domain的。”

  另外一方面,中国大陆最大的检索公司百度所使用的这个名字,已经在中国广泛的被了解,而且对baidu相关domain有很多个,而且在日本也是被大报纸所登出过,所以百度公司认为baidu.co.jp是其。

  日本知识产权财产仲裁中心最后的判决解释是:“domain登录者CBC公司,因为不正当的使用理由而注册了此domain,所以必须将baidu.co.jp归还给百度公司”,这是命令。

  二、流量的差距

  百度在日本的竞争对手应该是Yahoo、Google和MSN,这几个日文搜索引擎的流量都是非常惊人的,从Alexa看,日文Yahoo排名第十,日文Google排名第33名,而目前百度排名为180,233(本周排名为36,856,不过55%的流量来自中国),简直是一个婴儿和成人的较量,百度想要在日文市场上占有一席之地,不是那么容易的事情。

  不过,日本市场的规模还是非常巨大的,至少是中国市场的十倍,百度只要能拥有日文市场的1/10,就相当于全部中文市场的规模了,因此还是值得一试。

  三、搜索体验

  在日文Google上搜索一些热门关键字,在搜索结果的顶部和右部都有赞助商广告,其形式和其他语言的Google完全相同,显示的广告为日文和英文的广告,如下图所示。

Google日文搜索

  而使用百度搜索同样关键字,则目前还没有广告显示,不过相信如果流量增大之后,百度还是会在里面显示广告,只是不知道是否类似国内的那种广告和结果混合的“推广”类型的竞价广告。

百度日文搜索

  四、内容审查

  日文百度目前没有看到对于搜索内容的审查,在日文百度的图像搜索中,目前还没有看到和中文百度一样的过滤信息的情况,比如搜索类似“女優”、“hardcore”、“teen”等关键词,会出现大量内容不堪入目的色情信息,如下图所示,而在中文百度中则不会出现这种情况。百度真正做到了“用肮脏的东西毒害日本人,把美好的东西留给中国人”。

百度的图片搜索

  五、另类搜索

  还记得去年的“Google搜索南京大屠杀”事件吗?同样的事情在百度日文上也发生了,在日文百度上同样无法正常搜索“南京大屠杀”或“钓鱼岛”,显示的效果和Google完全一样,不知道愤青们此时会作何感想。

2007年3月21日星期三

Google BlogSpot再次无法访问

  今天,有多位读者向我反馈,Google Blogger似乎无法访问了,我立刻对此进行了测试,得出的结论是BlogSpot的IP地址72.14.207.190目前无法访问。

  测试的截图如下所示:

Google BlogSpot再次无法访问

  最后一个IP为202.97.35.49,经过查询为“全国 (电信骨干路由器) 电信”,因此可以判断BlogSpot无法访问不是因为Google服务器坏了。

  要想继续访问,可以采用上次我介绍的方法:编辑WINDOWSsystem32driversetchosts 文件,然后加入72.14.219.190 xxx.blogspot.com ,其中xxx是你的用户名,即可访问到你自己的BlogSpot了。

  令一个奇怪的现象是,我前几天曾经发现我的MSN SPACES空间无法访问,而今天却又可以访问了,反而倒是Google又不能访问。

  Google的公关同志们,考验你们的时刻到来了,现在该是行动的时候了。恢复BlogSpot的重任就寄托在你们身上了。

  更新:3月28日,Google Blogger又可以访问了,不过3月29日再次无法访问,另外pkblogs这个绕到访问的方法也无效了。

  更新:4月1日,Blogspot又可以访问了,这么反反复复,可怜这些用户啊。

  更新:4月5日,Blogspot又无法访问啦。终于明白了一个道理:神仙在玩儿我们呢

  更新:4月15日,Blogspot可以正常访问。

  更新:5月11日,再次被封。5月14日解封。莫非有人在耍猴

  更新:5月28日,再次被封。

  大家请猜一下,下一次Blogspot不能访问会是什么时候?

2007年3月20日星期二

常用手机WAP网站资源收集

  WAP是“无线应用协议”的英文简称,它提供了通过手机访问互联网的途径。只要有了一个支持WAP的手机,就可以随时随地随身地访问互联网。使用手机上网速度虽然比较慢,但也是移动办公的一种选择,目前中国移动已经默认给所有手机开通GPRS WAP功能,在广东有各种包月套餐,单独使用一天为3M/2元,下面是一些手机的WAP网站地址,月光博客本身也支持WAP访问。

  搜索引擎

  ·GOOGLE wap.google.com

  ·百度 wap.baidu.com

  新闻资讯

  ·新浪 3g.sina.com.cn

  ·搜狐 wap.sohu.com

  ·腾讯 3g.qq.com

  电子邮件

  ·Gmail m.gmail.com

  ·网易 pda.163.com/wap.wml

  资源

  ·HAO123 wap.hao123.com

  ·3G门户 wap.3g.net.cn

  ·移动梦网 wap.monternet.com

  小说

  ·起点 wap.cmfu.com

  ·移动书城 wap.mbook.cn

  博客

  ·Google Reader www.google.com/reader/m

  ·月光博客 www.williamlong.info/wap.asp

  这些WAP网站在IE中无法直接打开,一般可以在opera中打开,不过使用Firefox也能设法打开,方法是安装一个叫做“wmlbrowser”的扩展就可以了。