2006年10月29日星期日

百度和Google清除站点的规则探讨

  任何一个搜索引擎都需要制定一些收录和清除站点的标准,以便确保搜索结果的公正和公平,并提供客户最佳的搜索体验,不过不同搜索引擎对于收录和清除站点的标准是不太一样的。

  关于收录上的问题,以前我曾经写了一篇文章比较百度和Google收录网站的区别,主要观点是,百度收录的多而快,对于小站点也可以大量收录,而Google收录速度较慢,主要优先收录大站点的页面。

  那么,在清除网站方面,百度和Google又有什么不同呢?这是本文主要探讨的问题。

  对于百度和Google的清除站点规则,我觉得主要分为程序的自动判断和人工判断两部分组成,下面我们将介绍一下主要的一些规则。

  Google清除网站的规则在 Webmaster Help Center 上有详细介绍,概括起来主要分为网站作弊(如隐藏文字,重复堆砌文字),使用非法的自动跳转页面技术(如302重定向),使用程序自动进行Google查询,使用子域名或者其他域名创建大量重复内容,使用门页欺骗搜索引擎,加入链接工厂等等,Google建议做网站要针对用户设计而不要针对搜索引擎设计。对于中文网站来说,Google对于作弊网站会先采用降权的方式,不太常见直接删除中文网站的情况,Google人工干预大概主要是针对英文网站来做的。另外做SEO不要使用googlepages或者blogspot进行网站优化,那样做只会被Google立刻删除。

  值得称赞的是,Google与网站管理员之间的信息是比较通畅的,Google建立了专门的“网站管理员中心”,网站管理员可以登录查看Google蜘蛛抓取网站的情况,甚至还可以设置“首选域”,设置网址在Google索引中显示的方式。

  与此对比,百度也有自己收录和删除网站的规则,有一些规则和Google的相同,有一些则比较含糊和笼统,一般认为百度的反作弊法则是神秘而让人难以捉摸的,其中部分原因是,为了保证删除的准确性,百度会人为进行一些网站的删除操作。

  百度会删除什么样的网站呢?通常认为,Google认为应该删除的网站,百度同样也会删除,Google认为不应该删除的网站,百度也可能会删除。总之,百度的删除标准会比Google更严厉一些。

  由于有了人为因素,有人会产生一个问题,就是批评百度的网站会不会被百度删除,结合一些例子,至少从目前的情况来看,百度还没有因为网站批评百度而人为进行删除的先例。

  另外一个疑问是人工的成本,人工不可能监视所有的海量搜索内容,百度也不可能雇用那么多人,那么具体这个人工干预是怎么实现的呢?根据一段时间的观察和分析,我个人推测,百度的人工干预有可能是以搜索流量为标准,对于搜索热门关键词的第一页网站进行人工验证,如果发现第一页的网站有作弊行为而百度没有正确判断,则进行人工方式降权或者删除。当然,也可能百度有一些自动化的程序进行自动处理行为。

  百度对于网站的惩罚也可能并非永久的,特别是对于本身知名度较大的网站,如果网站在百度中具有较多的反向链接,并且及时删除了百度认为不合适的页面,那么百度有可能会在一段时间后,重新收录被惩罚的网站,但是网站的权值有可能会降低。

  百度目前和网站管理员之间的信息渠道是否通畅很令人质疑,甚至可以说两者之间没有任何交流渠道,这点是远远不如Google做的好,比如webmaster的邮件永远是自动回复,贴吧里的问题永远无人处理,没有类似Google的专用工具进行分析处理等等,这也是百度在很多地方口碑不佳的一个原因。

  其实百度也发现这样所带来的问题。网络新手和普通网民的影响力微不足道,被流氓网站修改了浏览器,也不会反抗,用时间长了反而会依赖和喜欢上这样的流氓网站。而IT专业人士则不同,他们建网站、写博客、开论坛,他们可以影响一大批普通用户,如果百度长期依靠低端用户而和大量网站管理员结怨的话,其发展前景也是令人质疑的。

2006年10月28日星期六

Google个性化主页新增功能

  今天,中文版本的Google个性化主页进行了改版,增加了页签功能。

  较早的时候,我曾经介绍了利用Google个性化主页进行时间管理的方法,使用那个方法会占用较多的空间位置,现在,大家可以将和工作相关的内容放在一个页签,和生活娱乐相关的放在另外一个页签,使用起来就灵活方便很多了,再也不怕地方不够了。

  例如,将待办事项、便条纸、书签、日历、天气预报等和工作相关的放在一个页签,将Gmail、IP查看器、计算器、地图、黄页等工具类放在另外页签,这样条理就更清晰,比全部放在一块要好的多。

  另外,英文方面的小工具比中文的要多的多,大家可以访问这个地址来添加丰富的英文小工具。

2006年10月26日星期四

BlogSpot疑似再次被封

  从昨天晚上开始,不少人向我反应Google的博客服务BlogSpot再次无法访问。

  我自己验证了一下,我的确也无法访问,根据我的检测,无法访问的原因是72.14.219.191的IP无法访问,具体原因不能确认,可能是BlogSpot更改IP地址,也可能是这个IP本身就被墙了。

  从BlogSpot解封到现在再次无法访问,大概有2个半月时间,看来最终还是要被封,这里我想到了一件事情,就是最近炒的沸沸扬扬的博客实名制,很多人质疑博客实名制的主要原因是,实名制会将Blogger赶到国外,不过现在BlogSpot再次无法访问提醒我们,Blogger被赶到国外实在是杞人忧天,要想使用国外的博客服务,也是需要有关部门同意才可以。

  目前的博客实名制据说和以前的网站备案类似,实际上,独立域名的Blogger大多都已经实名备案了,也就不存在实名不实名的问题,出了问题肯定找的到人,目前的问题主要是针对博客托管服务(BSP)的用户,备案的时候会要求输入手机号码,这个手机号码的目的就是为了能快速找到你的个人,目前有关部门就经常打我手机要我去删除网站上的某某信息。这种实名制实际上是对个人的一种威慑,但是将个人实名公布到网站上估计不太可能,我估计博客实名制实际上应该叫博客备案才更准确。

  最后,对于BlogSpot的博客,我发现通过修改hosts文件还是可以间接访问的,具体方法是:编辑WINDOWSsystem32driversetchosts 文件,然后加入72.14.219.190 xxx.blogspot.com ,其中xxx是你的用户名,即可访问到你自己的BlogSpot了。

  更新:26日晚上,72.14.219.191这个IP又可以访问了,我查看了几个BlogSpot地址,全都可以访问了,但是到了27日,这些地址又无法访问了。

FireFox 2.0发布时的几则趣闻

  FireFox 2.0正式版10月24日发布,现在进入Mozilla的首页即可看到中文FireFox 2.0的下载地址,这个下载地址和几天前Blogger之间传播的下载地址不太一样。

  Firefox 2.0正式版在发布的前一天就被曝光了,FTP放出下载的事情被Blogger广泛流传。对此,Mozilla感到有些不满,认为这会打搅了他们的发布日程。

  FireFox的对头,微软的IE开发团队送上一个蛋糕,对FireFox 2.0的发布表示祝贺。

  FireFox可以通过官方的API直接订阅到几种常用阅读器上,这点比1.5可好多了。

  FireFox 2.0会导致1.5的插件失效,比如del.icio.us,不过没有关系,del.icio.us的支持FireFox2.0版本的插件1.2可以去https://addons.mozilla.org/firefox/1532/ 下载,del.icio.us官方网站还是放的旧版本插件,怀疑del.icio.us是否没人维护了。

2006年10月24日星期二

游戏推荐:天诛红

  这些天在玩一个老游戏《天诛红》中文版。

  天诛系列游戏是一个风格非常独特的杀手类型的游戏,我是从PS机的天诛一开始玩的,那个版本的也是中文版,在PS那样的机能下,天诛一看起来实在是太华丽了,是PS机上的必玩游戏之一。当初我在PS上连玩几个通宵,将天诛一通关,并将忍术修炼的非常高。不过可惜后来我PS机玩坏了,现在只能回顾一下天诛红这个游戏。

  天诛红看起来比同是PS3的天诛三要好看一些,不过PS2里的天诛和PS里的天诛操作上有很大区别,如果熟悉了PS的天诛,习惯可能还不太好修改。

  天诛红和天诛系列游戏一样,都是描述日本战国时代的忍者游戏,操作起来和KONAMI的合金装备(Metal Gear Solid)有点像,不过风格完全不同,天诛系列游戏是充满了日本忍者文化的很独特游戏。

  游戏的主角是男女忍者,“忍者”这个名词最早可以回溯到日本江户时代,通常是为贵族执行秘密任务,类似现代的杀手或刺客。

  在天诛系列游戏中也是这样设置的,通常情况下,一对一格斗并不是忍者的强项,二对一的情况下忍者反而处于非常危险的境地,所以要发挥忍者的长处。忍者的长处是暗杀,在敌人毫无防备的情况下,基本是一刀致命(忍杀),天诛红的忍杀系统就十分爽快,杀戮镜头相当华丽。

天诛红

  天诛红的主角是彩女和凛,不过我还是喜欢以前天诛里的男主角刀丸。彩女和凛这两个角色是都是女杀手的形象,女性特征不是很明显,感觉和李宇春是类似的风格,武器较短,直接格斗较弱,所以我还是喜欢使用男主角来搞暗杀更爽快一些。

天诛红

  不过总的来说,“天诛红”也是PS2上的非常值得一玩的游戏,而且还是中文版的,相信喜欢她的玩家不是少数。

  下面是天诛红的部分游戏截图。

天诛红

天诛红

天诛红

天诛红

2006年10月23日星期一

Web2.0的人力资源成本核算

  上次提到的“建立Web2.0网站需要解决的问题”,实际上有一点疏漏,就是人力资源成本的核算问题。

  Web2.0的一大特点就是用户提供内容,降低了编辑的人力资源成本,然而这个成本到底是多少,是本文需要重点讨论的问题。

  目前美国的最低工资标准,在各个州是不同的,联邦政府目前规定的最低工资标准为每小时5.15美元,纽约州规定的最低时薪标准是6.75美元。按照每天八小时,每月二十一天来计算,一月的工资是900美元到1000美元左右。这个是美国的最低工资标准。

  网站编辑的人力成本肯定不能按照最低工资标准来计算,因为做编辑至少需要一定的脑力劳动,而美国的工资水平大概很多人是无法想象的,比如去年纽约公交系统职工大罢工,号称待遇太低,闹得全城瘫痪。但是从当时看报道,地铁司机和其他勤务人员的平均年薪是6万美元左右,远远高于最低工资。更为重要的是,美国有行业工会组织,如果资方的工资普遍太低,工会就会组织罢工来对抗。这也是美国人力成本无法降低的主要原因之一。

  这种高成本带来的好处是只要就业了,基本生活问题就解决,并且带来了大量的服务行业的就业机会,对于整个社会的稳定有一定作用。

  美国人从他们的观点,同样无法理解中国的情况,美国人看到深圳街头一家服装专卖店,狭小的空间竟然有5、6名员工,美国人会惊奇地问,雇用这么多人怎么可能赚钱?而事实是,在中国,雇用这么多人也可以赚钱,因为人工成本实在太便宜。深圳的最低工资仅有每月700元,几乎比国外低十倍以上,而且没有工会,同时社会上存在着大量失业人员,劳工阶层是绝对的弱者,对于资方没有任何讨价还价的余地,如果不接受这样的低工资,就只有走人,还有大量的人在等着这个工作呢。即使对于普通网站编辑来说,一个月的工资可能也只有1000到2000元左右,其成本也是相当低廉的。

  这里我们可以做一个比较,将美国的麦当劳比做Web2.0网站,在中国吃麦当劳的时候,我们可能会发现一个奇怪的现象,就是老外吃完麦当劳后,会主动将餐盘放到回收处,而中国人都是直接走人,让服务员来收拾。这其实就是一个习惯的问题,因为人力成本的问题,老外在国外吃惯了自助的麦当劳,自己不收拾餐盘,也没有服务员来收拾,于是就养成了自己服务的习惯。对于国外的一些Web2.0网站,比如del.icio.us或digg,老外也很勤快的参与和提交内容,这大概是同样的道理。而中国就不一样的,人力成本极低,于是在中国的麦当劳在中国就可以雇佣很多服务员,以便增强竞争力,不这么做的话,对于中国同行就没有竞争力,所以中国人已经被惯坏了,知道即使自己吃完了不收拾餐盘,服务员也会很快来收拾。对于中国的网站同样也是这样的,大型门户网站雇用了大量网站编辑,可以用非常快地速度更新优质的内容,因此中国的网民也明白,即使自己不去提交、不去digg,也自然会有大量优秀内容提供给自己,所以久而久之,中国的网摘类或者digg类的网站就怎么也无法和国外的同类型网站相比,这其中的主要原因,恐怕就是Web2.0的人力资源成本问题了。

  因此,照搬美国的网站模式,需要结合一下中国的实际情况。有一些在美国不可能完成的事情,放在中国就可能完成,中国模式的网站需要结合中国的实际情况,相信在中国取得成功的企业,也是深刻了解这些问题的。一些在美国发展的很好的公司,如果想进入中国市场的话,就需要仔细研究中国市场的不同,结合中国的实际情况来创建符合中国特色的服务,这一点来看,麦当劳、肯德基、以及沃尔玛这些公司做的都非常出色。

2006年10月21日星期六

裸体作诗也犯罪

  新浪网的博客上,杨黎的一篇文章“930诗歌朗诵会上做行为艺术《我和我的衣服》的作者苏非舒被治安拘留”目前备受关注,评论有四百多条。

  事情的起源还是从赵丽华的梨花诗恶搞开始的,一些恶搞赵丽华诗歌的网友自称“梨粉”,在网络上发表各种恶搞的“梨花诗”,韩寒更在其博客上对赵丽华进行辱骂和攻击,面对许多网友的恶搞和不理解,9月30日,数十位现代派诗人以“支持赵丽华,保卫现代诗歌”为口号开了一场诗歌朗诵会,会上,男诗人苏非舒在台上当众脱衣,一丝不挂,全裸朗诵,引起了争议。之后诗人杨黎昨天在个人博客中透露,他是17日下午接到苏非舒女友的电话,知道了“苏非舒被治安拘留10天”。

  当然,这实在是一场闹剧,不过我对裸体后被治安拘留还是有一些感慨的。

  说道裸体,我不得不提到一个两千年前三国时期的一个人物:祢衡。他是裸的最出名的一个。并且他是在当时最大的实权人物-曹操的宴会上公然裸体击鼓,曹操质疑他后,祢衡几句话反驳的曹操张口结舌。

  下面是《三国演义》中的《第二十三回 祢正平裸衣骂贼 吉太医下毒遭刑》中祢衡怒骂曹操的部分精彩段落欣赏:

  来日,操于省厅上大宴宾客,令鼓吏挝鼓。旧吏云:“挝鼓必换新衣。”衡穿旧衣而入。遂击鼓为《渔阳三挝》。音节殊妙,渊渊有金石声。坐客听之,莫不慷慨流涕。左右喝曰:“何不更衣!”衡当面脱下旧破衣服,裸体而立,浑身尽露。坐客皆掩面。衡乃徐徐着裤,颜色不变。操叱曰:“庙堂之上,何太无礼?”衡曰:“欺君罔上乃谓无礼。吾露父母之形,以显清白之体耳!”操曰:“汝为清白,谁为污浊?”衡曰:“汝不识贤愚,是眼浊也;不读诗书,是口浊也;不纳忠言,是耳浊也;不通古今,是身浊也;不容诸侯,是腹浊也;常怀篡逆,是心浊也!吾乃天下名士,用为鼓吏,是犹阳货轻仲尼,臧仓毁孟子耳!欲成王霸之业,而如此轻人耶?”

  不过,曹操被骂的狗血喷头,虽然心里生气,却并没有处罚祢衡,这也显得曹操的肚量还是很大的。正因为曹操如此肚量,才称得上是天下的英雄。祢衡虽然口头上骂曹操,但是从内心里可能也还是想要被曹操重用的,只是曹操任命他为鼓吏令他不满,才说出“吾乃天下名士,用为鼓吏,是犹阳货轻仲尼,臧仓毁孟子耳”这样的话,可惜的是祢衡这样的没落文人只是徒有虚名而没有实干能力,只能说不能干,骂人的本事的确比谁都高,但实际上什么实际事情都做不好,曹操派他去劝降刘表,祢衡也没有能力完成,最后反而被刘表手下的黄祖给杀了,难怪曹操评价他是“腐儒舌剑,反自杀矣”。

  值得注意的是,曹操虽然不喜欢祢衡,却不敢把他怎么样,因为他害怕落下一个“害贤”的名声,被后人辱骂。而黄祖这个大老粗就什么都不管,敢于下手杀文人。结果后来大诗人李白就曾经写过一首怀念祢衡的诗歌“望鹦鹉洲怀祢衡”:

  魏帝营八极,蚁观一祢衡。

  黄祖斗筲人,杀之受恶名。

  吴江赋鹦鹉,落笔超群英。

  锵锵振金玉,句句欲飞鸣。

  鸷鹗啄孤凤,千春伤我情。

  五岳起方寸,隐然讵可平。

  才高竟何施,寡识冒天刑。

  至今芳洲上,兰蕙不忍生。

  李白在诗中为祢衡的才华不得施展而惋惜,为他的寡识冒刑而哀伤,对黄祖的凶残表达了强烈的憎恨。黄祖恐怕也想不到,就是因为杀了一个小小的祢衡,而被素有“诗仙”之称的李白写入诗中,遗臭万年。

  不过,时间过了两千年了,现在人似乎远远没有理解这个故事,没有认识到曹操那样的胸怀、肚量以及谋略带来的好处,也就会发生像苏非舒这样的文人被关入大牢的事情了,王小波在《沉默的大多数》中就总结,知识分子最害怕的是不理性的时代。理性的时代都需要批评家,即使你赤身裸体咒骂一个最高领导人,他也会容忍你,因为他知道,越是接受批评,天下英雄就越会聚集到自己这里。相反的,那些迫害批评家、希望人人都不敢说真话、不敢批评社会、连发条短信都会面临文字狱之灾的国度,批评家都要付出惊人的代价,甚至是牢狱之灾。

  所以,处于这个时代,我们还是以何祚庥的名言做为自己的座右铭吧:“谁叫你不幸生在中国”!