2006年5月21日星期日

可耻的汉芯和麒麟

  今年对于我们的IT行业来说可以算是耻辱的一年。

  首先是“汉芯丑闻”,上海交大研制了一个所谓的国内第一个完全拥有自主知识产权的DSP芯片(数字信号微处理器)——“汉芯”,研制人陈进教授以此领取政府一亿元人民币无偿补助。去年12月份有人举报汉芯涉嫌造假,根据举报人的说法,陈进采取盗用国外芯片产品,磨去原有IC芯片上面的打印标志后,改印他们自己标志进行造假。国家相关部门对此进行了调查,经过2个月的调查之后,认定陈进伪造了汉芯数字信号处理器的研究,并不能实现其声称的功能。官方通讯社新华社宣称陈进从一家外国公司盗取了相关技术和芯片。上海交大随即开除了陈进的院长和教授职务。科技部和国家发展改革委称他们将终止资助陈进的研究项目,并收缴他从政府获得的研究经费。

  这个可耻的丑闻或许标志着上海成为世界芯片制造业中心的梦想已经破灭。

  然而,丑闻总是接踵而来,“汉芯丑闻”刚刚结束,国防科技大学开发的863成果-麒麟操作系统是否造假也开始遭到业界强烈的质疑

  在我们所能查到的众多介绍中,关于麒麟操作系统的介绍有下面几项要点:是863计划的研究成果,由国防科大负责研发,02年启动,04年通过验收,是自主研发和具有完整知识产权的国产操作系统。国家资金支持为7000万人民币。

  国防科技大学是这样描述麒麟操作系统的:“Kylin服务器操作系统是国家863计划的重大研究成果,拥有完全自主版权的内核,与Linux 在应用上二进制兼容,并支持64位,是中国独立研发成功的、具有完全自主知识产权的服务器操作系统。”

  国防科技大学声称“银河麒麟”服务器操作系统的研制成功,一举打破了国外产品对我国信息化基础设施的垄断,解决了我国软件产业的空心化问题,提升了国家信息化基础设施的总体安全水平,对于完善国家自主的软件体系,加快我国自主的信息化建设具有十分重要的战略意义。

  然而在四月末,网上出现了一篇针对银河麒麟的一篇分析报告《麒麟操作系统内核同其他操作系统内核的相似性分析报告》,分析报告指出麒麟操作系统内核与FreeBSD在源代码上的相似度高达60%以上,在函数名上有99.45%的相似程度,而麒麟自己创新程度可能仅为10%左右。面对如此另人惊诧的数据,麒麟官方已经被迫承认了麒麟操作系统的内核外层即服务层使用了FreeBSD5.0

  另外也有很多网友发现,使用FreeBSD的内核居然可以成功地启动麒麟操作系统,并成功启动其图形界面。因此怀疑麒麟和FreeBSD内核架构可能完全相同。

  当然,FreeBSD是一个著名的号称“坚如磐石”的操作系统,有十几年的开发历史,不少大型网站服务器都使用FreeBSD操作系统。而FreeBSD是完全免费开源(开放源代码),FreeBSD是允许他人修改并使用其源代码,但是在修改和使用其源代码的时候需要遵守FreeBSD的版权条款:“1、如果以源代码形式发布,必须在所有的原代码中标明:FreeBSD的版权声明、这两个版权条件和FreeBSD的免责声明。2、如果以二进制代码发布,必须在随二进制代码发行的文当中明确注明:FreeBSD的版权声明、这两个条件和FreeBSD的免责声明。否则,就是侵犯FreeBSD的版权”。

  显然,麒麟系统的开发人员在修改FreeBSD的代码为麒麟操作系统后,并没有遵守FreeBSD的版权协议,更为恶劣的是,他们反而声称这套系统是自己独立研发成功的、具有完全自主知识产权的,以此来骗取国家巨额科研经费。当然,麒麟如果真的遵守了FreeBSD的版权规定,恐怕根本就无法通过863项目验收了。

  作为非独立研发而且没有自主知识产权的麒麟操作系统,到底值不值这7000万人民币呢,这是麒麟官方无法回避的话题,这与麒麟团队所做的创新有直接关系,业界对此的质疑声音越来越大,而麒麟官方却没有一个明确的说法。

  当然,如果国家相关部门介入调查的话,只需要一些业界的资深程序员对比一下麒麟操作系统和FreeBSD的源代码,那么立刻就会真相大白。而且仅凭常识来判断,2年时间就独立开发出一个Linux内核稳定的操作系统,那几乎是不可能的事情。

  这种把别人的开源产品拿来作为自己的创新,简单的修改一下就骗取国家7000万科研经费,实在是中国软件业的一大耻辱。如果人人都以开源产品拿来作为自己的创新,那这个社会的诚信何在,良心何在。

  麒麟造假的曝光开始让我想起了另外一件事情,今年年初的时候,我发现FreeBSD的官方网站以及全球最大的开源网站SourceForge曾经一度被封,并且对于FreeBSD使用的是关键字过滤的极端方式封锁,当业界对此大量报道时,FreeBSD和SourceForge才在二月底被解封,四月底,有人在网上发布了“麒麟操作系统内核同其他操作系统内核的相似性分析报告”,五月,业界开始大量报道麒麟涉嫌造假的事件。联系这一系列事件,我不得不对年初的FreeBSD被封事件产生了一个可怕的怀疑:是不是因为国防科技大学为了防止自己造假的丑事泄漏,于是对网监部门人员行贿,才导致FreeBSD和SourceForge的无辜被封,当然,这个怀疑实在太恶毒,如果我们的大学已经堕落到这个地步,那么中国高等教育的未来就完全没有什么希望了。

  目前学术造假,主要出在大学,原因有很多,主要原因我想是因为中国的教育产业化的恶果,盲目追求数量,轻视质量,资源分配不合理。而通过独立自主研究和开发创新活动,风险很高,在这样大的压力下,就只有依靠抄袭和剽窃等学术造假来骗取国家的资金。这样下去,将是一个可怕的恶性循环,中国的大学真正踏踏实实搞科研的人会越来越少,甚至被边缘化,而那些依靠做假的小人却可以风光无限,长此以往,我们的大学还有救吗?

2006年5月20日星期六

使用Telnet删除远程主机的邮件

  今天我在美国的一台虚拟主机出了故障,花了半天才解决。可能是DNS设置的问题,我的某个主机的邮件默认都开通了,今天发现主机上的500M空间竟然全部都被使用完,我感觉很奇怪,我最多应该只使用了200M,怎么会没空间了呢。

  我发邮件给技术支持,对方说是我信箱里占用了大量空间,我使用Outlook接收,果然发现有数千封邮件,一个江苏的IP不断发病毒邮件给我的,导致邮箱被占用了数百M。

  然而在删除垃圾邮件的时候出了问题,不知道什么原因,我收邮件的时候总是提示“您的服务器意外中止了连接”,然后网络中断,一封邮件也收不下来,查了一些资料,我发现了一个删除远端垃圾邮件的方法。

  先Telnet到我的另外一个美国的主机,然后在那个主机上使用telnet myMailServer.com 110的命令连接我的邮件服务器的POP端口。然后输入user myUserName录入用户名,再输入pass *****录入密码,使用list命令可以查看到邮件列表,使用top命令可以看邮件内容,然后我使用程序自动生成了dele 1;dele 2;dele 3....等删除邮件的命令,然后粘贴执行,很快就将远端服务器上的邮件全部删除完成了。

  以上的方法主要用于无法直接连接邮件服务器,而必须要删除远程邮件的情况。如果可以直接连接则不必使用这么麻烦的方法。

  以下对几个常用的POP3命令作一个简单的介绍 :

  命令       参数       状态       描述
  ------------------------------------------
  USER       username   认可       此命令与下面的pass命令若成功,将导致状态转换
  PASS       password   认可
  APOP       Name,Digest 认可       Digest是MD5消息摘要
  ------------------------------------------
  STAT       None       处理       请求服务器发回关于邮箱的统计,如邮件总数和总字节数
  UIDL       [Msg#]     处理       返回邮件的唯一标识符,POP3会话的每个标识符都是唯一的
  LIST       [Msg#]     处理       返回邮件数量和每个邮件的大小
  RETR       [Msg#]     处理       返回由参数标识的邮件的全部文本
  DELE       [Msg#]     处理       服务器将由参数标识的邮件标记为删除,由quit命令执行
  RSET       None       处理       服务器将重置所有标记为删除的邮件,用于撤消DELE命令
  TOP        [Msg#]     处理       服务器将返回由参数标识的邮件前n行内容,n必须是正整数
  NOOP       None       处理       服务器返回一个肯定的响应,不做任何操作。
  ------------------------------------------
  QUIT       None       更新 退出

如何对待恶意评论

  Blog的评论系统本身其实是一个很好的信息反馈系统,但是如果被滥用的话,却可以产生很多不良的后果。

  每个有点名气的Blogger几乎都会遇到恶意评论甚至是人身攻击,但如何对待处理,就有很多不同的观点。

  比较著名的案例是新浪博客的韩白之争。白烨是五十年代人,而韩寒是八十年代出生,争论起因是白烨在其新浪博客上发表了《“80后”的现状与未来》,在该文中,白烨对“80后”作家的创作提出了一些批评意见,而白烨没想到的是,“80后”的代表人物韩寒马上作出了回应——同样也是在新浪名人博客上,韩寒以一篇《文坛是个屁》对白烨进行攻击。白烨很快也在博客上作出了回应,认为韩寒用脏话骂人,已不是文学批评,涉嫌到人格侮辱和人身攻击。而韩寒亦在博客上发文称白烨“不知所云”。两者一来一往,白烨无法面对网络上对自己的“恶语”攻击,因此关闭了他在新浪网上的博客,从而成为新浪第一个关闭博客的名人。

  显然,这个五十年代的人对于目前的网络文化是陌生的,对于八十年代后的这种网络风格显得不知所措,因此只好采用回避的方式,退出网络,实际上是宣告自身的失败。

  网络上的恶意评论和人身攻击是一个很普遍的现象,人身攻击的绝大多数只有一个驱动力,那就是嫉妒。嫉妒的根源是无能和狭隘,是一种自闭式心态,攻击者大多没有太多知识和思想,却能做到见谁咬谁,逮谁骂谁,有理要骂,没理也要骂,当然,前提是你必须要骂名人。

  尽管热衷人身攻击的人总是冠冕堂皇地打着评论的幌子,但是任何人都可以一眼看穿人身攻击者意图不在评论而在攻击,它们故意从文章出发(少数赤裸裸地离开文章一开始就指向人身),终点确是文章的作者。它们的手法多半是似真似假,故意混淆视听;断章取义,恶意歪曲文章意思,误导未曾仔细阅读的读者,企图制造共鸣。更有甚者,明目张胆地肆意谩骂。

  很多人会对这种状况不知所措,有的采取回避的鸵鸟政策,有的则和攻击者对骂,但是,如果这样的事情不是再网络上发生,而是在现实中发生,难道对此的选择还会产生类似的疑问吗?

  现实生活中的场景:如果有一天,忽然有个陌生人闯入你的家里,对你大声谩骂和侮辱,那么你会怎么做?假装没听见?和这个不速之客对骂?不!正确的做法是将他踢出去。

  网络世界既然是社会生活的一部分,就应遵循现实社会中的一些道德规则。比如香港翡翠台就经常播放一个公益广告,讲的是讨论的时候应该就事论事,要对事不对人,并试图以别人的观点来看问题,这样才能获得他人配合,共同将事情做好。那么在网络上,为什么有些人就不能就事论事地讨论问题呢?

  有一种理论叫做“破窗效应”。说的是:如果有人打坏了一个建筑物的窗户玻璃,而这扇窗户又得不到及时的维修,别人就可能受到某些暗示性的纵容去打烂更多的窗户玻璃,久而久之,在这种公众麻木不仁的氛围中,更加恶劣的犯罪行为就会大量滋生和繁荣,最后变得完全不可收拾。

  对于恶意评论留言如果不好好处理的话,就会形成“破窗效应”,将一个原本良好的讨论环境恶化为充斥者攻击的环境,给大量其他访客造成困扰和反感。因此,我认为对于人身攻击的恶意评论应该在第一时间内将其删除

2006年5月18日星期四

科技门户网站要厚道

  今天,访问新浪科技的首页,我看到了一幅让我惊诧的画面。我发现我前几天写的一篇文章《百度和Google谁更能搜索色情信息》出现在其首页,但令我不安的是,该文章的署名却不是我。

新浪科技侵权

  做人要厚道一些,新浪网算是国内数一数二的媒体网站,更要做出自己的榜样。新浪科技在首页转载我前几天写的关于百度和Google的文章我并不反对,但是将文章作者署名更改为其他人的名字,这就太不厚道了吧,以新浪网这样的媒体巨头,竟然能做出这种事情来,实在是另我等小辈瞠目结舌啊。

  当然,我还是很喜欢上新浪网看桃色新闻的,只是我希望,以后新浪网不要再做这种令我们这些友邦人士“惊诧莫名”的事情了。

Google Talk最新动向及发展

  Gtalk即Google Talk最近有两大针对简体中文的功能增强。

  其一是中文Gmail里目前已经支持Gtalk了,在邮件里聊天,不用安装任何客户端软件,想聊就聊,真是不错的功能。虽然在英文版的Gmail里早就有了,但是中文Gmail最近才加上这个功能。

  其二是Gtalk支持简体中文了。虽然英文界面对高级用户来说也可以用,但大众用户肯定希望使用本地中文语言的版本,Gtalk支持中文也意味着Gtalk面向普及大众的强力推广,也是Google全面启动中国区本地化的一个体现。

  Gtalk做为一个聊天工具,个人感觉其非常小巧,只有1M大小,该有的聊天功能都有,也不装什么其他花里胡梢的功能,聊天记录可以保存在Gmail信箱里,还支持语音聊天,真符合Google的一惯作风:简洁明了,体贴用户。这和国内的腾讯QQ成为鲜明的对比。

  腾讯QQ估计日子也不很好过,高端用户正在被MSN和Gtalk抢走,剩下的大部分是低端用户了,腾讯QQ容量也越来越大,最新的QQ2006容量高达18M,速度却越来越慢,一启动就占几十M的内存,很多功能都是我们平时用不到的,也没办法删除,真希望腾讯能出一个简化版的QQ啊(QQ Lite)。

  最近一直也有传闻说Google欲收购某个中国公司,我倒是希望Google能把腾讯收购走,目前腾讯在香港主板上市,市场价值大约272亿港元,Google完全有能力收购,收购完成后,把腾讯QQ整合进Gtalk,那样Gtalk即可轻而易举的成为中国最大的即时通信软件,再通过这个来影响低端用户使用Google搜索引擎,那么我想类似百度这样的流氓公司就根本毫无招架之力了,Google可以轻而易举地成为中国搜索引擎的霸主,不过以Google不做恶的风格来看,似乎又不太可能。

  另外,据说Google正在开发一个中文输入法,我觉得不如直接把紫光拼音收购,然后重写一下代码。紫光拼音输入法很好用,可惜就是不稳定,经常引起系统故障,另外一个拼音加加乱修改IE主页地址,有流氓软件的倾向,因此Google最好能收购紫光拼音。有了好的中文拼音输入法,那就有了大众基础,这样进入中国市场也就容易多了。

  简体中文版Gtalk的地址如下:

  http://www.google.com/talk/intl/zh-CN/

  参考文章:腾讯QQ,越来越膨胀

  腾讯QQ,在这个小小的企鹅里头,总有道不明,数不清的故事。回想起8年前,纤细的QQ多么让人怀念,而且登陆也非常地快。

  随着它的功能越来越多,体积也在不断地极速膨胀,无用的功能也越来越多。现在它的安装包体积已达18MB,安装后体积达到惊人的64MB,天啊,这简直是一艘即时聊天界的航空母舰。不过细心用起来你就会发现,现在跟几年前进行聊天基本没有什么区别,只是多了一些诸如QQ秀、会员、移动聊天等鸡肋功能,而上段时间新推出的3D秀则更是一个超级无用的功能,除了能给CPU增加负担之后毫无建树。

  对于这样一个安装后文件高达2400个文件的臃肿的聊天软件,它已经背离了最初让我们喜爱的开发道路,虽然将原本捆绑的TM独立出来,但软件里还捆绑了 QQ聊天室,QQ游戏、QQ宠物、QQ音乐、QQ直播等与聊天无关的东西。让我们登陆QQ后的系统资源占用直线飙升,有时居然是MSN和POPO的三四倍。这种似乎无止境地功能添加实际能带给我们什么体验呢?我想只有厌恶和疲倦,现在我们对于它的新功能已经麻木了:“无非又是多了一些无用的功能霸占空间”罢了。(作者不详)

2006年5月17日星期三

四十年前的今天和四部电影

  四十年前的今天,中国历史上发生了一件改变中国历史进程的重大事件。

  1966年5月16日,政治局扩大会议召开,通过了《中国共产党中央委员会通知》(即《五一六通知》)。《五一六通知》的发布标志着文化大革命的正式开始。

  虽然这场运动是中国建国后最大的一次运动,但我对其却几乎一无所知(托我们的历史教科书之福)。在维基百科的相关条目上上,倒是可以找到很详细的事件经过和历程。

  我对这个事件的感性了解,也是从为数不多的电影中获得的,我最喜欢看的四部电影:《霸王别姬》《末代皇帝》《活着》《阳光灿烂的日子》都对那个特殊的历史时代有着或多或少的描写。

  《霸王别姬》中,段小楼在红卫兵的威胁下出卖程蝶衣和背叛菊仙那一幕,我可以体味到那种心灵的伤疼、流血和绝望。《末代皇帝》的结尾,我见识了传说中的“忠字舞”,我感觉不到群魔乱舞的荒谬可笑,我感觉到了疼,感觉到了戕害人性、暴殄天物的残酷。《活着》的主人公的亲人一个接一个地死去,最后凤霞也因为红卫兵医生的不学无术而导致产后大出血而丧命。活着是生命的唯一要求,这就是那个时代的真理。《阳光灿烂的日子》描写的是文革后期,红卫兵都被赶出城市,上山下乡了,剩下的一些小孩子们过着“阳光灿烂”的生活。

  在中国漫长动荡历史和各种各样政治事件中,能够活着并坚强地面对,是多么艰难而痛苦的事情啊。能够活下去,对于中国人来说,就是一种胜利。

霸王别姬

阳光灿烂的日子

末代皇帝

活着

2006年5月16日星期二

百度和Google谁更能搜索色情信息

  本文主要针对百度和Google搜索引擎的关键字过滤功能进行比较和分析。

  最近部分国内媒体刊登了一系列文章,包括“Google可搜大量色情链接 过滤可能损失流量”,“Google搜索不良条目量攀升 社会责任遭考验”,以大量篇幅论证Google包含色情违法信息,甚至有一种倾向,即将色情、违法信息泛滥的罪责推向了Google,似乎封杀了Google或搞定了Google关键词过滤,网络世界从此就会如同真空一样纯净。

  虽然Google推出了专门针对中国国情的“谷歌”(Google.cn),并使用了颇受争议的信息过滤技术,然而即使如此依旧无法摆脱被恶意攻击和诽谤的命运。

  该文章攻击道:“最常用的信息过滤、屏蔽技术被称为‘关键字过滤’,这项技术为广大搜索引擎企业所掌握”。并声称“这项‘信息过滤’技术不算是特别复杂的技术”。

百度谷歌

  据我所知,Google.cn(以后简称Google)和百度目前都对色情违法信息进行了过滤技术,不同的是,百度还增加了一项关键词屏蔽技术,就是对于一批敏感关键词,当服务器接收到用户提交的搜索词后,先将搜索词和上述“过滤词汇表”进行匹配对比;一旦匹配成功,服务器即返回“您输入的关键词可能涉及不符合相关法律法规的内容”,然后结束搜索。比如在百度搜索“色情”等词语后显示的效果。

  然而,从技术上讲,这种“过滤词汇表”实际上有很大缺陷和漏洞,对于稍懂一点电脑知识的人来说形同虚设,例如在百度搜索“色情”的确不让搜索,但是搜索“"色情"”(带引号的色情)即可返回18,300,000万条搜索记录,远远多于Google搜索出的记录(另外提一下,我用Google搜索“色情”返回的结果是“该页无法显示”,不知道这个记者用什么线路上网的,莫非是百度提供的专线?)。推而广之,所有百度通过“过滤词汇表”屏蔽的词汇,大部分只要加上个引号就全都可以搜索,另外,将多个屏蔽关键字组合在一起也可以搜索出结果,更可笑的是,在百度不可以搜索“色情”,但却可以搜索出“色情图片”70万条记录,“色情电影”51万条记录,“色情小说”23万条记录,“色情网站”79万条记录,可见这种屏蔽的方法实在是用来忽悠媒体的,实际作用非常有限。

  其次,对于使用具体过滤技术来看,Google和百度都通过内容的相关性过滤掉色情违法网站,Google过滤是会在页面底部显示“据当地法律法规和政策,部分搜索结果未予显示”。两者的过滤效果来看,搜索几个关键字即可感觉出来。

  百度搜索“色情图片”,第一页的大多数是论坛上的文章,并有4、5条包含色情信息,而在Google搜索“色情图片”,则第一页没有一篇是色情信息。搜索其他的信息进行对比也可以发现Google的确在信息过滤上做了不少工作,而百度则过滤的信息远不如Google,更进一步,用百度和Google搜索英文,我们发现百度对于英文网站的过滤效果更差,用百度搜索“hardcore”,结果出现了170万条数据,可以打开查看到非常多的色情网站,而在Google中搜索“hardcore ”只能搜索到288条结果,这个夸张的对比可以看出两者在过滤功能上所做的工作实在差距太大,所以,如果百度在这方面对Google进行指责攻击,那实在是颠倒黑白,指鹿为马。

  当然,这也反映出一个问题,就是Google和百度不同,Google根本不了解中国的国情,中国的国情就是人治,说明白点就是某些人凭自己的主观意志决定一切,你其实什么都不用做,但你其实什么都做了, 以前有个对联是“说你行,你就行,不行也行;说不行,就不行,行也不行”, 横批是“不服不行”。要深刻理解这种国情,必须知道这里谁说了算,谁能决定你企业的命运呢?当然是有权的人,只有他们才是主人,要想成功就需要积极向他们靠拢,争取进入他们的利益集团,形成共同利益,这才是在中国立于不败之地的方法。在中国做成功的企业要完全放弃自己的道德、良心和价值观,百度是“只说不做”,而Google是“只做不说”,Google还天真的以为配合中国进行信息过滤就可以顺利进入中国市场,其实百度在过滤上做的工作可能还不如Google的十分之一,但是百度却能让别人以为百度比Google做的多十倍。

  当然,Google是个很值得敬佩的企业,在企业的价值观、道德观方面,Google坚持“你可以挣钱而不必做坏事”,在公司内部,每个人都努力成为“极具创新精神、值得信赖、行事正直,而且极大地改变了这个世界的人”。Google无论在管理领域还是在服务领域都顺应个人化、大众化、社会化的趋势,坚持“做正确的事情”。可能正是因为这一点,才使得目前Google在和百度的竞争中处于劣势。