2006年6月29日星期四

正确理解Traceback的含义

  Traceback是Blog的一个重要特性,然而由于TraceBack的歧义性导致不少人都没有真正明白TraceBack的用途。

  Traceback Ping在blog系统中广泛使用,简单说来,Trackback是网站与网站之间互相通告的一种方法。例如,当你读了一篇日志,想对此写下自己的感想,您可以把新的日志内容写到自己的博客上。然后向原来的那篇日志发送一个引用通告。通过这种办法,在原始文章的下面就留下了你自己博客中的日志的链接,这样对于同一个话题的讨论,可以不局限在一个博客中了。

  Traceback在中国大部分被翻译做“引用通告”,因此带来一个很大的误解,不少人将TrackBack理解为引用地址,我经常收到一些莫名其妙的Traceback,点过去一看,原来只是转载我的文章而已,这显然是错误地理解和使用了TrackBack,将其误以为是“引用”的含义了,事实上TrackBack不是这么使用的。

  举个例子来说明一下。比如你在我的月光博客中看了一篇感兴趣的文章,对这篇文章你自己有一些看法,但是如果你写的文字较多的话,通常会超过评论字数的限制,这时候你可以在自己的Blog中写下看法,这样带来的好处是字数不受限制,而且还利于以后维护,但是你怎么告诉我你写了这个评论呢?如果没有Traceback的话,你只能将你的链接URL地址回复在评论上,但有了Trackback Ping,就不再需要这样做了,你只要通过Trackback将你的文章信息Ping过来,我的Blog系统会自动接收来自其他Blog网站Trackback Ping,并将其发布到文章中,这才是Trackback的正确用法,可惜国内大多数Blogger还没有形成正确使用Trackback的习惯。

  Trackback在中国这个特殊环境也会产生一些问题,就是Trackback Spam(垃圾引用),实际上和垃圾留言一样的性质,但是由于Trackback的特点,又难以按照垃圾留言的方法进行处理。

  Trackback的协议本身很简单,没有验证的功能。只要你发送一个合法的Ping过来,程序是必须接收的。只要找到执行这个功能的程序文件并且找到每一篇文章引用地址的规律就可以大量发送Trackback Spam(垃圾引用)了。目前Z-Blog的Trackback非常有规律,很容易被Spam,我能做的只有使用nofollow标签来处理,无法解决根本问题。

  当然解决问题也不难,就是我们在生成Trackback地址的时候,增加一个加密的校验码,比如对于文章ID的一个特殊的MD5摘要,将这个无规律的字符串放在Trackback地址中,这样如果别人发过来的Ping中该校验错误,就可以认为是Spam,否则则认为是正确的Ping。这大概也是MSN Space的Url看起来特别奇怪的原因之一了,以后我要是有时间的话,我会写一些具体的Z-Blog的实现代码来完成这个功能。

2006年6月28日星期三

Z-Blog反垃圾留言过滤插件

  Z-Blog自带的反垃圾评论只有校验码,但是这个校验码代码有一些问题,经常导致发表评论失败,使得用户体验下降,因此我将Z-Blog的校验码停用,自己开发了一套广告过滤插件用来阻止垃圾广告,目前是1.0版本,适用于Z-Blog 1.5原版。

  功能如下:

  对于评论中包含的禁止发表广告关键字过滤(分隔符|)。

  对于评论中敏感关键字进行过滤(分隔符|),将敏感文字替换为×。

  对于用户名进行关键字屏蔽(分隔符|)。

  提交来源(referer)检查,禁用从外部地址提交评论。

  评论者的IP黑名单列表屏蔽,禁止黑名单IP提交评论(分隔符|,可以使用*来过滤一个网段)。

  设置评论文字中允许包含的超级连接的最大数目,使用0则禁止评论中包含链接。

  如果30分钟内引用连续超过一定数目,则该用户禁止继续引用。

  安装方法:

  antispam目录放在PLUGIN目录下,c_antispam.asp放在根目录下。

  修改cmd.asp,在开头增加一行 <!-- #include file="c_antispam.asp" -->

  在c_system_event.asp文件,找到Function PostComment(),增加一行chkComment,同时将objComment.Content=Request.Form("inpArticle")修改为objComment.Content=filterBadWord(Request.Form("inpArticle")),找到Function PostTrackBack()函数,增加一行chkTraceBack。

  使用方法:

  在管理界面下,点插件管理-反垃圾留言系统,即可进行功能设置。

  欢迎给我发邮件反应本程序的BUG,欢迎提出相关意见和建议,下载这个广告过滤插件,请点这里
 

2006年6月27日星期二

万网回应Google域名劫持事件

  上周五深夜,Google、MSN这2家在万网注册的.cn域名被人恶意劫持到万网的买麦网

  近日,万网副总裁周锚对外界表态:“这件事情从实施步骤,不难看出这是一场有组织、有预谋的行动,不像是个人行为,我们不排除是竞争对手的作为。万网已将此攻击事件上报至北京市公安局,并将配合执法机关追查到底。”

  周锚表示,黑客是利用万网的系统漏洞进行此次恶意攻击,目前漏洞已经修补。同时周锚也表示,在万网注册和服务的CN域名数占所有CN域名数的30%,万网不可能以流氓的手段去炒作自己。

  对于万网的这个解释,我个人感觉相当牵强。普通的黑客没有必要将如此重要的2个域名解析到万网的买麦网,因此可以锁定,要么是竞争对手所为,要么是万网自己干的。

  我查询了Google、MSN的DNS服务器,其地址都不是使用万网的主机,可惜当天忘记查询了,否则就可以找出一些线索,如果当时Google用的也是自己的DNS服务器,那么劫持者可能破解了万网的系统,修改Google的DNS服务器地址并解析到到买麦网。

  如果真的是黑客所为,说明万网的竞争对手比万网有更高的多的技术能力和系统安全水平,可见万网管理CN域名的能力相当有限,一旦遇到大规模突发入侵事件,万网的系统可能会完全被攻破。因为为了CN域名的整体安全性考虑,建议国家相关部门应重新审核一下万网的实际技术能力,以免将来吃大亏。

  如果是万网自己干的,就是因为想依靠Google和MSN的流量推销买麦网,万网深知“最危险的地方就是最安全的地方”,于是就自己在周五的晚上修改DNS服务器内容,选择周五晚上也是最佳的时间,因为第二天周六是假日,还可以利用“放假没有上班”为理由拖延处理时间,最后一直拖到周六下午才将DNS修改回去,别人追究起来,还可以将这些罪行推到“黑客”身上,真是一个不错的计划啊。

  如果真是这种情况的话,我们指望执法机关去调查,估计什么也查不出来什么结果,因为一切的证据都在万网的服务器上,如果这一些都是蓄意做的话,那么相信证据早已经销毁,最后的结果很有可能是不了了之。

Google在中国不行了吗?

  近日,根据易观国际研究报道,Google在2006年第一季度中国搜索引擎市场份额中,排在百度、雅虎中国的后面,仅列第三。百度的份额为43.9%,雅虎中国21.10%,Google(谷歌)为13.20%。中国搜索引擎市场第一季度的规模为3.03亿元,竞价排名业务的收入为1.75亿。

  易观的这份研究报告给出一个令人吃惊的结论,就是Google在中国的市场份额已经降到了13%,仅占第三位。当然,有人会对这份报告的权威性和准确性可能会有一些疑问,因为去年CNNIC的统计报告中Google还占有百分之30多的份额,名列第二,一个季度怎么会下降这么多呢?

  Google在中国的这种表现,对比在美国的情况有巨大的反差,据调研机构Hitwise公布的调查报告显示,5月份Google在美国搜索市场的份额已经达到59.6%,远远高于竞争对手雅虎的22%和MSN的12.1%。但为什么在中文搜索市场上就是这样的结果呢?

  如果说Google不适应中国的环境、不了解中国的国情,实际上,不少Google的Fans已经为Google支了不少招,比如介入中文输入法领域(百度早几年就把流氓软件插进了紫光拼音输入法了),将服务器搬到中国(Yahoo中文的服务器和快照服务器早就在中国了),收购国内例如新浪或腾讯这样的企业或者大流量的个人网站(百度收购过个人网站hao123),提供支持https的搜索服务等等,可以说不少的招数都是Google竞争对手早就使用过的,然而我们看到的结果是,Google的反应是缓慢和迟钝的,直到本月初,才磨磨蹭蹭地将中文搜索服务器放到中国,而快照还依旧放在美国,其间还有打算退出中国市场的传言。

  这一切的一切,给人的感觉似乎是Google不重视中国市场,没有用心去做中文搜索。当然,这也是可以理解的,从市场规模上来讲,中国市场的价值远远不及美国市场,甚至是日本市场,对于商业公司来讲,肯定会先吃最大的蛋糕。这时我想起了一则寓言:一头狮子在树丛里发现了一只兔子,于是紧随其后奋力追赶。可最后还是让兔子逃掉了,于是众兽嘲笑说:“你还是兽中之王呢?连一只兔子也追不上!”狮子的回答很自然:“我是为一顿晚餐在跑,而兔子是为自己的一条命在跑。”

  是的,在搜索引擎领域,Google就是一头狮子,有着别人无法具有的强大优势,然而正因为Google太强大太自信了,因此当Google遇到一只用生命在奔跑的兔子的时候,她奋力追赶却还是追不上。

  当然,我相信,如果Google真的用心去做中文市场,去当一只兔子,一只用命在奔跑的兔子,那么赶上百度应该是易如反掌的事情,问题的关键是Google愿不愿去做。

附录:CNNIC《2005年中国搜索引擎市场调查报告》

2005年8月29日下午,中国互联网络信息中心(CNNIC)对外发布了北京、上海、广州三地的《2005年中国搜索引擎市场调查报告》。报告显示,中国搜索市场目前是两强多极竞争格局,百度和Google市场份额大大高于其他公司,二者合计在北京和上海占有超过80%的市场份额,在广州合计占有率也接近达到75%。

在搜索内容上,百度用户搜索音乐(mp3)等娱乐内容的使用率相对较高,Google用户相对来说更经常搜索网页、企业产品、商情、交通旅游等内容。 学生在中国搜索引擎市场扮演着一个重要角色。在北京、广州和上海,学生用户占全部用户数的比例分别达到40%、37%和30%。百度最大的用户群是学生,学生用户占了百度各地用户数的40~50%。


 

一、 根据单位划分市场份额
 
搜索引擎的使用者根据单位区分只要有学校,企业,政府机关及其他人员。

他们在使用搜索引擎的情况分别在44.3%,33.1%,8.9%,其他人员占13.6%.

    具体搜索引擎在以上几类人群中所占的市场份额如下:
 

搜索引擎在企业的市场份额

Google

百度

其他

比例

44.7%

39.5%

15.8%

搜索引擎在学校的市场份额

Google 百度 其他

比例

25.7%

65.5%

8.8%

搜索引擎在机关的市场份额

Google 百度 其他

比例

45.7%

44.3%

9.9%

          

二、 根据年龄分段市场份额!
 
  搜索引擎的使用者的年龄段在本次调查中分为25岁下和25岁以上两个层次,

他们在使用搜索引擎人群中所占比例分别为51.7%和48.3%.

       搜索引擎在不同年龄人群中所占的市场份额如下:

25岁以下年龄段的市场份额

百度

Google

其他

比例

62.7%

23.7%

13.6%

25岁以上年龄段的市场份额

百度

Google

其他

比例

39.5%

42.7%

17.8%

          

三、高端用户搜索引擎使用
 
搜索引擎高端用户的定义是:年龄在25岁以上、大学本科学历以上、

个人月收入3000元以上,满足这三个条件的非学生用户。

调查显示,搜索引擎使高端用户占非学生用户的31.8%,占全部搜索引擎用户的19.2%。”

 

各搜索引擎在高端用户所占比例如下:

高端用户使用的搜索引擎

百度

Google

其它

比例

27.9%

58.7%

13.4%

 

四、根据学历情况分段市场份额
 
  搜索引擎使用者根据学历分为大专以下和大专以上两个层次。

他们在使用搜索引擎人群中所占比例分别为53.5%和46.4%。

 

       各搜索引擎在不同学历人员中所占市场份额如下:

搜索引擎在大专及以下学历段用户中市场份额

百度

Google

其它

比例

60%

20.8%

19.3%

搜索引擎在大专及以下学历段用户中市场份额

百度

Google

其它

比例

60%

20.8%

19.3%

若除掉学生,不同层次学历使用搜索引擎情况如下:

 

大专以下

大专

大本

大本以上

Google

17.7%

27.6%

49.4%

72.2%

百度

52.1%

52.6%

39.1%

20.4%

其它

30.2%

9.8%

21.5%

7.4%

 

根据收入情况分段市场份额
 
   由于学生大多是消费者,无固定收入来源,本组数据反映的是

不同收入非学生用户的搜索引擎使用状况。

 

   不同月收入的非学生用户中的市场份额.

不同收入非学生用户

1000元以下

1000元以上

1500元以上

2000元以上

2500元以上

3000元

以上

4000元以上

5000元以上

Google

20.8%

40.6%

43.0%

45.4%

47.3%

50.0%

51.2%

58.1%

百度

56.3%

42.4%

40.9%

39.1%

39.0%

34.8%

31.4%

25.7%

其他

22.9%

17.0%

16.1%

15.5%

13.7%

15.2%

17.4%

16.2%

各搜索引擎在学生用户中所占市场份额比较。

学生中的市场份额

初中

高中

大专

大学本科

硕士

博士

百度

58.5%

71.5%

73.3%

58.9%

40.0%

25.0%

Google

24.5%

17.9%

8.9%

27.7%

50.0%

75.0%

其他

17.0%

10.6%

12.8%

13.4%

10.0%

0.0%

(以上数据来自:《2005年中国搜索引擎市场调查报告》北京部分)

2006年6月25日星期日

我眼中的博客话语权

  博客相对于论坛或者网站来说,最具特色的是什么,我觉得是话语权。

  在论坛中,版主是上帝,但版主不一定有话语权,发言最多的往往是论坛用户,但大量的灌水和争吵往往导致个性的迷失,所有论坛用户似乎全都一样。张扬个性的最佳舞台,我看还是博客。

  博客是每个人自己的精神家园,在这个家里,最大的好处是自由,说话的自由。对于超女来说,想唱就唱是那些女孩子们的梦想,但对于男人来说就不太合适,男人需要的是话语权,想说就说,更甚至是想喷就喷、想骂就骂。在自己的博客里,自己就是上帝,自己拥有最大的话语权,而拥有这样的话语权又是多么地容易,一个普通的互联网用户,只要通过简单的用户注册,每天发表一些自己创作的文字,就可以成了一名博客,如此简单就可以拥有了话语权。

  当然,要掌握话语权是有一个过程的。比如在现实社会中,是书刊、报纸、电视等媒体高度发达的社会,我们普通人的话语权简直微不足道。掌握话语权的是那些媒体巨头,他们想让你看什么,你就得看什么,我们草民的声音显无足轻重。博客的出现改变了这一切,我们终于不需要向别人表示唯唯诺诺,跟在别人后面人云亦云,我们有了表达自己思想的权利,我们终于可以发出我们自己的声音了-我们就是全世界。

  中国早期的一批博客就是在互联网上具有话语权的知识精英,他们的影响力是伴随中国互联网和中国IT产业的发展而形成的。几年来,他们“指点江山,激扬文字”,很有些“我们不说,谁说;我们不干,谁干”的劲头。他们的话语权也不是白来的,他们必需要保持自己独立人格,拥有社会的良心,善于独立思考,具备批判能力并关注社会改造,他们要有强烈的责任心,以自己独到的眼光来判断人和事,他们的目的是做一个以思想为生活的追求真理的人。

  现在,随着博客的迅速普及和大众化,人人都可以成为博客,每个人就是一个世界,每个世界都可以发出自己的声音,表达自己的想法,我们终于可以欣喜地看到,通过每个人这一点点的努力,我们的社会最终将会成为一个全新的公民社会,我们的社会是大有希望的。

  我们再也不是那种没有思想的只知道拷贝粘贴的二道贩子,我们是有独立思想的个人,我们有自己的世界,我们要勇敢地去发出自己的声音,表达自己的态度,我们可以做到。

2006年6月24日星期六

Google.CN遭域名劫持

  今天是星期六,我去公司加班。

  早上时分,我要搜索一个东西,于是打开浏览器,发现Google.com又上不去,这时我打开了Google.cn,我简直不敢相信自己的眼睛:Google.cn居然成了买麦网。

Google变成买卖网

  我Ping了一下Google.cn的IP,发现其IP地址已经不是59.151.21.100,而变成了218.244.143.224,这个地址是万网公司的买卖网。

  为了验证不是我自己网络的问题,我特意上了IP地址查询网站验证了一下,的确,Google.cn的域名被劫持到万网了。

google的IP地址

  对于Google的域名劫持,这已经不是第一次了,2002年的时候Google的域名就曾经被劫持到百度等网站,这一次轮到Google.cn被域名劫持了,Google以百万美元的天价买下了Google.cn域名,曾创下了CN域名史上最高成交价,今天我们发现这个域名依旧不属于Google,这个域名被非法劫持了。

  当一个流氓拥有巨大权力的时候,对于我们这些普通百姓是一种什么样的灾难啊。万网的确是中国最大的域名注册商之一,万网也是CN中英文域名的最高管理机构CNNIC认证的金牌注册服务机构。然而,拥有这么多权力的万网现在做了些什么呢?它在向善良的中国网民展示自己拥有权力的骄横和滥用权力的快感。由此我们可以看到注册和经营CN域名是何等冒险和不明智的行为。

  非法的域名劫持在任何一个法制国家都是一种毋庸置疑的犯罪行为,正因为DNS根服务器的重要性,所以全球13台DNS根服务器全都放在一些法制健全的国家(例如美国、日本),为什么没有一台DNS根服务器放在中国呢?今天的现象就足以说明,将DNS根服务器放在中国可能会对全球互联网络造成何等可怕的威胁和灾难。

  当然,CN域名的DNS根服务器是放在中国的,这也是我宁可注册info域名也不愿注册cn域名的原因之一了。因为百万美元购买的Google.cn都不是真正属于Google的,何况其他的cn域名呢。

  这次DNS解析错误,我还是希望只是系统故障而非域名挟持,如果是系统故障的话,希望技术人员尽快解决,如果真的是域名挟持的话,我希望有关人士立刻停止这种愚蠢的行为。另外,目前正常访问Google.cn可以使用这个方法:将59.151.21.100  www.google.cn加在WINNTsystem32driversetchosts文件中,然后在IE中删除Internet临时文件即可。

  相关新闻:谷歌MSN中国域名今晨遭劫持 均指向买麦网

  新浪科技讯 6月24日消息,今晨某些时段Google中国(谷歌)域名www.google.cn,以及MSN中国域名www.msn.com.cn均发生指向错误。期间域名均指向买麦网(www.com.cn)。

  这两家国际公司在华开办的网站,均在万网注册的中国域名。且买麦网为万网旗下公司。

  TechWeb联合创始人顾晓斌指出:“有朋友猜是域名被劫持了,还有传来的消息是说MSN.com.cn刚把域名解析服务器转来国内,转移的过程中出了问题。MSN.com.cn的域名服务商是万网,而且碰巧是‘错误’错到万网旗下的买麦网,这让人不得不有很多猜测。”

  6月24日上午,买麦网总经理周锚对新浪科技表示,他也刚刚知道这个消息,但由于是周末,还没有技术人员去检查具体原因,但他表示万网是一个正轨的域名注册服务提供商,不会去做不恰当的事。google中国市场部的人士也表示,她对此事具体情况还不清楚,需要进一步了解。随后致电新浪科技表示,据google中国技术人员反应,今天凌晨google.cn域名还没有问题,对24日上午出现的情况还需要进一步核实。

  截至发稿时域名指向已恢复正常。(骏捷)

  参考资料:域名劫持(来源于维基百科)

  域名劫持就是在劫持的网络范围内拦截域名解析的请求,分析请求的域名,把审查范围以外的请求放行,否则直接返回假的IP地址或者什么也不做使得请求失去响应,其效果就是对特定的网址不能访问或访问的是假网址。

  域名解析(DNS)的基本原理是把网络地址(域名,以一个字符串的形式,比如 www.google.com)对应到真实的计算机能够识别的网络地址(IP地址,比如216.239.53.99 这样的形式),以便计算机能够进一步通信,传递网址和内容等。

  由于域名劫持往往只能在特定的被劫持的网络范围内进行,所以在此范围外的域名服务器(DNS)能够返回正常的IP地址,高级用户可以在网络设置把DNS指向这些正常的域名服务器以实现对网址的正常访问。所以域名劫持通常相伴的措施——封锁正常DNS的IP。

  如果知道该域名的真实IP地址,则可以直接用此IP代替域名后进行访问。比如访问http://www.google.com/ ,可以把访问改为http://216.239.53.99/ ,从而绕开域名劫持。

  域名劫持的缺点

  它不是很稳定,在某些网络速度快的地方,真实的IP地址返回得比窃持软件提供的假地址要快,因为监测和返回这么巨大的数据流量也是要花费一定时间的。

  在网上查询域名的正确IP非常容易。一个是利用海外的一些在线IP地址查询服务,可以查找到网站的真实IP地址。在Google上搜索"nslookup",会找到更多类似的服务。

  参考资料:全球互联网的13台DNS根服务器分布

  美国VeriSign公司 2台

  网络管理组织IANA(Internet Assigned Number Authority) 1台

  欧洲网络管理组织RIPE-NCC(Resource IP Europeens Network Coordination Centre) 1台

  美国PSINet公司 1台

  美国ISI(Information Sciences Institute) 1台

  美国ISC(Internet Software Consortium) 1台

  美国马里兰大学(University of Maryland) 1台

  美国太空总署(NASA) 1台

  美国国防部 1台

  美国陆军研究所 1台

  挪威NORDUnet 1台

  日本WIDE(Widely Integrated Distributed Environments)研究计划 1台

免费WordPress托管服务商

  稍早时间我曾经介绍过“免费中文博客服务评测”,主要介绍了国内外免费博客服务(BSP)。这次我主要介绍基于Wordpress系统的免费博客服务(free wordpress blog hosting)。为什么选择Wordpress系统呢?因为Wordpress是一款著名的开源软件,完全免费,功能非常强大,插件众多,使用简便,可定制性也较强,目前已经在国外成为主流Blog系统。下面是我将介绍一下国内外主要的Wordpress服务提供商。

  DoNews - http://blog.donews.com 演示地址 http://blog.donews.com/williamlong : Donews以PHP的WordPress建立的Blog服务,也是国内最早提供较为稳定的Wordpress服务的网站,管理界面也是唯一的中文显示,系统提供了几个常用的插件,支持导入却不支持导出,目前没看到有广告显示,速度较快,可惜目前没有二级域名。

  TechWeb - http://blog.techweb.com.cn 演示地址 http://williamlong.blog.techweb.com.cn : TechWeb和DoNews类似,也是以PHP的WordPress建立的Blog服务,有二级域名。

  Wordpress - http://wordpress.com 演示地址 http://williamlong.wordpress.com : Wordpress官方的提供的提供的托管服务。本来应该是首选的,可惜被封了,中国电信对于国外优秀的免费服务总是封的不亦乐乎。

  优博网 - http://yo2.cn 演示地址 http://williamlong.yo2.cn : 又一家国内提供的WordPress免费服务,完美支持中文,无广告,支持导入导出,有数十个插件和样式,支持收费的域名绑定。

  七十二松 - http://72pines.com 演示地址 http://williamlong.72pines.com : 也是一家国内WordPress免费服务,支持中文,页面没有广告,支持导入导出,支持收费的域名绑定。