2006年8月7日星期一

Feed发布方式的思考

  Feed应该以什么样的形式发布,是一个有争议的问题。

  这些天看到国外Blogger之间的一些讨论,有人认为Feed应该发布在自己的域名上,而不是通过类似FeedBurner这样的服务,这样的好处是,当遇到紧急情况时,他们可以将Feed切换到另外一家服务商。

  这些观点来源于FeedBurner在八月一日发生的那次事故,一些人认为,越为集中发布的Feed就存在越大的风险,如果将Feed地址移动到自己的域名下,这风险就会减少。

  在这方面,FeedSky就正在开发一个有意思的功能-FeedDomain。我虽然对FeedSky印象不好,但是这个功能的确很又用,我可以使用自己的子域名(例如feed.williamlong.info)来访问自己的FeedSky。

  不过这也是有缺点的,就是这个域名是放在FeedSky的,而不是放在我自己的空间,我无法将其指向其他地址。

  我想出来的比较好的方案是,就是在自己的空间上开一个子域名,然后用程序将此域名跳转到FeedBurner,这样订阅此域名实际上就是订阅FeedBurner,而当FeedBurner无法访问的时候,可以修改代码将此域名切换到其他的地址,而对于最终用户来讲不需要做任何操作。具体效果可以参考一下我目前做的这个Feed:feed.williamlong.info ,该域名使用程序进行重定向来实现Feed的功能。

  服务器端代码也很简单,如下:

<?php
header("Location: http://feeds.feedburner.com/williamlong"); /* 重定向浏览器 */
/* 确保重定向后,后续代码不会被执行 */
exit;
?>

  这个方法的缺点是,跳转可能会不太稳定,并加大自己服务器的负载。因此我目前还不打算启用这套方法,等到FeedBurner被封掉的以后,再启用这套方法也不迟。

Z-Blog 1.6静态补丁及其他插件下载

  今天为Z-Blog 1.6制作了2个插件补丁。

  Z-Blog 1.6新版本增加了一些功能,其中的防止垃圾引用的功能和分类RSS输出功能很不错,然而可惜的是,这个版本的目录结构发生了比较大的变化,因此我以前发布的几个Z-Blog需要重新修改一下再发布,我初步看了一下,改动的工作量还真不小,看来我自己的系统升级到1.6还不太容易,只好慢慢来了,于是我干脆直接把Z-Blog 1.6新增加的功能加入到我目前的1.5版本中,目前我的Blog也支持分类RSS了。不过为了其他人比较方便地升级,我这里还是提供了1.6的几个Z-Blog插件,供大家参考。

  Z-Blog 1.6 静态化补丁插件点击下载

  此版本的静态化补丁支持自定义分类目录名,在“分类管理”里编辑目录属性的“别名”,修改为英文目录名。请再执行静态化补丁前一定要修改此项内容,否则将无法生成静态化目录。静态化补丁插件需要修改原版的三个文件:c_system_event.asp 、c_system_lib.asp 、c_system_base.asp。

  使用和安装这个补丁很简单,一般用户使用下面3个操作就可以安装好静态化补丁:

  1、下载原版Z-Blog 1.6 Build 60802

  2、下载月光静态化补丁1.6。将补丁里的三个ASP文件覆盖到原版的FUNCTION目录下,catbuild目录放到PLUGIN目录下。

  3、确认“分类管理”里的目录属性的“别名”已经设置为英文目录名。

  4、重新进行文件重建操作,然后进入“插件管理”,点击“静态分类目录文件生成”。

  此时Z-BLOG的目录文件就被静态化了。分类目录的静态页放在POST目录下,首页的静态页放在根下,名字为index.html。

  手工修改

  如果你的ZBLOG是自己修改过的版本,那么可以使用下面的操作手动进行静态化修改。其操作较为复杂,不建议使用。

  c_system_event.asp 文件的修改:

  785行修改为:

strArchives=strArchives & "<li><a href="""& ZC_BLOG_HOST & ZC_STATIC_DIRECTORY & "/" & Year(dtmYM(i)) & "_" & Right("00"&Month(dtmYM(i)),2) &  "." & ZC_STATIC_TYPE & """>" & Year(dtmYM(i)) & " " & ZVA_Month(Month(dtmYM(i))) & " (" & objRS(0) & ")" +"</a></li>"

  c_system_base.asp文件的修改:

  522-525行修改为:

s=ZC_STATIC_DIRECTORY & "/" &y&"_"&Right("00"&(m-1),2) & "." & ZC_STATIC_TYPE
t=ZC_STATIC_DIRECTORY & "/" &y&"_"&Right("00"&(m+1),2) & "." & ZC_STATIC_TYPE
If m=1 Then s=ZC_STATIC_DIRECTORY & "/" &(y-1)&"_12" & "." & ZC_STATIC_TYPE
If m=12 Then t=ZC_STATIC_DIRECTORY & "/" &(y+1)&"_01" & "." & ZC_STATIC_TYPE

  528行修改为:

strCalendar=strCalendar & "<p class=""y""><a href="""&ZC_BLOG_HOST &s&""">&lt;&lt;</a>  <a href="""& ZC_BLOG_HOST &ZC_STATIC_DIRECTORY & "/"&y&"_"&right("00"&m,2)& "." & ZC_STATIC_TYPE&""">"&y&"·"&m&"</a>  <a href="""&ZC_BLOG_HOST &t&""">&gt;&gt;</a></p>"

  c_system_lib.asp文件的修改:

  33行修改为:

Url = ZC_BLOG_HOST & ZC_STATIC_DIRECTORY & "/" & Alias & "." & ZC_STATIC_TYPE

  1579行修改为:

s=ZC_BLOG_HOST & "catalog.asp?"& t &"page=1"

  1598行修改为:

s=ZC_BLOG_HOST & "catalog.asp?"& t &"page="& i

  1609行修改为:

s=ZC_BLOG_HOST & "catalog.asp?"& t &"page="& intAllPage

  Z-Blog 1.6 全部评论RSS输出插件点击下载

  安装方法:将sydication.asp文件覆盖原来的文件即可。

  全部评论的RSS输出地址是:sydication.asp?cmt=0

2006年8月6日星期日

Google的九个令人烦恼的事实

  前言:这是一篇转载的翻译的文章,原文作者感觉相当偏激,文章的主要观点也缺少有力的证据,但由于此文流传较广,因此我将单独论述一下这篇文章的错误观点。

  关于cookie的安全性,任何网站都可以发布cookie,而不仅仅是Google,包括百度和Yahoo都在使用cookie,我们也完全可以在浏览器设置不接收cookie,即使接收了,也没有明显的证据证明cookie能威胁本地系统的安全。

  关于Google收集个人搜索信息问题,这些信息也许属于隐私,但是我们相信Google会对用户负责的,一个典型的关于搜索资料个人隐私的案例是,为打击网上儿童色情犯罪,美国司法部曾经要求各个搜索引擎提供部分搜索内容,微软和Yahoo都配合了司法部,只有Google对抗美国政府,为了保护用户的隐私,拒不提供搜索请求名单,从而被美国政府告上法庭。然而,法庭的宣判结果却是有利于Google的,Google的这次行为不仅仅赢了美国政府,还赢得了用户的尊敬。因此,如果Google的竞争对手根据这个来攻击Google的话,那实在太不恰当了。

  在美国窃听门事件发生以来,以及近来国内对网络监控的加强,让我不得不钦佩Google公司对它坚守的原则所作出的努力。Google有自己的法则,不会随意倾斜和妥协,这是大部分公司例如微软、Yahoo都无法做到的,至于国内那些纯粹源于商业利益而驱动发展的百度、3721等等比起Google来简直就是小丑一般,不值一提。

  是的,国内永远出不了Google这样的公司,百度和3721热衷于开发流氓软件来强奸用户的浏览器,热衷于将用户搜索信息改变为搜索竞价广告。在他们眼里从来没有“邪恶”这个概念,为了赚钱他们什么事情都做的出来。保护网民的利益?百度们强奸网民还嫌速度慢呢。

  以下是译文:

Google的九个令人烦恼的事实

  很明显,Google不断地在搜集每个人的信息,却拒绝告诉我们为什么这样干。这对我们来说早就不是什么新鲜事了。在Google不能控制搜索结果页是什么样子的时候,他们却能控制谁在什么时候看什么内容。

  Google are clearly gathering information about us but refuse to tell us why. It's nothing new to us, but while they cannot control normal SERPs, they do however control who is viewing what and when.

  我们在页面上运行Google广告是为了生存。但这就意味着我们不应该把下面的信息与你分享吗?如果你知道别的方法可以给我们网站支持,请和我联系。

  We run Google adverts in order to survive. Does this mean we shouldn't share the information below? If you know an alternative way to sustain costs please get in touch.

  如果你察看包含Google Adsense的网页,Google就会追踪你的隐私。但请注意,Google追踪你隐私的办法不止于此。

  Please note, Google does not track you by simply viewing pages containing their adverts.

  1、不死的cookie:

  1. Google's immortal cookie:

  在各家搜索引擎中,Google第一个使用到2038年才过期的cookie。那个时候网站还被禁止使用永久有效的cookie。现在,各家搜索引擎服务提供商都使用永久有效的cookie。因为没有人对这一点有异议,因此Google的行为为整个行业设定了标准。Google的cookie在你的硬盘上放置一个唯一的标识数。不管什么时候,只要你打开Google的网页,如果你的硬盘上没有Google的cookie,Google就会给你放一个。如果你有了,Google就会读取你的标识数并做记录。

  Google was the first search engine to use a cookie that expires in 2038. This was at a time when federal websites were prohibited from using persistent cookies altogether. Now it's years later, and immortal cookies are commonplace among search engines ; Google set the standard because no one bothered to challenge them. This cookie places a unique ID number on your hard disk. Anytime you land on a Google page, you get a Google cookie if you don't already have one. If you have one, they read and record your unique ID number.

  2、Google记录一切他们能记录的东西

  2. Google records everything they can:

  你每做一次搜索,Google就会记录cookie的标识数和递交搜索的IP地址,时间日期,搜索关键词和浏览器配置。Google越来越可能提供基于你IP地址优化的搜索结果,因为IP地址分配和物理位置是有关系的。

  For all searches they record the cookie ID, your Internet IP address, the time and date, your search terms, and your browser configuration. Increasingly, Google is customizing results based on your IP number. This is referred to in the industry as "IP delivery based on geolocation."

  3、Google永久保存他们记录的数据

  3. Google retains all data indefinitely:

  Google内部没有数据保留多久的规定。有证据表明Google能够很方便地接触到搜集和保存的全部用户信息。

  Google has no data retention policies. There is evidence that they are able to easily access all the user information they collect and save.

  4、Google不解释为什么他们需要这些数据

  4. Google won't say why they need this data:

  向Google发出隐私政策的查询总是得不到回应。当纽约时报询问Sergey Brin(Google创始人之一和总裁)Google有没有因为隐私政策信息而受到法庭传唤时,他不予置评(2002-11-28)。

  Inquiries to Google about their privacy policies are ignored. When the New York Times asked Sergey Brin about whether Google ever gets subpoenaed for this information, he had no comment.

  5、Google雇佣间谍

  5. Google hires spooks:

  Matt Cutts,一位重要的工程师,曾经为National Security Agency(1、2)工作。Google希望能够雇佣更多的人来对搜集到的数据进行调查,这样他们就能向华盛顿的间谍们组织叫卖值钱的信息。

  Matt Cutts, a key Google engineer, used to work for the . Google wants to hire more people with security clearances, so that they can peddle their corporate assets to the spooks in Washington.

  6、Google工具栏是间谍软件

  6. Google's toolbar is spyware:

  如果你允许使用高级选项,那么你看的每一个网页都会被工具栏记录并且传送到Google服务器。安装工具栏时候的隐私策略已经承认了这一点,不过那仅仅是因为可能的起诉。Alexa的工具栏干了同样的事情却没有在隐私策略中声明,从而输掉了一桩官司。更糟的是,Google工具栏不会在升级之前询问你的意见,它总是静悄悄的就完成了升级。这意味着,一旦你安装了Google工具栏,每一次你连接到Google网页(一天里有很多次吧),Google就对你的硬盘有完全的访问权限。大多数软件供应商,甚至微软都会询问你是否需要升级。Google不是这样。任何自动升级的软件意味着大量潜在的安全隐患。

  With the advanced features enabled, Google's free toolbar for Explorer phones home with every page you surf, and yes, it reads your cookie too. Their privacy policy confesses this, but that's only because Alexa lost a class-action lawsuit when their toolbar did the same thing, and their privacy policy failed to explain this. Worse yet, Google's toolbar updates to new versions quietly, and without asking. This means that if you have the toolbar installed, Google essentially has complete access to your hard disk every time you connect to Google (which is many times a day). Most software vendors, and even Microsoft, ask if you'd like an updated version. But not Google. Any software that updates automatically presents a massive security risk.

  (译者按:Google Desktop呢?)

  7、Google的网页快照是非法的

  7. Google's cache copy is illegal:

  依据第九巡回法庭将美国版权法应用于互联网的判例判断,Google的网页快照似乎不合法。唯一避免网站被Google保存快照的办法就是在每一个页面里面加上noarchive元标记。浏览者喜欢网页快照,但是网站管理员们不喜欢。很多网站站长已经删除了网站上有问题的内容,却发现这些内容依然存活于网页快照。网页快照应该是可以选择加入或不加入,而不是现在这样,只能选择退出或不退出。

  Judging from Ninth Circuit precedent on the application of U.S. copyright laws to the Internet, Google's cache copy appears to be illegal. The only way a webmaster can avoid having his site cached on Google is to put a "noarchive" meta in the header of every page on his site. Surfers like the cache, but webmasters don't. Many webmasters have deleted questionable material from their sites, only to discover later that the problem pages live merrily on in Google's cache. The cache copy should be "opt-in" for webmasters, not "opt-out."

  8、Google不是你的朋友

  8. Google is not your friend:

  到目前为止,绝大多数网站访问量的75%都来自于Google。如果网站站长要增加流量,他们得先问问Google同不同意。如果站长们想利用Google 半保密半公开的算法中的某些漏洞来得利,他们很快就会被Google惩罚,流量完全没有了。Google没有发布详细公开的惩治流程。对被处罚的网站来说,也找不到任何上诉的途径。Google的行为根本是无法预计的。大多时候Google甚至都不回复网站站长的信件。

  By now Google enjoys a 75 percent monopoly for all external referrals to most websites. Webmasters cannot avoid seeking Google's approval these days, assuming they want to increase traffic to their site. If they try to take advantage of some of the known weaknesses in Google's semi-secret algorithms, they may find themselves penalized by Google, and their traffic disappears. There are no detailed, published standards issued by Google, and there is no appeal process for penalized sites. Google is completely unaccountable. Most of the time Google doesn't even answer email from webmasters.

  9、Google是隐私定时炸弹

  9. Google is a privacy time bomb:

  Google每天承担2亿次的搜索,其中大多数来自美国以外。由此可见,Google已经积累了足可以引发一场隐私灾难的数据。华盛顿那些新上任的负责数据挖掘的官僚做梦都想的高效率早就被Google实现了。

  With 200 million searches per day, most from outside the U.S., Google amounts to a privacy disaster waiting to happen. Those newly-commissioned data-mining bureaucrats in Washington can only dream about the sort of slick efficiency that Google has already achieved.

  原文:Disturbing Facts About Google,译文来自cnBeta。

2006年8月5日星期六

FeedBurner开始获取抓虾的订阅数

  目前FeedBurner已经支持显示抓虾的订阅人数了。

  我是今天下午发现这个现象的,因为我发现我的FeedBurner订阅人数突然猛增到1603个,我就觉得有点不对劲,晚上登录上去之后,发现订阅中出现了抓虾的名字,FeedBurner已经开始统计抓虾的订阅人数量。

Feedburner订阅人数

  我估计今天不少人的FeedBurner订阅数都会增加的,从我的Blog订阅人数看,抓虾的使用人数远远高于Bloglines,而且几乎高了有近一倍的数字,这对于一个仅仅才开始运营了几个月的在线阅读器来说,简直是个奇迹。看来抓虾正在逐步树立起国内阅读器霸主的地位。

  当然,这可能主要因为抓虾的访问速度快的原因,我这里访问Bloglines的速度实在不敢恭维,而且抓虾还具有类似网摘、DIGG的功能,也是Bloglines说没有的。不过就阅读的显示格式来讲,我还是比较习惯于Bloglines那种清爽的阅读格式。

  FeedBurner看起来是越来越棒了,我当初选择了FeedBurner的确是个正确的选择,只是我希望FeedBurner这么好的服务千万不要被封了,否则我们就太失望了。

  更新:据KESO稍后的报道,其实提供订阅人数的做法很简单,只需要在抓取feedburner的RSS feed的时候,在user-agent中包含该feed的订阅数即可:

  ZhuaxiaBot (324 subscribers; zhuaxia) 或者 ZhuaxiaBot (Zhuaxia 2.01; 34 users)

2006年8月3日星期四

中国互联网-流氓从良记

  中国早期的互联网,基本上是流氓的天下。

  首先,做站长的基本上都是流氓,这里所说的站长,指那些为追求流量和排名的站长,他们为了增加自己的流量而不择手段,这方面的鼻祖,就是3721插件的创始人的周鸿祎。

  在中国,用户的电脑是可以随便“插”的,而3721插件在当年是“插”的最广的一个,几乎将全中国大江南北都插了个遍,结果名声臭了,3721也当之无愧地名列“十大流氓软件”之首。3721普及量大的一个原因是其与大量的个人网站进行合作,当老流氓和小流氓联手合作的时候,用户的电脑就要遭殃了。

  小流氓者,国内的个人网站的站长,他们大都有很强烈的“强奸”欲望,给点小钱就什么东西都敢往网站上放,例如HAO123这样的个人流氓网站的成功者,就是通过强制设定为主页,在没有多少选择的情况下获得了巨大的覆盖率,也因此成了名,被百度高价收购。淘宝在推广初期也是通过个人网站联盟强制弹出窗口、众多站长帮忙掠夺用户,花费了一点小钱就达到目前的规模,在纳斯达克上风起云涌的百度,百度搜霸不算特别出名,但也算在流氓行业小有名气,我也专门写过如何卸载百度流氓插件的方法

  对此,研究流氓颇长的布棉就曾经感叹:很多中国互联网企业的发展过程,就是一场赤裸裸的流氓对用户侵略的过程,而很多企业获得成功的历史,就是一个个流氓妓女从良的历史。

  当然,对付流氓的软件目前也有不少,比较有代表性的是“流氓软件清除大师”这个软件,能卸载一百多个流氓软件,然而令人疑惑的是,这个软件本身会强行修改IE首页,并且也有工具栏插件,似乎也有流氓化的趋势,恰恰在这个时候,自称已经从良的周鸿祎推出了360safe这个软件。

  360safe看上去是一个简单易用的流氓软件清除工具,据说可以查杀121款恶意软件,并能诊断系统,一键修复保证系统恢复如初,安装试用了一下,感觉比“流氓软件清除大师”要好用一些。比如我系统的Google工具栏,“流氓软件清除大师”会误判断为IE插件,而360safe则不会误判,同时360safe具有诊断修复功能,可以用来诊断一些未知的流氓软件和木马病毒,包括系统进程、注册表、系统服务等栏目的检测,如下图所示,使用起来很方便,可以及时发现系统配置被修改的情况。并且没有顺便给我电脑安装什么插件,看起来还是很不错的。

360界面

  虽然周鸿一原先的口碑并不太好,但是现在看来他似乎是要弃恶从良了,至少现在看来360safe还没有什么流氓行为,就暂时来看,似乎周鸿祎是真心诚意干起了反流氓软件的大业,如果真是这样的话,我们也应该对他表示谨慎地欢迎。
 

2006年8月2日星期三

微软推出Windows Live Spaces

  微软Windows Live Spaces今天已正式上线,中文版亦同步亮相。

  各位使用MSN Spaces的博客们在访问自己MSN Space的时候,会发现自己会被自动转向到一个同名的Live Spaces的地址,地址类似:http://williamlong.spaces.live.com

  进入Windows Live Spaces首页,顶部可以看到一个大幅广告,感觉和整体页面很不协调。当然,每月付出一些费用的MSN Premium用户可以选择关闭广告。

  迄今为止,MSN Spaces已经被证明相当流行。它服务与1.23亿用户,每秒大约由300万访问量。用户每天上传600万张照片,每九天就会耗费1TB的存储空间。MSN Messenger花了6年时间达到1600万用户,而MSN Spaces则在18个月里达到了1300万用户。

  Windows Live Spaces的地址是:http://spaces.live.com/

FeedBurner挂了

  这一天终于到来了。

  自从Technorati被封的那一天起,我就在猜测下一个会是谁,我预计很可能会是FeedBurner或Bloglines,终于,在Technorati被封的3个月后,2006年8月1日,FeedBurner被电信封了。

  对于我的博客来说,这次的影响是巨大的,原先月光博客的FeedBurner已经有超过1000的订户,Google Earth观察也有200多用户数,目前都要面临着无法阅读最新文章的结果。通过浏览器也无法访问FeedBurner网站,如下图所示。

FeedBurner无法访问

  为了证实不是FeedBurner本身服务的问题,我通过代理服务器访问我自己的Feed地址,发现访问正常,如下图所示,因此可以排除FeedBurner自己出问题的可能性,剩下的原因就只有一个-FeedBurner被封了。

FeedBurner可以用代理访问

  FeedBurner,这么一个世界最优秀的Feed发布工具,就这样被封杀了,没有人告诉我为什么,也没有人告诉我怎么做,我必需要面对这样的结果,我们该怎么办!

  我知道,我们没有办法,尽管我们对此非常困惑,即使我们有一万个理由证明我们很无辜,我们也没有任何办法。唯一的道路就是修改自己的Feed地址。

  有一点值得注意的是,这次封的手段很奇特,以往被封的网站是无法Ping通的,这次可以一直Ping通,只是无法连接上80端口。另外我通过代理登录FeedBurner上去之后,发现了一个更为严重而可怕的问题:封锁是双向的。FeedBurner已经无法连接和读取国内的地址了,我的地址始终提示Timeout,无法得到最新的更新,而我把RSS文件放到我国外的空间,FeedBurner才能读出来,也就是说,国内博客的Feed将永远无法在FeedBurner中更新了。

  这一切都会过去的,下一个受害者会是谁呢,我已经不再关心了,虽然我知道Bloglines的确很不错,但是我还是慢慢习惯使用抓虾,至于另一个热门的被封对象del.icio.us,我还是舍不得放弃她,我在上面已经有700多个网摘了,还是等她被封了以后再换吧。

  最后,让我们以Neo在电影Matrix(黑客帝国)中的结尾台词做为本文的结束语吧。

  “I know you're out there. I can feel you now. I know that you're afraid... you're afraid of us. You're afraid of change. I don't know the future. I didn't come here to tell you how this is going to end. I came here to tell you how it's going to begin. I'm going to hang up this phone, and then I'm going to show these people what you don't want them to see. I'm going to show them a world without you. A world without rules and controls, without borders or boundaries. A world where anything is possible. Where we go from there is a choice I leave to you. ”

  更新:8月1日23点的时候又可以访问FeedBurner了,这不是瞎折腾我们吗?刚把Feed改了现在又要改回来。不过还是先登录上去瞻仰了一下,发现FeedBurner访问数已经从顶峰时期的1007订户降到了850订户,唉....

FeedBurner的遗容