2008年9月1日星期一

Google推出404页面工具

  据Google中文网站管理员博客报道Google在其网站管理员工具中新增了一个“增强型 404 页面” 工具,登录Google网站管理员后,点“工具”-“增强型 404 页面”即可获取相关代码。

  404 网页是用户尝试访问网站不存在的网页(由于用户点击了损坏的链接、网页已被删除或用户输入了错误的网址)时看到的页面。之所以称为 404 网页,是因为针对丢失网页的请求,网络服务器会返回 404 HTTP 状态代码,表明该网页未找到。

  通常用户最好创建一个自定义的 404 网页,以便获得这部分用户流量。一个好的自定义 404 网页可以帮助用户找到所需信息、提供其他实用内容及吸引用户进一步浏览您的网站。

  Google提供的404页面工具,可以在页面错误发生时给出一个智能搜索框和一个最相关的链接地址。这项工具提供的是基于Javascript的网页,当出现404错误时,Google将在网页上列出一个内容和一个与“失踪”网页的最相关的其它地址,并提供一个基于Google的站内搜索框。

  Google的这个工具的具体显示效果,大家可以随便访问一个月光博客的不存在的网页来查看(比如URL地址敲错一个字母),根据我对这这个工具的测试,发现这个404工具目前还不支持中文(尽管Google声称支持中文),生成的404页面提示语言全是英文的,希望Google能尽快修复这个问题。

Google推出404页面工具

2008年8月31日星期日

GoDaddy恢复访问正常

  据网友的留言报道,GoDaddy从昨天晚上(29日)开始在中国地区可以正常访问了,其首页终于在被封一周之后重见天日。

  此次GoDaddy无法访问显得莫名其妙,让人难以猜测其原因究竟是什么,我猜测原因是CNNIC想屏蔽国外域名注册,以防止抢注域名,但我自己也觉得这种猜测有些离奇,有网友在此文的英文翻译留言说,是因为GoDaddy提供了一些海外反华组织的主机服务,但通常而言,主机服务的IP和GoDaddy首页的IP是不相同的,怎么可能屏蔽到GoDaddy首页上去呢。

  目前,全球域名注册数量最多的机构,第一位就是GoDaddy,第二位是enom,enom的代理非常多,据说namecheap就是其代理,GoDaddy提供的.COM域名注册的价格可以低到每年6.95美元。 

GoDaddy恢复访问正常

2008年8月30日星期六

百度收录网站的特点分析

  两年前,我曾经写过一篇文章《Google和百度收录网站页面的比较》(发布于2006年4月17日《计算机世界》),分析当时情况下百度和Google搜索引擎对于网站的收录比较,两年过去了,这两个搜索引擎的算法都发生了巨大的变化,那时的比较收录规则已经完全不适用于当前了,现在,我就根据今天搜索引擎当前的发展情况,再次比较和分析一下百度和Google这两大搜索引擎在收录网站方面的异同。

  首页规则

  搜索引擎的索引更新速度是衡量搜索质量的一个重要的参数,对于大型网站(比如门户新闻网站)以及其他更新量大的网站,百度和Google的索引速度都很快,基本上都能做到当天更新。

  但是对于更新量小的网站,例如博客,两者就有较大区别,Google对于高权重并提交Sitemaps和Ping的网站,索引速度可以达到分钟级别,有时刚刚写完一篇文章,几分钟后,就能在Google中搜索到解决,但是对于百度来说,索引速度较慢,通常仅仅更新了博客网站的首页,搜索文章标题,排在前面的是博客首页或者目录页,而不是文章页。

  总的来说,百度对于网站首页的关注以及权重给的似乎特别高,而Google对于最终的文章内容页面的关注多于百度。

  半个月规则

  百度对于更新量较小的博客,收录页面有一个奇怪的时间规则限制:半个月规则,根据我对于月光博客文章收录速度的观察,通常情况下,半个月之内发布的文章,使用百度搜索文章标题,排在前面的基本上都是门户网站转载或聚合我的文章,我写的原始文章不见踪影。而使用Google搜索,我的原文基本上都是第一位。

  而大约半个月之后,我的文章的原始内容才在百度上出现,这时候搜索文章的标题,我的原文才会成为百度搜索结果的第一位。

  权重计算规则

  Google计算权重的方式主要参考页面的反向链接,如果别人转载我的文章并添加了原文链接,那么Google通常会给予原始文章较高的权值,而百度似乎对于自己的网站(百度知道、百度空间、百度百科等)给予较高的权值,并且对于更新频繁的大型门户网站更为青睐,而对于反向链接似乎没有给予太多的权重。

  新站规则

  一个新注册的网站,经过一些宣传之后,通常Google就会对其进行收录,但赋予的权值并不太高。

  百度对于新站不会立刻收录,并且相当长的时间内都不会收录,当新网站在搜索引擎有了一个不错的表现,并且有了较多的反向链接,会出现一个阀值,百度判断其网站内容不属于明显复制其他网站内容之后,会开始收录这个新站点内容,这时候网站才会出现来自百度的流量。

  总的来说,在网站收录速度上来看,Google现在比百度要快,不过由于百度的用户更多一些,所以网站搜索来源大多还是来自百度的多一些。不过对于技术博客来说,来源Google的访问量应该和百度旗鼓相当了。

2008年8月29日星期五

搜狗五笔输入法发布

  据搜狗五笔网站报道,搜狗拼音输入法推出了两年多来,目前已占有较大的国内拼音输入法市场。今天,搜狗又为广大的五笔字型爱好者推出了另一种常用的输入法软件:搜狗五笔输入法。

  五笔字型由王永民教授发明,自上世纪八十年代推出又经数载推广,一度成为计算机中文输入的主流软件。“五笔字型”发明曾获得美、英、中三国专利,搜狗五笔1.0采用的是86版五笔字型方案,因为这个使用的最广泛,也不存在版权的问题。

  搜狗五笔输入法是当前互联网新一代的五笔输入法,拥有网络同步、强大的习惯设置、最漂亮的外观,并且承诺永久免费。搜狗五笔输入法与传统输入法不同的是,不仅支持随身词库--超前的网络同步功能,并且兼容目前强大的搜狗拼音输入法的所有皮肤,值得一提的是,五笔+拼音、纯五笔、纯拼音多种模式的可选,使得输入适合更多人群。

  搜狗五笔输入法特点介绍:

  1. 多种输入模式向您提供便捷输入途径

  五笔拼音混合输入、纯五笔、纯拼音多种输入模式供用户选择,尤其在混输模式下,用户再也不用切换到拼音输入法下去输入一个暂时用五笔打不出的字词了,并且所有五笔字词均有编码提示,是增强五笔能力的有力助手;对于五笔高手来说,纯五笔的输入能能让你更得心应手,不影响您的输入习惯。

  2. 词库随身

  包括自造词在内的便捷的同步功能,对用户配置、自造词甚至皮肤,都能上传下载,有网络的地方,您就能用属于自己的五笔:搜狗五笔是真正的互联网五笔输入法

  3. 人性化设置:功能强大,兼容多种输入习惯

  即便是在某一输入模式下,也可以对多种输入习惯进行配置,如四码唯一上屏,四码截止输入,固定词频与否等等,对习惯有更高要求的你可以随心所欲的让输入法随你而变。

  4. 界面美观:兼容所有搜狗拼音可用的皮肤,资源丰富

  搜狗五笔输入法和拼音输入法一样,兼容拼音输入法所有精心设计的皮肤,输入窗口和状态栏全面支持不规则图片。输入法官网开通的皮肤下载频道,有上万款网友制作的皮肤供你选择!

  点击下载:搜狗五笔输入法

2008年8月28日星期四

美国运动员借助Google Earth获取北京奥运会金牌

  据Google LatLong博客报道,在北京奥运会的女子公路自行车比赛中获取金牌的美国选手克莉斯.阿姆斯特朗(Kristin Armstrong)在Google Earth/Maps团队博客(Google LatLong)上发表文章说,她的这枚金牌是在谷歌地球(Google Earth)软件的帮助下获得的。

  克莉斯.阿姆斯特朗在2007年12月就开始和教练吉姆米勒去北京进行实地训练,以采集了大量关于实际赛道的第一手数据,并体验西方媒体大量宣传的北京空气污染是否真实。

美国运动员借助Google Earth获取北京奥运会金牌  对于这十五公里赛道的赛道的研究,阿姆斯特朗采用了与传统教程中不同的做法,在阿姆斯特朗丈夫(IT技术爱好者)的鼓励下,阿姆斯特朗将一套GPS(全球定位系统)设备带在身上,以得到第一手的海拔资料。当他们回到爱达荷州博伊西的家中后,他们将GPS的数据导出为几种不同的格式,其中一种格式就是Google Earth(谷歌地球)软件的专用格式,当GPS数据导入Google Earth之中后,阿姆斯特朗就可以通过Google Earth软件来追踪实际赛道的整个过程,没有去过那里的家庭成员也可以通过优秀的卫星地图来对赛道线路提出宝贵的意见,事后证明这些数据对于夺取金牌起到了至关重要的作用。

  最终,克莉斯.阿姆斯特朗获得了梦寐以求的奥运会金牌,满怀喜悦的阿姆斯特朗已经成为了一个Google Fans(谷歌粉丝),她的奥运夺金经历再一次向我们证明了高度发达的科学技术对于提高金牌竞争力的重要性。

  中文翻译:月光博客

企业应用网站性能优化实例分析

  前段时间对某个企业应用网站进行了一次优化分析,解决这个网站经常死机和CPU高负载的种种问题,根据我接触的一些应用和服务器配置,我对这个案例总结了一些优化方案,用来解决网站的高负载和高并发等问题,这里我和大家分享一下这个案例,希望能和大家一起探讨一下这种解决方案的优劣。

  一、网站当前状况和性能现状

  系统硬件配置:CPU为两个Intel Xeon 2.4G,物理内存为2.5G.

  系统软件配置:操作系统为Windows Server 2003标准版,数据库为SQL Server 2000.

  服务器访问量:工作日:访问人数 10000,浏览量 30000 ,休息日:访问人数 4000,浏览量 10000,每用户访问页面为2.88页面,平均停留时间为3分钟。由于存在大型下载文件,服务器流量每天有80G到160G左右。

  WEB系统:采用Tomcat服务器,使用Struts和Hibernate.

  网站系统:网站有几套不同的系统,有新闻发布CMS系统、文件下载系统、反馈系统等等,使用基于Java的Struts和Hibernate的MVC架构,动态应用。

  服务器CPU目前通常为40%左右,很多情况能增加到80-90%.

  二、网站性能分析

  通常情况下CPU达到80%说明系统性能存在瓶颈,需要找出系统的瓶颈究竟在哪里。

  分析过程是,远程登录服务器,打开SQL Server 2000的事件探查器,记录和分析SQL语句,同时打开任务管理器,查看各个进程占用CPU的状况。

  经过查询,SQLServer占用较大的CPU,说明系统调用CPU查询较多,初步可以确认是数据库引起的系统瓶颈,由于使用Struts和Hibernate应用,调用数据库频繁,因此可以采用减少SQL查询的方式降低对SQLServer的调用,通常情况下有两种方法:Cache或静态化。

  另外,服务器的Web系统采用的架构存在一些问题,因为存在大型下载文件,占用的流量非常大,而Tomcat本身对于静态文件的处理性能并不好,也会对系统性能产生负面的影响。

  三、网站和服务器优化方案

  1、缓存

  将页面静态化是通常的优化方案,但是对于当前的Tomcat服务器下的Struts和Hibernate未必有效,因为Tomcat对于静态HTML文件本身支持并不理想,并且新闻内容更新较为频繁。因此,在现有架构的基础上,可以使用hibernate的ehcached的动态缓存的方式,在动态应用中减少数据库负载,提升访问速度。

  使用ehcache对访问频率高,对数据库消耗大的页面进行动态缓存(时间10分钟),在缓存的时间范围内这些页面直接重缓存中读取,无需访问数据库,提高这些页面的访问速度,减小数据库访问的压力。这样SQL Server数据库的负载会大为降低。

  2、静态化

  对于一般的网站来说,效率最高、消耗最小的就是纯静态化的html页面,所以我们尽可能使我们的网站上的页面采用静态页面来实现,这个最简单的方法其实也是最有效的方法。因此,从长远考虑,需要对当前网站的架构进行一番调整,以适应静态化页面的需求。

  首先,由于Tomcat对于静态页面支持不太好,也不支持URL 重写,因此需要安装Apache服务器。

  其次,由于Struts对于搜索引擎不友好,因此将其全部转换为静态HTML页面,即可降低对数据库的查询次数,也可提高对搜索引擎的友好度。因此需要使用HTML静态化的方式优化服务器端的WEB程序。

  具体实施方案是,将现有Tomcat配置为8080端口,安装Apache服务器,配置为80端口,在Apache中修改httpd.conf文件,使得Tomcat解析JSP文件,静态HTML文件、图片文件、大型下载文件使用性能更好的Apache支持。

  修改Apache的.haccess文件,将Struts应用重写为静态Html文件形式,修改相关代码,使得其能自动生成静态HTML文件。

  优化访问量最多的页面,首页index.jsp为目前访问量最多的页面,里面的动态代码删除,将这个页面转化为静态的html页面index.html.

  3、应用部署

  如果资金允许的话,可以将数据库SQL Server 2000升级为SQLServer 2005,并单独部署到另外一台独立服务器上,文件下载也单独部署一台服务器。

  由于Tomcat本身的局限性,一个Tomcat的资源无法无限利用服务器的所有资源,并且Tomcat需要响应的请求太多,势必影响到整体的性能,因此配置多服务器可以使得Web网站的负载大幅降低,从而提高整体的响应能力。

  不过这种部署的缺点是需要付出升级软件、购买服务器、托管带宽等成本开销,建议不到万不得已,可以不用付出额外的资金升级。

  以上就是我针对某企业应用网站进行分析和优化的具体步骤和方案,希望能起到抛砖引玉的作用,供大家参考。

2008年8月27日星期三

YouTube上传支持Gears

  据GOS报道,现在,用户可以无需安装专用软件即在YouTube上传大于100MB的视频,YouTube开始支持Gears来上传影片。最新版本的Gears有了一些新的功能,对于操作大型文件来说变得更容易了。

  使用Gears可以使得上传大型文件变得更加简单容易,用户可以断点续传大型视频,提高传输成功率,并且未来可能还会出现基于Gears的桌面上传工具。

  YouTube支持多个视频同时上传,如果你想要上传一些大于100MB的影片,那么这个功能就很有用,因为YouTube会限制每部影片最多只能有10分钟的长度,并且要小于1GB的容量,如果上传大型视频文件,通常情况下至少需要30分钟或者更多的时间,这些大视频文件才能出现在用户的视频页面上。

YouTube上传支持Gears