2009年9月4日星期五

搜搜尚未成功,腾讯仍须努力

  在几乎没有任何媒体宣传的情况下,腾讯旗下搜索引擎搜搜上线了自主搜索技术。众所周知搜搜之前的网页搜索结果是使用来自Google的技术,估计这个时候双方的合作协议也刚好到期,目前搜搜的帮助文档还没有作相应的更新。

  搜搜网页搜索相较之前增加了类似有道的预览功能,搜搜保留的是基本的文字内容和超链接,有道保留的是文字和基本的CSS样式。其他部分也有细微差别,不过这两个功能并不存在实质差别,都可以帮助用户快速获取目标网页的相关信息,提供除了快照以外的更多一种选择。

  腾讯当然是想要借助自有搜索技术的上线在搜索市场分一杯羹,不过是骡子是马拉出来遛遛,我们来看看腾讯新搜索的表现怎么样。

SOSO

  错词纠正

  由于中国文化博大精深,同音字太多导致我们可能有时候会遇到输入错误,当然这种情况也可能发生在英文的拼写错误,这个测试项目选用一个中文关键词与一个英文关键词进行测试。

  周于明:用户想要搜索的是F4里面的周渝民,中文的错词纠错根据拼音库进行判断,搜搜、百度、谷歌都给出了“周渝民”这样的正确提示,搜搜和百度都显示为错误输入的搜索结果,谷歌胜出的点是是它对所有可能拼写错误的搜索结果都会给出所提示的关键词的两个搜索结果,这让它的搜索结果具备更多的可用性。

  Michel Jackson:MJ的粉丝应该可以很容易看出这是一个拼写错误,正确的拼写应该是“Michael Jackson”。搜搜并没有给出正确的拼写提示,搜索结果显示为错误拼写的搜索结果;百度给出了正确的拼写提示,第一二项结果具有可读性(MJ粉丝网站和维基百科),其余为错误拼写的搜索结果;谷歌给出了正确的拼写提示,搜索结果为正确拼写的搜索结果。

  索引数量与索引速度

  这两个指标直接关系着搜索引擎能否为用户提供快速的搜索体验和优秀的搜索质量,这里将会使用两个随机选择的热门关键词进行测试。

  网瘾:搜搜、百度、谷歌的完成搜索时间分别为0.104秒、0.002秒、0.20秒,百度以巨大的优势领先,搜搜与谷歌紧跟其后,需要说明的是这样短的差距对于普通用户几乎是没有差别。接下来是索引网页数量的较量,搜搜搜索到了2,570,000项结果,百度搜索到了6,090,000项结果,谷歌这个数字为8,640,000,百度领先搜搜接近200%,而谷歌又领先百度超过40%.搜搜落败在意料之中,毕竟Sosospider的出道时间比另外两家实在是晚太多。

  郁可唯:中国头号选秀节目的热门选手,郁可唯自然适合用来作为测试关键词。搜搜、百度、谷歌的完成搜索时间分别为0.051秒、0.003秒、0.30秒,三方趋势与上一个关键词相同不再赘述;索引网页数量这一指标,搜搜为1,370,000项搜索结果,百度为1,020,000项搜索结果,谷歌为11,700,000项搜索结果,搜搜在这一轮反超百度,而谷歌大幅扩大了优势,大有打着望远镜都找不着对手的感觉。

  中文分词技术

  中文分词一直都是各大搜索引擎相互比拼的领域,中文分词技术的提升能够最有效提升用户的搜索体验,所谓中文分词简而言之就是让电脑知道用户想要什么,尽管用户的搜索是那么千奇百怪,仍然选用两个中文关键词进行测试。

  学生会组织义演活动:搜搜的分词为学生会组织义演活动,正确;百度的分词为学生会组织义演活动,错误将学生会组织这样一个动宾短语识别为一个名词;谷歌的讽刺结果为学生会组织义演活动,正确。

  胜利取决于勇气:搜搜的分词为胜利取决于勇气,正确;百度的分词为胜利于勇气,取决那个词直接被忽略,让人比较困惑;谷歌的分词为胜利取决于勇气,正确。

  百度在这一回合的落败让人意外,毕竟几年前百度曾经叫嚣着最懂中文,搜搜的分词与谷歌基本相同。

  搜索质量实测

  这一回合避开单项测试可能造成的误判,采用最直观的搜索结果来作一个较量,同样是两个关键词,一个是问答式的需要得到解答,另一个热门关键词,考验搜索结果内容质量。

  2010世博会在哪里开:搜搜在第三位提供了来自百度知道的搜索结果,前两位搜索结果并不能提供相关性了解;百度在第六位提供了来自百度知道的搜索结果,上方的搜索结果皆为世博官方网站或者对应的门户专题,这体现了百度越来越明显的倾向于门户站点;谷歌在第三位提供了来自搜搜问问的搜索结果,前两位为来自世博官方网站的搜索结果。如果要排序的话谷歌第一,搜搜第二,百度第三。

  周杰伦:周董的关注度绝对是毋庸置疑,用这个词来考察搜索引擎第一页内容的丰富程度。搜搜的第一页搜索结果包含两条歌迷网站、两条音乐搜索(百度MP3、搜搜音乐)、一条图片搜索(搜搜图片)、一条百科(百度百科)、四条网站专题(新浪、腾讯、TOM);百度的第一页搜索结果包含两条歌迷网站、一条音乐搜索(百度音乐)、一条图片搜索(百度图片)、一条百科(百度百科)、两条网站专题(新浪、腾讯)、一条相关新闻(百度新闻)、一条贴吧、一条视频(百度视频);谷歌的第一页搜索结果包含一条歌迷网站、两条音乐搜索(百度MP3、谷歌音乐)、一条百科(百度百科)、七条网站专题(新浪、腾讯、TOM、搜狐、网易、人民网)、一条相关新闻(谷歌资讯)、一条博客搜索,值得指出的是谷歌音乐、谷歌资讯、谷歌博客都是没有算进十条搜索结果的,也就是谷歌有十三条搜索结果。排序依次为谷歌第一、百度第二、搜搜第三。

  搜搜如果想要争得一席之地需要走得路还很长,搜索引擎很大程度上并不能从腾讯在IM的强势获利太多,搜搜需要面对的更多是技术提升和用户习惯的教育,百度的崛起是因为当时在中文搜索的技术优势与用户习惯而,谷歌市场份额回升是因为技术的改进和用户教育,而这两方面都是搜搜缺乏的。So,腾讯仍须努力。

  来源:读者xjp投稿,原文链接

2009年9月3日星期四

网站文章内链的一个思路

  内链:顾名思意就是在自己网站的内容中的相关文字加入链接,并且链接到网站内部的相关页面。合理的网站内空链接构造,能提高搜索引擎的收录与网站权重。相对外部链接,内部链接也很重要。

  传统方式

  以前我们做文章系统或新闻发布系统的时候,做文章内链(标签)的时候,通常是通过以下方式来实现的:

  数据库:article(文章表)字段(id, title, body, adddate, userid),keyword(内链表)字段(id, name, link)

  在发布文章的时候,循环内链表内的所有,来替换文章的body。

  这样确实是实现了想要的功能,但是如果我们的内链表的数据达到很大的数目,比如2W、5W或更多的时候。每发布和修改一片文章的效率是可想而知的。那么网易的新闻、百度的百科等这样打大型网站是如何实现的呢?如果按照以上的做法,那系统在几个月后就直接崩溃了。

  分析比较

  一篇正常的文章会有多少字(不计HTML代码)?1W?我想1W的文章已经算是很长的了,而且想在如果直接在一个页面显示1W的文章相信没有几个人有耐心能看完的。为了页面美观和用户体验,编辑通常都是将内容过多、篇幅超长内容的文章分段处理(分为几篇文章,或分章节)。如果我们能事先将可能出现内链的字从文章中提取出来,再从数据库里检索,这样效率是不是就可以得到很大的提高?答案是肯定的。我们就拿1W字的文章来说,假设文章的所有文字都需要内链,循环的次数是1W次。比上面的例子假设要强得多吧?

  在传统方式中,不管你要不要,把内链表的东西全查一边。而下面这种思路是事先将有可能出现内链的字词全部整理出来,再用这些词分别去检索内链表。这样一比较问题就出来了。

  新思路就是:从文章中取出需要内链的字词,然后去查询内链表。

  可行操作

  我们暂且把传统方式称为被动方式,把新思路的方法称为主动方式。

  主动方式的实现方法如下。

  利用中文分词技术,我们可以对一篇文章进行分词。然后根据分词后的词表,过滤掉常用的物主代词、副词、感叹词等。把名词、品牌、地名、商标等留下,或者根据自己的词库表来分词。然后把剩余的字词去检索内链表,如果有存在,我们就坐上链接,不存在就PASS。

  以上只是思路的一个初步构思,在实际实现过程中需要考虑的因素很多。我觉得重点就在分词这个环节。

  来源:读者沈力投稿

2009年9月2日星期三

CentOS操作系统安装教程

  CentOS操作系统是商业版Red Hat Enterprise Linux(RHEL)的免费版,是架构LAMP的理想操作系统,稳定性非常好,和Ubuntu不同的是,CentOS主要用于服务器而不是桌面环境,不少大型的商业网站都使用CentOS操作系统,我在《LAMP网站架构方案分析》中曾经讲述了一系列架构方案,这里以CentOS为例具体讲一下LAMP环境的安装和搭建。

  首先要下载CentOS操作系统的ISO,下载地址点这里,目前最新版为5.3,下载文件有两种形式,一种是光盘CD版,要六张盘,要下载的文件为CentOS-5.3-i386-bin-1of6.iso、CentOS-5.3-i386-bin-2of6.iso、CentOS-5.3-i386-bin-3of6.iso、CentOS-5.3-i386-bin-4of6.iso、CentOS-5.3-i386-bin-5of6.iso、CentOS-5.3-i386-bin-6of6.iso,一种是DVD版,要一张盘,下载文件为CentOS-5.3-i386-bin-DVD.iso,3.7G容量。

  下载完成后,使用Nero等光盘刻录软件将ISO镜像文件转换、刻录成安装CD或DVD光盘。

  然后将服务器硬盘格式化,插入CD或DVD的第一张盘启动,即可进入CentOS的安装程序。

CentOS操作系统安装教程

  光盘启动,出现“boot:”提示符,直接按回车进入图形安装界面。出现是否对CD媒体进行测试的提问,这里选择“Skip”跳过测试。

CentOS操作系统安装教程

  语言选择界面中,如需要使用中文系统,则选择简体中文进行安装。

CentOS操作系统安装教程

  键盘选择为“美国英语式”。

CentOS操作系统安装教程

  之后的分区设置中,如果硬盘没有其他系统,可以选择删除所有分区,如果还有Windows系统的话,可以选择删除Linux分区。

CentOS操作系统安装教程

  接下来是网络配置,可以根据自己的实际情况来配置网络地址。

CentOS操作系统安装教程

  时区设定,根据自己所在的时区选择相应的城市。

CentOS操作系统安装教程

  接下来为root密码设置,因为root是系统管理员用户,因此要设置一个强密码,以防破解。

CentOS操作系统安装教程

  在安装应用软件界面,因为我们要安装LAMP环境,因此要点“现在定制”。

CentOS操作系统安装教程

  在“服务器”中,勾选“万维网服务器”。

CentOS操作系统安装教程

  点“可选的软件包”,选择需要安装的模块,默认会安装Apache、MySQL和PHP等模块。

CentOS操作系统安装教程

  之后,系统会提示你需要那几张安装光盘,准备好这些盘。

CentOS操作系统安装教程

  接下来是安装过程,中途系统会提示换盘。

CentOS操作系统安装教程

  安装完成后,会进入一个配置界面。

CentOS操作系统安装教程

  在防火墙设置中,因为我们要架设网站,所以需要将HTTP端口打开。

CentOS操作系统安装教程

  然后可以创建一个非管理使用的个人帐号。

CentOS操作系统安装教程

  重启之后,就完成了安装,进入了CentOS的登录界面,输入登录用户root和root的密码进行登录。

CentOS操作系统安装教程

  输入用户名和密码之后,就进入了CentOS的主界面。

CentOS操作系统安装教程

  在“系统”-“管理”-“服务”中,将httpd和mysqld勾选中,使其可以自动启动服务。

CentOS操作系统安装教程

  接下来,进入终端界面,编辑/etc/httpd/conf/httpd.conf文件,可以对Apache服务器进行详细设置,测试PHP文件,可以新建一个文件到/var/www/html/info.php,内容为如下:

<?php
phpinfo();
?>

CentOS操作系统安装教程

  使用Firefox打开http://127.0.0.1/info.php,如果显示如图界面,说明PHP已经配置成功。

  至此,一个完整的LAMP(Linux+Apache+MySQL+PHP)的环境就安装好了。

2009年9月1日星期二

40小时就是网瘾——IT白领应该领工伤抚慰金

  自从那个真真假假的网瘾标准在网络流传,咱们很多IT行业内的难兄难弟就郁闷了。40小时就是网瘾,咱们一天上班八小时,按照正常上班时间一周五天咱们就“被网瘾”了。算上偶尔加加班的时间,自己回家还上网看新闻、看视频、玩游戏,闲暇时候通过MID或者手机登陆互联网,再算上周末两天时间,网络成瘾患者这个帽子咱们混IT的是注定戴定了,而且还是超重度的网络成瘾患者。

  而且据说根据某些砖家的论断,网瘾到一定程度属于一种精神病,所以各位路过的、飘过的、打酱油的和信春哥的IT人士,咱们不仅“被网瘾”了,还被“精神病”了。咱们的互联网圈子就是一个由大量精神病人士从事着长时间的高强度的可能导致精神病的活动(上网)。套用某网友的评论:很好,很强大。IT业的所有人,都是网瘾患者。我们有足够的理由相信该网瘾标准,是某些仇视互联网的人士针对互联网人士有预谋、有组织的一次大型娱乐活动,目的在于让咱们加入一场精神病人的狂欢。

40小时就是网瘾——IT白领应该领工伤抚慰金

  既然咱们是因为工作的需要导致得了“网瘾”这种精神病,对我们的强健的身体和纯洁柔弱的心灵造成了巨大伤害,我们的IT界的精神病患者们绝对都是名副其实的因公致残,我们是不是可以申请领取工伤抚慰金。基于为造福全国IT人士这一崇高的理想,我强烈希望有深度网瘾的IT人士可以站出来勇敢申请工伤抚慰金,这一做法将为这个美好的世界翻开崭新的一页。

  同时你可以成为国内申请网瘾工伤赔偿第一人,成为各大媒体观注焦点,不论结果如何,都具有里程碑的意义,从此红人一个。直接到有劳动部门指定的鉴定医院开个鉴定证明,证明你确实是因为因公致残被网瘾,目前已经有不少医院将网瘾划归为精神病科。当然这样的做法可能让你面临被老板炒鱿鱼,建议归建议,自己琢磨怎么做。

  就在今天早些时候卫生部说话了,公开表示这个40小时的标准是不属实的,并且之前采访的高雪屏也不是卫生部专家组成员,不过相关的标准制定仍然在制定和意见征询中。卫生部这个声明不管怎么理解都有点欲盖弥彰的意思,话说那个叫高雪屏的专家再怎么想出名也犯不着顶着卫生部的假帽子,就算不是卫生部的所谓专家组成员也一定和卫生部网瘾标准有重要关系,卫生部此举大有撇清关系之嫌。不过这也不关咱的事儿,只要不莫名其妙地被网瘾被精神病就好,经这么一回子估计卫生部那帮专家也会变得谨慎多了。

  来源:读者xjp投稿, 原文链接

  背景新闻:网瘾标准年内出台——每周上网超40小时即认为成瘾

  三湘都市报 记者 张春祥 通讯员 魏惊宇

  备受关注的网瘾诊治标准有望年内出台。年初,卫生部委托北京大学第六医院精神卫生研究所和中南大学精神卫生研究所负责网瘾、酒瘾的界定标准和治疗规范。现在过去半年了,看来已经有点眉目了。

  据相关媒体报道:接到卫生部的委托任务后,中南大学精神卫生研究所成立了5名专家组成的专家团队。其中一位高雪屏接受记者采访时介绍:“网瘾标准的制定,主要沿用国外的标准。将在国外标准的基础上,结合国内网络成瘾者的情况,进行修订。”

  高雪屏说,在网瘾的界定上,一些标准的界定还要进行精细的调查分析。“初步认定,每周上网40小时以上即可认为是网瘾。”高雪屏说,有的人上网一周左右即可成瘾,有的时间则更长,成瘾者主要以玩游戏为主。游戏很有吸引力,孩子在接触中,感受到它有无尽的乐趣,兴趣点自然而然的就转移到游戏上了。目前做的,正是这些基础研究。

2009年8月31日星期一

3G时代,电信如何赶超联通、移动

  中国移动、中国联通、中国电信正在上演“三国竞争”。中国的3G时代有3大标准,它们各行其道。

  中国移动是TD-SCDMA标准,竞争优势是用户规模最大,达到四亿多。手机系统oPhone,移动应用商场Mobile Market。

  中国联通是WCMDA标准,联通手机用户有两亿多,排在第2.明星产品将是iPhone。

  中国电信是CDMA2000标准,竞争优势是拥有的固网用户和宽带用户最多,截止6月底,中国电信的固网用户总数为1.9936亿户,总数达到4905万户;移动电话的手机用户为4173万。明星产品:据媒体报道,计划引进RIM Blackberry(黑莓)和Palm Treo。

  从数据来看,三者的手机用户规模相差很大,要改变竞争格局是很难的。

  中国移动将继续在市场领先。

  中国联通要赶超中国移动的机会不大,iPhone不可能在中国卖出2亿部。iPhone的本质是创造高利润的明星。

  依中国电信现时的商业策略,要赶超中国联通的机会不大,更谈不上赶超中国移动。即使引进RIM Blackberry(黑莓)和Palm Treo,也没办法能保证创造一亿多的新用户来赶超中国联通。需要注意的是,中国电信针对高级白领和企业人士的商务需求来推广,这部分人正是中国移动全球通的用户群体,客户忠诚度高,很难抢走。

  那么,中国电信有没有机会赶超中国移动?从商业策略的设计角度来看,存在机会。

  简哲为中国电信在3G时代突围提出的思路:

  一、利用固网用户的资源优势

  将固网用户发展为手机用户。例如中国电信现在搞的那些套餐,也是这种思路。

  简哲的看法是:在移动分机上突破。现时,中国移动和中国联通都有移动分机的业务,但是中国电信有领先的优势,就是它拥有近两亿的固话用户。

  中国电信要推广就是让固网用户装分机——手机分机。例如,一间企业的固定电话号码是020-12345678,分机可以是手机,号码就是020-12345678-0001、020-12345678-0002……

  1、家庭固话装手机分机

  例如一个家庭有一部电信固话,可以带来两部手机分机(家庭夫妻各一部)。夫妻互打免费;孩子在家,家长用手机分机打家里固话免费;孩子在家用固话打家长的手机免费。

  2、企事业单位固话装手机分机

  一个集团公司,一部固定用话可能会带来几千个手机分机用户。

  针对企业的商业特性,尤其是中小企业,到了星期天单位没人接听业务电话时,可以默认设置在星期天打020-12345678的电话是直接打020-12345678-0001.这样的手机分机就容易让企业接受,因为能创造商业价值。

  3、延伸策略:异地装手机分机

  外来工群体庞大,如果外来工的家里有电信的固话,让外来工装手机分机,免费往家里打电话,或者每月送多少通话时间。这样就容易拓展外来工市场。这个策略说简单一点就是装手机送长途电话费。

  中国电信再发挥价格优势,肯定能从中国移动和中国联通手里抢到大量用户。

  中国电信,你有近两亿固网用户,两亿部固定电话装一部手机分机就会带来两亿手机用户,达到中国联通的用户规模;按家庭夫妻来算就是四亿手机用户,达到中国移动的用户规模;再加上企业的手机分机,用户规模就能赶超中国移动。此外,还能减少固话用户的流失。

  二、宽带用户

  如何又将宽带用户变成手机用户?

  3G时代,手机上网是最大的特色和功能应用。故此,应该发挥自身拥有最多宽带用户的优势。现时互联网手机的概念还算不错,但是这个定位和3G手机的概念重叠。中国电信有近5000万的宽带用户,简哲认为还可以针对这个优势资源来加强促销,例如针对宽带用户新装3G手机,可以送流量;此外,如何加强手机利用ADSL宽带的平台资源,是值得探索研究的。

  三、114巨大的商业价值

  中国移动有手机系统oPhone和移动应用商场Mobile Market,中国电信不需要跟着中国移动走。因为,中国电信有114平台,它拥有更大的商业价值。

  简哲认为114在3G时代应该是一个强大的服务引擎——可以图文搜索和语音咨询、短信咨询等,订购各种服务,如订票、订餐、送花、快递等,这意味着成功经营将有机会获得巨额的广告推广收入。

  114还应加强拓展服务外包业务,例如“打的”的呼叫可以打到114去,这比记住某个出租车电话号码更方便。这样的盈利模式很强大,也很容易推广。一是消费者如果是用手机打114,按一般的通话时间收费,如果是用手机上网搜索,就按流量或包月收费;二是商家为业务推广付费。

  114的平台比Googel强大的地方是在于114能做成复合型的服务引擎。

  用一个例子来对比说明。

  消费者使用Googel,搜索“订花”关键字后,点搜索结果或关键字广告,找到花店的联系方式,再打电话。

  114平台可以做到复合型的服务:

  1、手机上网用114服务引擎搜索“订花”,盈利模式如Googel关键字广告。

  2、手机打电话咨询“订花”,盈利模式为商业推介广告,花店付费推介。

  3、手机发短信“订花”,盈利模式为信息费,花店付费推介。

  4、花店公司的呼叫外包,盈利模式为呼叫服务外包。

  5、114商城,自主经营或B2B、B2C、C2C模式。

  关于114的战略,中国电信和中国联通如能达成战略合作,统一开发和推广114平台,这在3G商业服务应用方面肯定能领先中国移动。

  故此,简哲认为中国电信最强大的手机平台就是114.

  四、逆向思维——3G固话

  为什么不能让固话奔向3G时代?

  1、传真机的机遇

  依据中国电信近两亿的固话用户规模,它所拥有的传真机用户也应该是最多的。

  固话用户装手机,送无纸传真机账号。通过互联网收发传真,无纸办公,为企业降低成本,提高效率,就容易拓展企业商用市场。

  2、固话的短信

  固定电话的短信功能,它能不能流行,一是取决于支持这种功能的电话机的普及性;二是如何成功推广它。这种电话机,普及型的肯定要便宜,按照家庭固话装手机分机的思路,也可以装3G手机送这种电话机,这样孩子在家里能用电话机给父母发短信。或者,将天翼LIVE安装到电话机,只要有人喜欢……

  对于企业用户而言,为了引导固话装手机分机,还可以将旧式的固话免费升级,用固话来给手机群发短信。对企业员工、客户作信息通知和节日祝福很方便。为了强调特点,可以突出定时发短信的功能,例如节假日问候短信,将它设置定时发送就很方便。

  3、固话的可视对话

  视频对话能突出3G固话的应用价值,带来更好的使用体验,有利于说服消费者为什么要升级3G固话。

  4、3G固话内置黄页和114引擎

  传统的电话黄页是一本印刷物,3G固话的电话机内置黄页,查找后通过选择来直接打电话。

  电话机内置黄页就会带来电话排名的收费服务。

  要从3G固话挖掘更大的商业价值,就是电话机用大屏显示信息,将114服务引擎放入3G固话。

  电话机内置114引擎就会带来广告推广的收入。

  3G固话如果有彩屏,那么也可以是一个数码相册,能迎合家庭用户的偏爱。

  总之,3G固话可以分为普及型和中高档的产品。只要电话机内置黄页和114引擎,3G固话的升级成本就能转嫁给商家。

  中国电信如果能将现在的2亿固话变成3G固话,赶超中国联通、中国移动的机会就更大了。

  其它,欢迎网友发表建议……

  现时,虽然中国电信在手机业务规模落后于中国联通和中国移动,但是中国电信也有自己强大的优势,如果中国电信懂得扬长避短,就有机会后来居上;如果不能充分发挥出自身的优势,那么将无法摆脱老三的命运。

  来源:简哲 投稿

2009年8月30日星期日

2009年度中国50大网站

  美国时代周刊评选的2009年五十网站,都是英文的,而且很多都被墙了,无法从中国访问,这里按照Alexa的数据评选出2009年五十大中文网站,手动排除了部分英文站和作弊站,排名如下。

  1、百度 baidu.com

  世界领先的中文搜索引擎,提供“简单,可靠”的搜索体验,在中文和多强大的多媒体内容,包括MP3音乐和电影。

  2、QQ qq.com

  中国最大的门户网站,提供即时通讯、新闻资讯、网络游戏以及在线拍卖业务,

  3、新浪新闻中心 sina.com.cn

  包括即日的国内外不同类型的新闻与评论,人物专题,图库。

  4、谷歌 google.cn

  网页、图片、新闻搜索,支持个性化搜索及本地搜索,提供论坛、邮箱、日历服务和桌面搜索工具。

  5、淘宝网 taobao.com

  包括电脑通讯、数码、男装、女装、童装、化妆品、书籍音像、运动用品、游戏装备等各种商品的买卖,还有相关的社区交流,同时提供支付宝网上交易安全保证系统。

  6、网易 163.com

  以网络社区,网络游戏为主要业务的综合门户网站,提供免费邮箱服务。

  7、搜狐 sohu.com

  资源导航为主要业务的门户网站,经营综合性业务,社区,无线等增值服务。

  8、土豆网 tudou.com

  国内免费个人视频网站,免费无限空间,观看和搜索海量视频节目。

  9、优酷 youku.com

  优酷网是中国较大视频网站。为华人提供最快速的视频播放、快速的视频发布、快速的视频搜索服务。

  10、搜搜 soso.com

  腾讯的搜搜网,提供论坛、网页、图片、音乐等类型搜索服务。

  11、开心网 kaixin001.com

  是所有在职人士休闲的好去处,一个SNS的社区。

  12、我乐网 56.com

  56是视频分享平台,拥有数量巨大的原创视频库、及完整影视库,从观看视频、上传视频、到分享视频都拥有极佳的用户体验。

  13、Ku6 ku6.com

  酷6网是视频分享网站,免费提供视频播客、视频分享、视频搜索等服务,可在线观看最新、最热的视频。

  14、搜狗 sogou.com

  中文搜索引擎,提供新闻搜索、音乐搜索、购物搜索,地图搜索等专项搜索服务,为网民提供方便快捷的信息获取方式。

  15、猫扑网 mop.com

  包括聊天室、网络电台、数码、游戏、魔兽世界、创业、涂鸦板、招聘、休闲、淘宝城、白领、游戏卡、邮箱、充值等栏目。

  16、迅雷 xunlei.com

  迅雷是一款新型的基于多资源超线程技术的下载软件,能够充分利用宽带上网的特点,带给用户高速下载的全新体验。

  17、中关村在线 zol.com.cn

  中关村在线是大中华区最具商业价值的IT专业网站,始终致力于销售促进型IT专业媒体的建设。

  18、太平洋电脑网 pconline.com.cn

  提供电脑产品介绍、价格信息、企业名录及电脑知识和新闻。

  19、天极网 yesky.com

  IT产品应用、评测、导购资讯、软件下载和互动社区。

  20、搜房网 soufun.com

  全球最具权威和规模的房地产网络媒体和信息服务企业。覆盖中国大陆、香港、台湾、新加坡、温哥华等70多个城市.拥有新房、二手房、家居、研究四大集团。业务覆盖房地产所有行业。

  21、天涯社区 tianya.cn

  天涯社区作为中文网络社区之王,它的感性、丰富性和社会议题设置能力令人惊叹。这里自发生成了最多的草根明星、最具时代气息的天涯剧和最直率的话语场,令其成为传统媒体倚重的新闻源。

  22、雅虎中国 yahoo.com.cn

  含新闻、资讯、邮箱和搜索引擎。

  23、IT168 it168.com

  主要提供电脑硬件和数码产品报价行情、解决方案、市场分析、导购指南及驱动软件下载。

  24、TOM tom.com

  提供国内、国际、娱乐、IT等各方面新闻信息和免费邮箱。

  25、凤凰网 ifeng.com

  提供凤凰卫视中文台节目表、凤凰人语、电影台影片推荐和节目表。

  26、人民网 people.com.cn

  人民日报网站,包括新闻报道和可检索的目录,新闻评论和专题栏目。

  27、PCPOP pcpop.com

  中文IT专业网站。

  28、eNet硅谷动力 enet.com.cn

  提供IT产品资料、技术报道、使用经验及选购指南。

  29、网易邮箱 126.com

  网易126邮箱,专业电子邮局提供免费网络硬盘网络硬盘。

  30、阿里巴巴 alibaba.com

  阿里巴巴是全球企业间(B2B)电子商务的著名品牌,汇集海量供求信息,是全球领先的网上交易市场和商人社区。

  31、新华网 xinhuanet.com

  中国主要重点新闻网站。

  32、和讯网 hexun.com

  包括财经报道、投资论坛、实时行情、个股资讯动态、保险、债券等内容。

  33、东方财富网 eastmoney.com

  东方财富网,中国最具影响力的互联网财经媒体,提供全方位的综合财经新闻和金融市场资讯,覆盖股票、财经、证券、金融、行情、基金、港股、外汇、期货、债券、保险、银行。

  34、狗狗影视搜索 gougou.com

  迅雷提供的影视、音乐游戏、软件等资源搜索。

  35、51 51.com

  中国社交网络平台。

  36、北青网 ynet.com

  都市白领可信赖的网站,全方位均衡报道热点事件,提供综合资讯服务。

  37、校内网 xiaonei.com

  校内是一个真实的社交网络,联络你和你周围的朋友,和朋友分享相片、音乐和电影;找到老同学,结识新朋友。

  38、IT世界 it.com.cn

  提供PC硬件和数码产品资料、评测、行情、新闻、使用经验及选购指南。

  39、口碑网 koubei.com

  着眼于全国的生活类网站,涵盖了衣、食、住、行、玩各类信息,提供生活类店铺黄页还有房产、工作、交友、二手货等各种分类信息,全方位满足用户生活、工作、社交等方方面面的需求。

  40、Hao123 hao123.com

  hao123网址之家是权威的上网导航网站。

  41、中国软件开发网 csdn.net

  提供业界新闻,技术文章,讨论社区和软件下载;出版《程序员》杂志。

  42、Blogbus blogbus.com

  提供收费和免费两种形式的博客托管服务商,有多种模板供选择,支持绑定独立域名等。

  43、太平洋游戏网 pcgames.com.cn

  太平洋游戏网是国内专业悠久的游戏资讯门户网站,有电子竞技、网络游戏、电玩游戏、掌机游戏、动漫在线等资讯频道。

  44、中央电视台 cctv.com

  中央电视台的官方网站,提供节目预告、在线电视收看、最新电视节目介绍及讨论。

  45、拍拍网 paipai.com

  腾讯旗下快乐、时尚和共享的电子商务网站,让沟通促成交易。

  46、39健康网 39.net

  提供各种疾病诊疗信息,医药新闻资讯,健康保健以及医学知识普及,医学专家咨询等健康信息服务。

  47、豆瓣 douban.com

  提供图书、电影、音乐唱片的推荐、评论和价格比较。

  48、VeryCD分享互联网 verycd.com

  通过电驴软件分享电影、音乐、游戏、软件在内的各类资源。

  49、中国移动通信 chinamobile.com

  提供移动服务,互联应用,无线网络建设,GSM短信息应用等。

  50、六间房 6.cn

  提供视频发布和分享空间。

2009年8月29日星期六

LAMP网站架构方案分析

  LAMP(Linux-Apache-MySQL-PHP)网站架构是目前国际流行的Web框架,该框架包括:Linux操作系统,Apache网络服务器,MySQL数据库,Perl、PHP或者Python编程语言,所有组成产品均是开源软件,是国际上成熟的架构框架,很多流行的商业应用都是采取这个架构,和Java/J2EE架构相比,LAMP具有Web资源丰富、轻量、快速开发等特点,微软的.NET架构相比,LAMP具有通用、跨平台、高性能、低价格的优势,因此LAMP无论是性能、质量还是价格都是企业搭建网站的首选平台。

  对于大流量、大并发量的网站系统架构来说,除了硬件上使用高性能的服务器、负载均衡、CDN等之外,在软件架构上需要重点关注下面几个环节:使用高性能的操作系统(OS)、高性能的网页服务器(Web Server)、高性能的数据库(Databse)、高效率的编程语言等。下面我将从这几点对其一一讨论。

  操作系统

  Linux操作系统有很多个不同的发行版,如Red Hat Enterprise Linux、SUSE Linux Enterprice、Debian、Ubuntu、CentOS等,每一个发行版都有自己的特色,比如RHEL的稳定,Ubuntu的易用,基于稳定性和性能的考虑,操作系统选择CentOS(Community ENTerprise Operating System)是一个理想的方案。

  CentOS(Community ENTerprise Operating System)是Linux发行版之一,是RHEL/Red Hat Enterprise Linux的精简免费版,和RHEL为同样的源代码,不过,RHEL和SUSE LE等企业版,提供的升级服务均是收费升级,无法免费在线升级,因此要求免费的高度稳定性的服务器可以用CentOS替代Red Hat Enterprise Linux使用。

LAMP网站架构方案分析

LAMP网站架构图

  Web服务器、缓存和PHP加速

  Apache是LAMP架构最核心的Web Server,开源、稳定、模块丰富是Apache的优势。但Apache的缺点是有些臃肿,内存和CPU开销大,性能上有损耗,不如一些轻量级的Web服务器(例如nginx)高效,轻量级的Web服务器对于静态文件的响应能力来说远高于Apache服务器。

  Apache做为Web Server是负载PHP的最佳选择,如果流量很大的话,可以采用nginx来负载非PHP的Web请求。nginx是一个高性能的HTTP和反向代理服务器,Nginx以它的稳定性、丰富的功能集、示例配置文件和低系统资源的消耗而闻名。Nginx不支持PHP和CGI等动态语言,但支持负载均衡和容错,可和Apache配合使用,是轻量级的HTTP服务器的首选。

  Web服务器的缓存也有多种方案,Apache提供了自己的缓存模块,也可以使用外加的Squid模块进行缓存,这两种方式均可以有效的提高Apache的访问响应能力。Squid Cache是一个Web缓存服务器,支持高效的缓存,可以作为网页服务器的前置cache服务器缓存相关请求来提高Web服务器的速度,把Squid放在Apache的前端来缓存Web服务器生成的动态内容,而Web应用程序只需要适当地设置页面实效时间即可。如访问量巨大则可考虑使用memcache作为分布式缓存。

  PHP的加速使用eAccelerator加速器,eAccelerator是一个自由开放源码PHP加速器,优化和动态内容缓存,提高了性能PHP脚本的缓存性能,使得PHP脚本在编译的状态下,对服务器的开销几乎完全消除。它还有对脚本起优化作用,以加快其执行效率。使PHP程序代码执效率能提高1-10倍。

  具体的解决方案有以下几种:

  1、squid + Apache + PHP + eAccelerator

  使用Apache负载PHP,使用squid进行缓存,html或图片的请求可以直接由squid返回给用户。很多大型网站都采用这种架构。

  2、nginx/Apache + PHP(fastcgi) + eAccelerator

  使用nginx或Apache负载PHP,PHP使用fastcgi方式运行,效率较高。

  3、nginx + Apache + PHP + eAccelerator

  此方案综合了nginx和Apache的优点,使用Apache负载PHP,nginx负责解析其他Web请求,使用nginx的rewrite模块,Apache端口不对外开放。

  数据库

  开源的数据库中,MySQL在性能、稳定性和功能上是首选,可以达到百万级别的数据存储,网站初期可以将MySQL和Web服务器放在一起,但是当访问量达到一定规模后,应该将MySQL数据库从Web Server上独立出来,在单独的服务器上运行,同时保持Web Server和MySQL服务器的稳定连接。

  当数据库访问量达到更大的级别,可以考虑使用MySQL Cluster等数据库集群或者库表散列等解决方案。

  总的来说,LAMP架构的网站性能会远远优于Windows IIS + ASP + Access(例如月光博客)这样的网站,可以负载的访问量也非常大,国内的大量个人网站如果想要支撑大访问量,采用LAMP架构是一个不错的方案。

  综上所述,基于LAMP架构设计具有成本低廉、部署灵活、快速开发、安全稳定等特点,是Web网络应用和环境的优秀组合。