2009年9月7日星期一

西冲海岸线游记

  以前去西冲,都是跟团去的西冲一日游,景色虽美,但无法尽兴,一日就匆匆返回,这个周末,我终于自助去西冲游玩了两天,感觉开销不大,但玩的很爽。

  去西冲乘车时间很长,因此要选好乘车线路,以免堵车,我选择先坐车到银湖汽车站,然后搭乘E11路公车去南澳,E11路公车走高速,停站少,速度快,到南澳只要十元,结果最终总共只用了两个半小时就到了南澳。

  到了南澳已经是中午,我们吃完晚饭后搭车去西冲,南澳到西冲没有方便的公交线路,因此我们搭车过去,通常要每人四、五元。

  下午两点到了西冲海岸,西冲海滩虽然说是没有开发好,但还是要每人门票10元。去了以后我先花50元去租了个帐篷,然后就把带的东西放到帐篷中。下午的西冲还是很热,阳光刺眼,不过还是有很多人在海里面游泳。

西冲海岸线

  碧蓝的天空,一望无际的海水,暖洋洋的阳光,一看到这碧蓝的海水和银白的沙滩,我就按耐不住脱鞋,光脚踩在温暖的海水里,感受着海浪的层层拍打。

西冲海岸线

  西冲的沙滩很美,沙粒很细,海滩很平整,沿着海岸线漫步,感觉很好。走在西冲的沙滩,脚下软软的的沙子,旁边是蔚蓝的大海,汹涌的波涛,海风拂面,真可以让人忘却一切压力与烦恼,在这样的沙滩上走走,都值得这一路的车马颠簸。

西冲海岸线

  岸上还有一些小木屋供出租,价格大概是一天150元,而帐篷则是搭建在沙滩上。

西冲海岸线

  远眺西冲海岸线,可真长啊。

西冲海岸线

  晚上的西冲大概七点半后就不让游泳了,不过依旧可以沿着海岸线走走,吹海风,听海涛,很多人在海滩上放烟花,让海滩的夜色显得格外美丽。

  一夜无话,第二天早上看日出又是一个必然的活动,早上六点钟太阳就出来了,这时外面已经好多人在沙滩上看日出。

西冲海岸线

  这就是西冲的日出,阳光将海水染的一片通红,非常壮观。

西冲海岸线

  人们则忙着在海边留影,希望能留下这美好的时刻,有些猛汉则一早就在海里游泳去了。

西冲海岸线

  不过,我还是不太建议早上去游泳的,因为早上的海浪非常大,水性不好的话容易出意外。

西冲海岸线

  天亮了,这里是西冲的早晨。

西冲海岸线

  多美的海岸线啊!

西冲海岸线

  下一步,我就计划自助进行东西冲海岸线穿越了。

2009年9月5日星期六

李开复和唐骏的是是非非

  李开复与唐骏,这俩人曾经是微软公司耀眼的两颗星。唐骏在微软最大的时候是官居微软(中国)公司总裁,全权负责微软中国地区的业务;李开复官最高时微软公司副总裁,负责公司的自然交互服务部,致力于用户界面的开发工作。

  李开复只比唐骏晚一年离开微软,但是离开的方式和获得的对待也迥然不同。唐骏2004年正式离开微软,被微软授予微软中国终身荣誉总裁,微软可谓是给予唐骏限度内能够给的最多,双方的好聚好散也广为业内所称道。

  一年以后李开复闪电离开微软担任Google中国区总裁,对于Google这次的恶意挖角微软表现出了极度的愤怒,甚至不惜以打官司的形势来阻挠李开复加盟Google,双方的口水战也是好不间断,尽管微软发起的这场官司实际上是针对Google越来越猖獗的挖角行动,尽管官司最后双方达成了和解,但是我相信不明真相的李开复博士的内心一定留下了深刻的阴影。

李开复和唐骏

  李开复与唐骏都算是中国职业经理人的顶端,在离开微软之后都快速确定自己的地位和提升自己的影响力。李开复加盟了Google,当然最新的消息是李博士辞职不干了,他下一次的动作自然成为大家关注的焦点。唐骏自从离开微软加盟盛大开始就迅速成为业界关注的焦点,他与陈天桥的配合可以称得上是无间,据说俩人从来没吵过架,后来加盟新华都的十亿合同更是将他推向了打工皇帝的宝座,唐骏是在用自己的方式体现自己的价值。

  当初李开复加盟Google的时候Google玩不转中国这块市场,当时面临着相当大的挑战,这些挑战来自百度和当时风头正劲的3721,我曾经说过,当李开复决定离开的时候Google的中文品牌谷歌已经占据了30%的搜索市场,并且一切状况看起来都会更好,在某种程度李开复上达到了Google总部的期望。唐骏加入盛大的时候正是盛大准备革命的时候,准备用免费这张牌冲洗市场规则,唐骏经历了盛大的几次重大战役,包括盛大盒子,当他离开的时候盛大已经重新稳固了老大的位置。

  李开复是做技术出身,并且在大学生群体内拥有较高的影响力,温文儒雅,做事有自己固定的节奏,不会轻易被他人干扰。唐骏则更像一个标准的职业经理人范本,守规矩,玩规则,熟悉资本运作,擅长公司管理。

  2008年唐骏加盟新华都的时候让我们大跌眼镜,但是谁知道李开复不会哪天让我大吃一惊呢?他们站在同一个位置,都是从微软出身,尽管是不同的人,用不同的方式到达。

  来源:读者xjp投稿,原文链接

2009年9月4日星期五

谷歌大中华区总裁离职

  9月4日早间消息,谷歌全球副总裁、大中华区总裁李开复将于今日正式辞职,在四年任期结束后最终选择离开。据可靠消息称李开复今后可能自主创业。

  据信,谷歌中国将于今晨正式对外宣布这一消息,已有不少内部员工提前获悉此事。尽管此前数年间一直不断传出李开复离职传言,但这一确实的消息仍然令不少员工感到震惊。包括谷歌CEO施密特在内的高管曾访华力挺李开复。

  李开复是谷歌与微软在挖角大战中最具争议性的一位。2005年7月时任微软副总裁的李开复跳槽谷歌,出任谷歌中国区总裁,微软随即以竞业禁止为由在美国将谷歌与李开复告上法庭,双方于当年12月秘密和解。

  李开复的离职,使得谷歌在中国的发展前景更加扑朔迷离。

李开复

  就我个人来说,对于李开复掌管谷歌的这四年中,我最为欣赏的谷歌本地化产品就是谷歌拼音输入法和AdSense。拼音输入法我目前一直再用(不过还是1.2版的),我很期待这个输入法能有手机版和Linux版,AdSense这四年来在国内开办的巡游讲座活动也很多,几乎年年都有,如果没有AdSense的话,中国大多数网站站长可能都坚持不到今天。

  新浪的专题:谷歌全球副总裁、大中华区总裁李开复将从谷歌离职网易的专题新闻

搜搜尚未成功,腾讯仍须努力

  在几乎没有任何媒体宣传的情况下,腾讯旗下搜索引擎搜搜上线了自主搜索技术。众所周知搜搜之前的网页搜索结果是使用来自Google的技术,估计这个时候双方的合作协议也刚好到期,目前搜搜的帮助文档还没有作相应的更新。

  搜搜网页搜索相较之前增加了类似有道的预览功能,搜搜保留的是基本的文字内容和超链接,有道保留的是文字和基本的CSS样式。其他部分也有细微差别,不过这两个功能并不存在实质差别,都可以帮助用户快速获取目标网页的相关信息,提供除了快照以外的更多一种选择。

  腾讯当然是想要借助自有搜索技术的上线在搜索市场分一杯羹,不过是骡子是马拉出来遛遛,我们来看看腾讯新搜索的表现怎么样。

SOSO

  错词纠正

  由于中国文化博大精深,同音字太多导致我们可能有时候会遇到输入错误,当然这种情况也可能发生在英文的拼写错误,这个测试项目选用一个中文关键词与一个英文关键词进行测试。

  周于明:用户想要搜索的是F4里面的周渝民,中文的错词纠错根据拼音库进行判断,搜搜、百度、谷歌都给出了“周渝民”这样的正确提示,搜搜和百度都显示为错误输入的搜索结果,谷歌胜出的点是是它对所有可能拼写错误的搜索结果都会给出所提示的关键词的两个搜索结果,这让它的搜索结果具备更多的可用性。

  Michel Jackson:MJ的粉丝应该可以很容易看出这是一个拼写错误,正确的拼写应该是“Michael Jackson”。搜搜并没有给出正确的拼写提示,搜索结果显示为错误拼写的搜索结果;百度给出了正确的拼写提示,第一二项结果具有可读性(MJ粉丝网站和维基百科),其余为错误拼写的搜索结果;谷歌给出了正确的拼写提示,搜索结果为正确拼写的搜索结果。

  索引数量与索引速度

  这两个指标直接关系着搜索引擎能否为用户提供快速的搜索体验和优秀的搜索质量,这里将会使用两个随机选择的热门关键词进行测试。

  网瘾:搜搜、百度、谷歌的完成搜索时间分别为0.104秒、0.002秒、0.20秒,百度以巨大的优势领先,搜搜与谷歌紧跟其后,需要说明的是这样短的差距对于普通用户几乎是没有差别。接下来是索引网页数量的较量,搜搜搜索到了2,570,000项结果,百度搜索到了6,090,000项结果,谷歌这个数字为8,640,000,百度领先搜搜接近200%,而谷歌又领先百度超过40%.搜搜落败在意料之中,毕竟Sosospider的出道时间比另外两家实在是晚太多。

  郁可唯:中国头号选秀节目的热门选手,郁可唯自然适合用来作为测试关键词。搜搜、百度、谷歌的完成搜索时间分别为0.051秒、0.003秒、0.30秒,三方趋势与上一个关键词相同不再赘述;索引网页数量这一指标,搜搜为1,370,000项搜索结果,百度为1,020,000项搜索结果,谷歌为11,700,000项搜索结果,搜搜在这一轮反超百度,而谷歌大幅扩大了优势,大有打着望远镜都找不着对手的感觉。

  中文分词技术

  中文分词一直都是各大搜索引擎相互比拼的领域,中文分词技术的提升能够最有效提升用户的搜索体验,所谓中文分词简而言之就是让电脑知道用户想要什么,尽管用户的搜索是那么千奇百怪,仍然选用两个中文关键词进行测试。

  学生会组织义演活动:搜搜的分词为学生会组织义演活动,正确;百度的分词为学生会组织义演活动,错误将学生会组织这样一个动宾短语识别为一个名词;谷歌的讽刺结果为学生会组织义演活动,正确。

  胜利取决于勇气:搜搜的分词为胜利取决于勇气,正确;百度的分词为胜利于勇气,取决那个词直接被忽略,让人比较困惑;谷歌的分词为胜利取决于勇气,正确。

  百度在这一回合的落败让人意外,毕竟几年前百度曾经叫嚣着最懂中文,搜搜的分词与谷歌基本相同。

  搜索质量实测

  这一回合避开单项测试可能造成的误判,采用最直观的搜索结果来作一个较量,同样是两个关键词,一个是问答式的需要得到解答,另一个热门关键词,考验搜索结果内容质量。

  2010世博会在哪里开:搜搜在第三位提供了来自百度知道的搜索结果,前两位搜索结果并不能提供相关性了解;百度在第六位提供了来自百度知道的搜索结果,上方的搜索结果皆为世博官方网站或者对应的门户专题,这体现了百度越来越明显的倾向于门户站点;谷歌在第三位提供了来自搜搜问问的搜索结果,前两位为来自世博官方网站的搜索结果。如果要排序的话谷歌第一,搜搜第二,百度第三。

  周杰伦:周董的关注度绝对是毋庸置疑,用这个词来考察搜索引擎第一页内容的丰富程度。搜搜的第一页搜索结果包含两条歌迷网站、两条音乐搜索(百度MP3、搜搜音乐)、一条图片搜索(搜搜图片)、一条百科(百度百科)、四条网站专题(新浪、腾讯、TOM);百度的第一页搜索结果包含两条歌迷网站、一条音乐搜索(百度音乐)、一条图片搜索(百度图片)、一条百科(百度百科)、两条网站专题(新浪、腾讯)、一条相关新闻(百度新闻)、一条贴吧、一条视频(百度视频);谷歌的第一页搜索结果包含一条歌迷网站、两条音乐搜索(百度MP3、谷歌音乐)、一条百科(百度百科)、七条网站专题(新浪、腾讯、TOM、搜狐、网易、人民网)、一条相关新闻(谷歌资讯)、一条博客搜索,值得指出的是谷歌音乐、谷歌资讯、谷歌博客都是没有算进十条搜索结果的,也就是谷歌有十三条搜索结果。排序依次为谷歌第一、百度第二、搜搜第三。

  搜搜如果想要争得一席之地需要走得路还很长,搜索引擎很大程度上并不能从腾讯在IM的强势获利太多,搜搜需要面对的更多是技术提升和用户习惯的教育,百度的崛起是因为当时在中文搜索的技术优势与用户习惯而,谷歌市场份额回升是因为技术的改进和用户教育,而这两方面都是搜搜缺乏的。So,腾讯仍须努力。

  来源:读者xjp投稿,原文链接

2009年9月3日星期四

网站文章内链的一个思路

  内链:顾名思意就是在自己网站的内容中的相关文字加入链接,并且链接到网站内部的相关页面。合理的网站内空链接构造,能提高搜索引擎的收录与网站权重。相对外部链接,内部链接也很重要。

  传统方式

  以前我们做文章系统或新闻发布系统的时候,做文章内链(标签)的时候,通常是通过以下方式来实现的:

  数据库:article(文章表)字段(id, title, body, adddate, userid),keyword(内链表)字段(id, name, link)

  在发布文章的时候,循环内链表内的所有,来替换文章的body。

  这样确实是实现了想要的功能,但是如果我们的内链表的数据达到很大的数目,比如2W、5W或更多的时候。每发布和修改一片文章的效率是可想而知的。那么网易的新闻、百度的百科等这样打大型网站是如何实现的呢?如果按照以上的做法,那系统在几个月后就直接崩溃了。

  分析比较

  一篇正常的文章会有多少字(不计HTML代码)?1W?我想1W的文章已经算是很长的了,而且想在如果直接在一个页面显示1W的文章相信没有几个人有耐心能看完的。为了页面美观和用户体验,编辑通常都是将内容过多、篇幅超长内容的文章分段处理(分为几篇文章,或分章节)。如果我们能事先将可能出现内链的字从文章中提取出来,再从数据库里检索,这样效率是不是就可以得到很大的提高?答案是肯定的。我们就拿1W字的文章来说,假设文章的所有文字都需要内链,循环的次数是1W次。比上面的例子假设要强得多吧?

  在传统方式中,不管你要不要,把内链表的东西全查一边。而下面这种思路是事先将有可能出现内链的字词全部整理出来,再用这些词分别去检索内链表。这样一比较问题就出来了。

  新思路就是:从文章中取出需要内链的字词,然后去查询内链表。

  可行操作

  我们暂且把传统方式称为被动方式,把新思路的方法称为主动方式。

  主动方式的实现方法如下。

  利用中文分词技术,我们可以对一篇文章进行分词。然后根据分词后的词表,过滤掉常用的物主代词、副词、感叹词等。把名词、品牌、地名、商标等留下,或者根据自己的词库表来分词。然后把剩余的字词去检索内链表,如果有存在,我们就坐上链接,不存在就PASS。

  以上只是思路的一个初步构思,在实际实现过程中需要考虑的因素很多。我觉得重点就在分词这个环节。

  来源:读者沈力投稿

2009年9月2日星期三

CentOS操作系统安装教程

  CentOS操作系统是商业版Red Hat Enterprise Linux(RHEL)的免费版,是架构LAMP的理想操作系统,稳定性非常好,和Ubuntu不同的是,CentOS主要用于服务器而不是桌面环境,不少大型的商业网站都使用CentOS操作系统,我在《LAMP网站架构方案分析》中曾经讲述了一系列架构方案,这里以CentOS为例具体讲一下LAMP环境的安装和搭建。

  首先要下载CentOS操作系统的ISO,下载地址点这里,目前最新版为5.3,下载文件有两种形式,一种是光盘CD版,要六张盘,要下载的文件为CentOS-5.3-i386-bin-1of6.iso、CentOS-5.3-i386-bin-2of6.iso、CentOS-5.3-i386-bin-3of6.iso、CentOS-5.3-i386-bin-4of6.iso、CentOS-5.3-i386-bin-5of6.iso、CentOS-5.3-i386-bin-6of6.iso,一种是DVD版,要一张盘,下载文件为CentOS-5.3-i386-bin-DVD.iso,3.7G容量。

  下载完成后,使用Nero等光盘刻录软件将ISO镜像文件转换、刻录成安装CD或DVD光盘。

  然后将服务器硬盘格式化,插入CD或DVD的第一张盘启动,即可进入CentOS的安装程序。

CentOS操作系统安装教程

  光盘启动,出现“boot:”提示符,直接按回车进入图形安装界面。出现是否对CD媒体进行测试的提问,这里选择“Skip”跳过测试。

CentOS操作系统安装教程

  语言选择界面中,如需要使用中文系统,则选择简体中文进行安装。

CentOS操作系统安装教程

  键盘选择为“美国英语式”。

CentOS操作系统安装教程

  之后的分区设置中,如果硬盘没有其他系统,可以选择删除所有分区,如果还有Windows系统的话,可以选择删除Linux分区。

CentOS操作系统安装教程

  接下来是网络配置,可以根据自己的实际情况来配置网络地址。

CentOS操作系统安装教程

  时区设定,根据自己所在的时区选择相应的城市。

CentOS操作系统安装教程

  接下来为root密码设置,因为root是系统管理员用户,因此要设置一个强密码,以防破解。

CentOS操作系统安装教程

  在安装应用软件界面,因为我们要安装LAMP环境,因此要点“现在定制”。

CentOS操作系统安装教程

  在“服务器”中,勾选“万维网服务器”。

CentOS操作系统安装教程

  点“可选的软件包”,选择需要安装的模块,默认会安装Apache、MySQL和PHP等模块。

CentOS操作系统安装教程

  之后,系统会提示你需要那几张安装光盘,准备好这些盘。

CentOS操作系统安装教程

  接下来是安装过程,中途系统会提示换盘。

CentOS操作系统安装教程

  安装完成后,会进入一个配置界面。

CentOS操作系统安装教程

  在防火墙设置中,因为我们要架设网站,所以需要将HTTP端口打开。

CentOS操作系统安装教程

  然后可以创建一个非管理使用的个人帐号。

CentOS操作系统安装教程

  重启之后,就完成了安装,进入了CentOS的登录界面,输入登录用户root和root的密码进行登录。

CentOS操作系统安装教程

  输入用户名和密码之后,就进入了CentOS的主界面。

CentOS操作系统安装教程

  在“系统”-“管理”-“服务”中,将httpd和mysqld勾选中,使其可以自动启动服务。

CentOS操作系统安装教程

  接下来,进入终端界面,编辑/etc/httpd/conf/httpd.conf文件,可以对Apache服务器进行详细设置,测试PHP文件,可以新建一个文件到/var/www/html/info.php,内容为如下:

<?php
phpinfo();
?>

CentOS操作系统安装教程

  使用Firefox打开http://127.0.0.1/info.php,如果显示如图界面,说明PHP已经配置成功。

  至此,一个完整的LAMP(Linux+Apache+MySQL+PHP)的环境就安装好了。

2009年9月1日星期二

40小时就是网瘾——IT白领应该领工伤抚慰金

  自从那个真真假假的网瘾标准在网络流传,咱们很多IT行业内的难兄难弟就郁闷了。40小时就是网瘾,咱们一天上班八小时,按照正常上班时间一周五天咱们就“被网瘾”了。算上偶尔加加班的时间,自己回家还上网看新闻、看视频、玩游戏,闲暇时候通过MID或者手机登陆互联网,再算上周末两天时间,网络成瘾患者这个帽子咱们混IT的是注定戴定了,而且还是超重度的网络成瘾患者。

  而且据说根据某些砖家的论断,网瘾到一定程度属于一种精神病,所以各位路过的、飘过的、打酱油的和信春哥的IT人士,咱们不仅“被网瘾”了,还被“精神病”了。咱们的互联网圈子就是一个由大量精神病人士从事着长时间的高强度的可能导致精神病的活动(上网)。套用某网友的评论:很好,很强大。IT业的所有人,都是网瘾患者。我们有足够的理由相信该网瘾标准,是某些仇视互联网的人士针对互联网人士有预谋、有组织的一次大型娱乐活动,目的在于让咱们加入一场精神病人的狂欢。

40小时就是网瘾——IT白领应该领工伤抚慰金

  既然咱们是因为工作的需要导致得了“网瘾”这种精神病,对我们的强健的身体和纯洁柔弱的心灵造成了巨大伤害,我们的IT界的精神病患者们绝对都是名副其实的因公致残,我们是不是可以申请领取工伤抚慰金。基于为造福全国IT人士这一崇高的理想,我强烈希望有深度网瘾的IT人士可以站出来勇敢申请工伤抚慰金,这一做法将为这个美好的世界翻开崭新的一页。

  同时你可以成为国内申请网瘾工伤赔偿第一人,成为各大媒体观注焦点,不论结果如何,都具有里程碑的意义,从此红人一个。直接到有劳动部门指定的鉴定医院开个鉴定证明,证明你确实是因为因公致残被网瘾,目前已经有不少医院将网瘾划归为精神病科。当然这样的做法可能让你面临被老板炒鱿鱼,建议归建议,自己琢磨怎么做。

  就在今天早些时候卫生部说话了,公开表示这个40小时的标准是不属实的,并且之前采访的高雪屏也不是卫生部专家组成员,不过相关的标准制定仍然在制定和意见征询中。卫生部这个声明不管怎么理解都有点欲盖弥彰的意思,话说那个叫高雪屏的专家再怎么想出名也犯不着顶着卫生部的假帽子,就算不是卫生部的所谓专家组成员也一定和卫生部网瘾标准有重要关系,卫生部此举大有撇清关系之嫌。不过这也不关咱的事儿,只要不莫名其妙地被网瘾被精神病就好,经这么一回子估计卫生部那帮专家也会变得谨慎多了。

  来源:读者xjp投稿, 原文链接

  背景新闻:网瘾标准年内出台——每周上网超40小时即认为成瘾

  三湘都市报 记者 张春祥 通讯员 魏惊宇

  备受关注的网瘾诊治标准有望年内出台。年初,卫生部委托北京大学第六医院精神卫生研究所和中南大学精神卫生研究所负责网瘾、酒瘾的界定标准和治疗规范。现在过去半年了,看来已经有点眉目了。

  据相关媒体报道:接到卫生部的委托任务后,中南大学精神卫生研究所成立了5名专家组成的专家团队。其中一位高雪屏接受记者采访时介绍:“网瘾标准的制定,主要沿用国外的标准。将在国外标准的基础上,结合国内网络成瘾者的情况,进行修订。”

  高雪屏说,在网瘾的界定上,一些标准的界定还要进行精细的调查分析。“初步认定,每周上网40小时以上即可认为是网瘾。”高雪屏说,有的人上网一周左右即可成瘾,有的时间则更长,成瘾者主要以玩游戏为主。游戏很有吸引力,孩子在接触中,感受到它有无尽的乐趣,兴趣点自然而然的就转移到游戏上了。目前做的,正是这些基础研究。