2005年12月10日星期六

被遗忘的纪念日:一二·九

  今天是一二·九运动纪念日七十周年,不过,这个日子似乎被遗忘了,看遍了今天所有的媒体和网站的新闻,都没有一个地方提到了一二·九。仿佛七十年前什么事情也没有发生过。真是可叹啊。

  什么是一二·九运动呢?这里有一篇新华网的资料,代表了目前官方对一二·九的定义。

  一二·九运动

  一九三五年一二月九日,北平发生的“一二·九”运动是中国共产党领导的一次大规模学生爱国运动。

  “九·一八事变”后,日本帝国主义占领了东北,接着又向华北发动了新的侵略。一九三五年下半年,日本帝国主义发动华北事变,进一步控制察哈尔,并指使汉奸殷汝耕在冀东成立傀儡政权。国民党政府继续坚持不抵抗政策,竟准备于一二月成立冀察政务委员会,以适应日本帝国主义提出的华北政权特殊化要求。失地丧权,亡国灭种的大祸迫在眉睫。一二月九日,在中共北平临时工作委员会的领导下,北平爱国学生6000余人,高呼“停止内战,一致对外”、“打倒日本帝国主义”等口号,举行了声势浩大的抗日救国示威游行。国民党政府出动大批军警镇压,30多人被捕,数百人受伤。10日,北平各校学生宣布总罢课。在“冀察政务委员会”计划成立的12月16日,北平学生和各界群众1万余人又举行示威游行,迫使冀察政务委员会延期成立。之后,天津学生又组成南下扩大宣传团,深入人民中间宣传抗日救国。杭州、广州、武汉、天津、南京、上海等地相继举行游行示威。北平学生的爱国行动,得到了全国学生的响应和全国人民的支持,形成了全国人民抗日民主运动的新高潮,推动了抗日民族统一战线的建立。

  一二·九运动公开揭露了日本帝国主义侵略中国,并吞华北的阴谋,打击了国民党政府的妥协投降政策,大大地促进了中国人民的觉醒。它配合了红军北上抗日,促进了国内和平和对日抗战。它标志着中国人民抗日民主运动新高潮的到来。正如毛泽东所指出的,一二·九运动“是抗战动员的运动,是准备思想和干部的运动,是动员全民族的运动”,“有着重大的历史意义”。

  看完上面的定义,很多人会发现,今天四月份似乎发生过类似的事件,结局也很相似:上海一个叫汤晔的倒霉小伙子,因为发放“上海地区抗议日本右翼活动的详细说明书”的传单,而以“传播虚假信息”为名被判刑五年。

  对于一二·九运动描述,很早以来我就发现里面有很多不合逻辑的地方,因此我一直都对其真实性表示怀疑。一二·九运动当时发生的真实原因是什么,谁会从中受益,为什么第二年就发生了改变中国历史进程的“西安事变”,为什么张学良获得自由后却再也不肯踏上大陆一步?

  毛泽东曾经于一九三九年在延安纪念一二九运动四周年大会上有一篇讲话,里面提到了一些一二·九运动的历史背景:红军经过了万里长征,在一九三五年十月到达陕北吴起镇。十一月下旬,在富县还打了三场仗。并声称“一二九运动中共产党起了骨干的作用。没有共产党作骨干,一二九运动是不可能发生的。”

  综合上面的一些说法,我们会被这非常的奇怪历史逻辑所迷惑,一九三五年红军已经被围剿的只剩下几万人,溃退到陕北的山区,处于一个自身难保的处境,它靠什么来“北上抗日”?为什么他们不关心自己的存亡却去关心“北上抗日”?如此高调的宣传抗日,其目的是什么?是不是借抗日战争的时机利用日本人打击国民党,自己获得喘息之机,并趁机发展壮大并最终夺取政权?为什么八路军在抗战中打的最大的两场战役,其中之一的“平型关大捷”,日方统计只损失了两百人,另一个“百团大战”,毛泽东是根本不赞成的,认为“暴露了实力”,彭德怀率领的军队对日军占领的交通线和据点发动的大规模骚扰和破坏。但彭德怀为此付出巨大代价,后来成为了他反对毛泽东的“罪证”。

  中国共产党在“九一八”发生的时候,虽然力量微不足道,只控制着江西省南部的一小部份山区,可是在抗战结束的时候,却拥有将近一百万正规军和一百二十万民兵,为以后打下江山奠定了基础。可以说毛泽东的发展壮大、保存实力的政策是非常成功的,正因为如此,毛泽东后来得到了天下,而蒋介石则在抗战中元气大伤,和日本人两败俱伤,最终失去天下。

  我认为学生在一二·九运动中处于一种“捣乱”的作用,成事不足,败事有余,干扰了蒋介石的抗日路线,迫使中日战争提前爆发。西方有论者言,一九三七年中日全面开战,对中国而言,早了两年,对日本而言,则晚了两年,如果早两年开打,则日本可以轻易征服中国;若晚两年开打,则中国可以独立抵抗日本,从其间的差别可以看出蒋介石的功劳。事实上,到一九三六年,蒋介石已基本上在政治上,军事上统一了全国,经济上,一九三六年的国民生产总值也达到上世纪前半叶的最高水平,这样中国才能与日本展开一场持久的胶着的战争。若中国能再有两年的平稳发展,便能独自击退日本,当不是虚言。

  代表中华民族精神而与日本正面抗拒的,是以蒋介石为首的中国国民党和其领导下的国民政府;正是由于中国民族精神的巨大力量,使得在“九一八”以后的特殊时代,分裂的中国国民党几乎神奇地立即团结起来,蒋介石以他的智慧、坚忍和毅力,采取了正确的战略决策,领导中华民族战胜了外部的强敌。

  以蒋介石为首的国民政府首先是尽力避免战争爆发,日本政界的一些有远见的政治家也认为中日之间的战争对双方不利。但在日本狂热的军人的鼓动下,军人浪人不断地在华挑衅,局面终于一发不可收拾。国民政府不得不进行战争的全面准备,包括物质的准备和精神的准备,也开始了“攘外安内”的策略,来解决有苏联的国际背景,并且掌握有军队的共产党问题;同时尽量延缓战争的全面爆发,即在抵抗日本侵略军的同时,遵照“一面交涉,一面抵抗”的原则,忍辱负重,以换取准备战争的时间。这是从“九一八”到“七七”事变期间的基本战略和策略。历史已经证明蒋介石所制定的战略和策略是成功的,只是“西安事变”的出现,使得“攘外安内”的策略半途而废,而有抗战胜利以后的形势的剧变。

  以下文字为转载佚名的一篇讨论蒋介石为何不同意“抗日”的文章,对于蒋介石的政策有了很详细的说明。

  蒋介石为什么不同意抗日的主张,最后激发出西安事变?从常识和逻辑来说,当时连一般老百姓都无法容忍日本侵略,作为一个具有强烈民族主义情绪的中国领导人,蒋介石怎么可能就不准备抗日呢?从蒋介石的一生可以看出,尽管他和毛泽东有很多不同,但有一点非常相似,他们都是强烈的民族主义份子,这点从后来他和毛泽东都无论如何要坚持“一个中国”可以看出。蒋介石宁肯中华民国忍辱退出联合国,也绝不放弃大陆版图,更不走台独。

  而且八年抗战的历史事实已证明,蒋介石不仅坚定抗日,而且领导了整个抗战(国民党部队承担了主要战场,共产党军队仅是敌后打打游击)。据香港学者李谷城的研究统计,八年抗战,国民党军队伤亡340 万人,共产党军队伤亡61万人。从牺牲的人数大小也可以看出谁在承担主要的战场和责任。

  从台海两岸出版的史料都可以证实,蒋介石并不是不抗日,而是在抗日的时机上和张学良有严重分歧,蒋介石主张“攘外必先安内”,即抗日之前,先统一内部,清剿红军。这种政策主要出于两个考量:

  一是当时中国虽结束了军阀割据,但政令难以统一,尤其是共产党不仅仍拥有军队,并割据陕北一方。蒋介石和张学良的最大不同之处是,蒋对共产党有相当的了解,深知如果不铲除红军,它会利用抗日之机得以发展壮大(后来的历史正是这样演变的)。

  蒋介石苦心经营的五次围剿红军和共产党,虽然前四次失败,但第五次获得成功,红军被迫进行“两万五千里长征”。溃退到陕北的红军仅剩下几万人,蒋介石多年的艰苦剿共,终于有了眉目,他怎么让它功亏一篑呢。

  二是以当时中国的国力无法与日本匹敌,必须尽量争取时间,以储备力量。史学家黄仁宇在《从大历史读“蒋介石日记”》一书中说,当时蒋介石“深知两方的实力,如即此仓卒应战,只有自取败亡。”因此蒋的策略是,尽量避免全面抗日的爆发,以争取时间组建更多师团,建造兵工企业,构筑能够对日作战的国家能力。

  1934年,蒋介石就把为抗日而建立的国防设计委员会改组为“资源委员会”,直属蒋直接领导的“军事委员会”,在湖南、四川、湖北等大后方创建军工厂和重工业。西安事变时落到张学良手里的蒋介石日记中对这些国防设计有详细描述(这也是促成张学良醒悟的原因之一)。在西安事变前一年,蒋介石还坚持“和平未到完全绝望之时期,决不放弃和平;牺牲未到最后关头,亦决不轻言牺牲。”

  但蒋介石为什么不把他的想法告诉群情激昂要求抗日的中国民众呢?“918 ”之后,日本内部对是否攻占整个中国也有分歧,当时日本政府向“国联”(国际联盟)提出的对华五项条款,其中主要有“有效保护日本臣民在满洲之一切和平业务,尊重日本在满洲之条约利益”,日本“尊重中国土地之保全”。虽然这种条款是完全不合理的,但中国仍有可能和日本周旋,拖延日本全面入侵中国的时间,以积蓄自己的力量,从长计议。因此如果作为当时中国领袖的蒋介石公开这种战略部署,等于告诉日本人,中国正卧薪尝胆,准备全面抗日,会刺激日本鹰派提前全面侵华。因此国人当时多不知蒋介石的这种国防设计。日本占领东三省后,中国人慷慨激昂,誓言抗日,尤其是大学生和小知识份子们,更是游行示威。在高喊“刀枪不入”的义和团文化背景下,很容易热血沸腾,难以听进去理性的声音。

  当时中国知识界对此保持清醒头脑的是胡适和他的弟子傅斯年等人,胡适发表“华北保存的重要”一文,主张“停战谋和”,指出以中国之国情“不足以对日言战”:“战则必大败,而和则未必大乱”。胡适后来还提出,“日本倘能自华撤兵停战,中国不惜承认满洲国”。胡适为文解释说,当年比利时曾被德国占领,法国割两省给普鲁士,都是由于实力悬殊而采取的权宜之计,后来有实力又收回。

  但胡适的见解不仅无法成为主流声音,而且被指责为“汉奸”“卖国贼”。胡适当年曾感慨:中国有古训“威武不能屈,富贵不能淫,贫贱不能移”,应该再加一条“时髦不能跟”。胡适和汪精卫的本质不同是,一旦所有谋和手段失败,日本进攻全中国,胡适则坚决主张全民血战,直至最后一寸土,最后一个人。这也是后来他为什么打破不做官的自律,在蒋介石的几次恳请后同意到美国做“中国大使”争取美国援助的原因之一。

2005年12月9日星期五

招行信用卡和中行信用卡的对比

  今天我注销了我使用有两年的中国银行的人民币信用卡,以前用过的中行国际卡和附属卡较早也停了,目前我已经把我所有的中行信用卡都注销了。

  我的信用卡使用历史比较早。2002年12月招商银行推出一卡双币的个人信用卡的时候,我就成为招行的第一批用户。后来中国银行到我们公司推销其信用卡,我也就办了3张中行的卡(人民币主卡,附属卡,国际卡)。我这里将这两种信用卡进行一些对比。

招行信用卡

  年费:中行的信用卡年费是每张卡50元,招行的是100元。招行目前实行刷卡6次免年费,实际上算取消了年费,不知道这项优惠能持续多长时间。中行信用卡可以使用积分来抵消年费,消费5000元的积分可以抵消一年的年费。

  网上银行:招行的信用卡一开始就有网上银行,其专业版的网上银行则更加安全。中行人民币信用卡没有网上银行,国际卡有WEB界面的网上银行,但功能很少。

  服务:招行有800免费服务电话,一打就通。中行信用卡是95566收费电话,而且以前很难接通人工服务,不过现在招行的800电话也开始难打了。

  信用额度:招行的信用额度控制相对来说比较灵活一些,一开始招行给我的信用额度只有8000元,不过随着我后来频繁地使用招行卡消费,招行就主动将我的信用额度提高到13000元,这很出乎我的意料。中行则需要去柜台申请提高信用额度,并且要给出相关的信用证明。

  一卡双币:招行的一卡双币非常好,美元卡和人民币卡同时使用一个卡号,很方便,我用招行卡在国外消费美元,全部都可以成功消费。中行分两个卡,不是象招行那样共享额度。美元消费和还款不方便。

  美元还款:招行可以通过电话来设置人民币还款美元。中行则要去柜台办理。

  消费通知:大额人民币消费,两个银行都会发短信立刻通知。招行信用卡消费后,第二天就可以看到帐单,并提供每天电子邮件对帐单的功能,非常实用。中行信用卡什么都没有提供,只有每月通过信件邮寄帐单,没有网上查询,只能等到月底才能看帐单,很不方便。由于招行的卡可以在国外网站用美元消费,因此有一段时间,每当我在国外网站消费了美元,哪怕只有5美元,招行的小姐就立刻打我手机向我确认,我开始以为只是临时的,没想到以后每次美元消费他们都来确认,烦的我只好打他们客服电话,警告他们停止对我进行电话骚扰,之后他们才停止了美元消费确认。中行则从来没有电话消费确认过。

  销卡:招行销卡很方便,只需要打800电话就可以注销信用卡。中行则必须本人带身份证去开户银行的柜台才能办理注销手续。他们是上门来推销信用卡,但是我注销的时候却要坐一个小时车去他们的分行去注销,很不方便。

  消费积分:招行的消费积分实在是笑话,有和没有其实没什么区别。中行的消费积分按年度,可以换取一些小礼品,其礼品内容相当丰富,有日用百货,还有小家用电器,很实惠,这一点招行应该向中行学习。

  我的选择:通过几年来使用2种信用卡的经验,我感觉招行的信用卡无论是从功能还是服务上都好于中行,因此我也就逐步注销了中行的信用卡,希望招行能够继续在信用卡上努力,不要辜负了我们这些老用户的支持。
 

2005年12月7日星期三

实行手机实名制的杂感

  最近关于手机实名制的消息越来越多,根据广州日报消息说,手机实名登记制度可能将在本月底强制实施,新老用户都必须进行身份登记。未登记手机用户在三个月内去运营商营业厅或代理点办理身份注册手续,否则将会被终止服务,受此影响的将有全国约2亿个左右的未登记用户。

  我自己现在使用的是神州行卡,当初我注销了全球通而改用神州行,其中一个很大的原因,就是因为神州行话费能及时掌控,私密性强,使用方便等特点。目前不登记名字的卡类用户占总用户数70% 以上,约2亿用户,可以说是中国移动的摇钱树。如果严格实施手机实名制政策,对于已经上市的移动公司来说无异于一刀砍倒了自己的摇钱树,所以目前两大移动运营商自己就很抵制这项政策,信产部要强行推行手机实名制的话,需要先摆平中国移动再说。如果中国移动消极处理,那么这项政策即使实施,也会变成一阵风似的走过场。

  不过目前的诈骗短信和“不良信息”也的确泛滥成灾,其中一个典型的案例是“银行信用卡消费诈骗”,即诈骗人发送“您的银行卡在某商场消费××××元,如有疑问请咨询××××……”的短信给手机用户,如果用户信以为真,打电话咨询,则诈骗人装扮为银行工作人员,谎称其信用卡可能被盗用,让其迅速找到一台ATM机后,将钱转移到某个“安全账户”上。如果用户转帐了,那么他的钱就化为乌有了。

  手机实名制对这种诈骗会起作用吗?很简单就可以分析出来,银行实行实名制已经很长时间了,而犯罪分子目前依然可以用假身份证骗过银行工作人员,并开始成功诈骗,那么手机实名制比银行的实名制难道更有效吗?犯罪分子既然连银行的实名制都可以骗过,那么手机实名制又算的了什么呢?

  既然是骗子,自然会有隐藏的办法,否则骗子也就成为正当商人了。骗子只要弄个假身份证、弄个别人的身份证,自然就能购买到手机卡了。这年头,除了骗子多,盗贼也不少,当盗贼与骗子融为一体,身份证这东西,似乎是要多少有多少了。

  除此以外,监管的困难对实名制的实施是致命打击。市场的竞争是无情的,现在连小卖部都可以卖手机卡,而且甚至比去营业厅购买更便宜。只要能赚钱,对于这些小型经销商来说,自然会想法设法为用户开户。另外,即使在营业厅,对身份证的查验有多严格呢?基本上只需要复印件就可以了,更多的只需要填写号码就可以开通办理。

  打击违法短信不是一朝一夕可以完成的,自古以来,骗子就一直存在,肯定不可能冀望通过实名制就能解决的问题。如果骗子实行诈骗需要高成本、高风险的话,自然就没那么猖獗了。改善市场秩序,提高消费者素质,努力建造一个诚信的社会,违法短信自然会减少,上当受骗的人也会减少很多。

  然而可惜的是,在中国建造一个诚信社会是多么的困难。所谓上梁不正下梁歪,那些当官的自己都不说实话、不说真话,干的是贪污受贿、违法乱纪的勾当,在这个社会上敢说真话的人也没有好下场,这样的社会氛围,建造诚信社会无异于痴人说梦。

  建造诚信社会就需要提高人民的素质,如何提高人民的素质,这里又说到了一个老话题:教育。教育是立国之本,我们目前的所谓的“教育产业化”的政策是一个彻头彻尾祸国殃民的亡国政策。它让大多数贫苦的人民无法接受更多的教育,通过知识改变命运的道路被封死了。国家财政在教育上的预算在全世界范围内是倒数的几名,只有2%左右。而我们的各级政府官员则全然蔑视中央多如牛毛的“三令五申”禁令,奢糜享乐,挥霍开支,修建这种所谓的“形象工程”和“豆腐渣工程”,从中捞取好处。连希望工程的捐款居然也有人在贪污挪用,人心已经败坏了,做再大的恶行也不会在良心上产生任何犯罪感了。

  不肯花教育的钱,那就要多盖监狱了。由于教育的失败,由于缺乏内在道德约束力和外部公正昌明法制体系,从政府官员、执法人员、到工人、农民等都已不能切实履行各自在社会中应当承担的义务和责任。一方面市场没有秩序,政府行政干预,每一次干预无非是要拔一次毛,收一次买路钱。另一方面,道德沦丧,做生意不讲信誉,欺骗行为无所不在。国家几乎天天都有枪决人犯,但歪风邪气却刹不住,国家的治安成本,国家机器成本日益升高。

  中国的教育,早一日投入,早一日得利。今日图省钱,不投资办教育,日后将不得不投钱去盖“监狱”,目前的“教育产业化”政策是一个彻头彻尾祸国殃民的亡国政策,如果我们的执政者再不亡羊补牢的话,那么不要问丧钟是为谁而鸣,它就是为你而鸣!

2005年12月6日星期二

Google Picasa:免费图像管理软件

  Google总是在给竞争对手带来恶梦,和Google处于同一个时代是不少软件商的心头之痛:“当你某天早上醒来,忽然发现你所出售的东西人家在免费提供……那么后果可想而知。”

  ACDSee这个老牌的图片浏览器也迎来了自己的恶梦:虽然ACDSee的市场占有率还是相当高,但搜索巨头Google推出了免费的图像管理软件Picasa

  Picasa原本是Picasa公司的同名收费软件,去年Google收购了Picasa以后,不仅把它的名字改为了Google Picasa,而且还把它更改为免费软件供大家使用。

  Picasa是一个便捷、高效和快速的图像管理软件,由于对图像采用了全新的组织方法和查看方法,所以一些习惯了ACDSee的朋友总觉得它不够方便。下面是笔者在使用当中总结的一些经验和技巧,希望能对大家使用Picasa有所裨益。

  图片组织、管理和查看方法的剧变

  大多数人有这样的经验,看到硬盘里成堆的图片,虽然非常有成就感,但心里也不乏有一丝的沉重:我需要的图片在哪里呢?很多朋友就很有经验,他们会把图片分类归档。但是倘若你想欣赏图片呢?完了,得需要在不同的窗口里频繁地切换。保存图片也如恶梦来临,不同的图片需要按照每个人自己的习惯分类收藏。可以说,整理图片决不会是你想像的那么轻松,特别是那些由于工作而需要处理大量图片的朋友。于是,图片管理的概念也就诞生了,随之而来的就是图片管理软件。

  Picasa提供了全新的图片组织和管理的方法。Picasa安装后,它会扫描硬盘上全部的文件夹或您指定的文件夹,并把扫描到的图片以文件夹为组织单位按时间的先后顺序放到图片集“硬盘上的文件夹”中。Picasa为我们提供了全新的图片查看方法——按时间顺序查看。左侧的图片文件夹是按照文件夹时间进行排序的,单击窗口左侧的图片文件夹就可以看到其中的图片缩略图。

  快速的图像预览

  Picasa采用了一种独特的缓存机制,正是因为这种全新的缓存机制才使Picasa能够瞬间显示所有图片的缩略图,其浏览速度快到了令人难以致信的程度,如果和Windows自带的“缩略图”的显示速度对比,起码差距在百倍以上。

  当然,这种缓存机制也是有代价的,在第一次使用Picasa时软件会扫描搜索计算机上兼容的图片文件,在Picasa的使用过程中,软件会监控新增加的图片并把它们添加到相应的图片集中,其都要花费一定的时间,但个人感觉这很值得。

  傻瓜型的图像编辑功能

  Picasa预置了三类(基本修正、微调、效果)功能让我们来修正和编辑图像,利用这些功能,通过简单的单次点击就可获得震撼的图像效果。更有甚者,单击“手气不错”按钮,Picasa会自动修改图片使图片的颜色和对比度达到最理想的状态。当然,比起专业而复杂的Photoshop图像处理软件,Picasa的图像编辑功能看起来的确很简单,但是大多数用户还是很喜欢简单易用的软件。

  完美的图像导出功能

  浏览到好的图片之后,如果想与朋友们分享,Picasa就提供了丰富的共享和导出功能,比如通过电子邮件发送图片、发布图片到网站等等。

  其图片导出功能可以将选定图片导出到指定文件夹中,值得注意的是,导出时候可以选择调整图像大小,将大小不一的图像导出为指定宽度的图像,这是一个非常有用的功能,类似“JPEG Resizer”这样的修改图片大小的共享软件又要倒霉了。

  另外一个导出到网页的功能也很值得注意,此功能将选定图片定制导出为一个可以直接浏览的网页文件,我试用了一下,效果很不错,将图片发布到网站上去就显得更容易了。

  多格式兼容

  Picasa不仅支持TIF,TIFF,BMP,GIF,JPEG,PSD,PNG等图片文件,还支持AVI,MPG,ASF,WMV等电影格式。当然,Quicktime的MOV它也不会放过。Picasa不但完全支持中文(简体及繁体),而且还支持荷兰语、英语、法语、德语、意大利语、日语、韩语、葡萄牙语、俄语以及西班牙语。

  总的来说,Picasa是一款相当出色的软件,华丽的界面,傻瓜式的操作非常容易上手,软件小巧玲珑,运行速度快似流星。功能比ACDSee强大的多。不过可能正是因为功能多,所以使用起来有些复杂,对于低端用户可能不很方便。很多人只需要一个简单易用的图像浏览器。但我相信,Google凭借Picasa还是会给ACDSee等软件造成相当大的冲击。

  看了我介绍的Google Picasa的这么多功能,大概大家都心动来吧,那么还等什么呢?赶快行动吧。现在就下载最新的中文版Google Picasa吧。

深圳儿童公园游记

  今天带着全家去本地唯一的儿童公园去玩。

  深圳儿童公园位于深圳市罗湖区笋岗东雅园立交桥附近,面积近6万平方米,它是深圳市区儿童主要的游乐场所之一,是深圳面积最小的市政公园。园内的游乐项目有十余项,包括小火车、单、双人童车、戏水池、碰碰车、观缆车、激流涌进、海盗船、动物世界、金龙滑车、幸福快车等。

  公园位于罗湖区,坐车到那里时候已经中午了,只好先去吃饭。儿童公园对面只有一个麦当劳,进去后发现麦当劳居然还在贩卖可以致癌的炸薯条给儿童吃,看来麦当劳的道德良心连肯德基都不如啊,至少肯德基好久前都不贩卖致癌薯条了。另外麦当劳送了个洛克人玩具还挺有意思,不过现在的小朋友都不玩洛克人游戏了,他们都去玩网络游戏去了。

洛克人

  儿童公园和本地大多数公园一样,是免费开放的,只有里面的游乐项目是收费的。公园已经有了近二十年的历史了,显得有一些破旧了,看看这个大门,够寒酸的吧。

儿童公园

  儿童公园里面的游乐项目不多,就几个,价格不贵,其中最贵的“激流勇进”是八块钱,不过一般都需要购买双份票,因为好多项目需要大人陪同。

儿童公园游乐项目

  这个“激流勇进”当然不能和欢乐谷的“激流勇进”相比了,其落差和刺激度都小很多,适合儿童玩。

激流勇进

  小火车这个项目可真幼稚的可以啊。看看这辆火车,还真象那么回事呢。

小火车

  还是海盗船看上去刺激一些,不过不敢让小孩子玩。

海盗船

  明明这个游乐项目是旋转木马,却起名字叫动物世界,真奇怪啊。

旋转木马

  游乐项目少而人却很多,小朋友们你争我抢,一部小小的滑梯居然有二三十个孩子在“高效”使用。

滑梯

  儿童公园的项目的确是够陈旧的,不过这些项目小朋友们还是瞒喜欢的,我陪着玩也累的腰酸背疼的,一个下午就这么过去了。

  回家的车上,儿子在我怀里睡着了,他大概也玩累了,真是幸福的一代人啊。

2005年11月29日星期二

电信级的网络弹出广告

  我是用中国电信的ADSL上网的,一直碰到一个奇怪的现象:我自己的网站并没有弹出广告代码,但是我浏览自己的网站时候,偶尔会弹出一个类似“绿色上网”等的广告窗口。我查看我网页的源代码,没有弹出广告代码,再刷新网站,又没有广告弹出了。

  上网搜索了一下,发现不少人也遇到这种情况,这种广告非常隐蔽,一般人不会注意到,只是以为该网站有弹出广告。而实际上网站并没有弹出广告。该广告的地址是以http://pbvertisegreen.139.com/push/开头的,一般是深圳电信自己的垃圾广告,投放隐蔽,且没有成本。

  这种广告实际上是电信局在电信级网关路由器上安放的,我分析其原理如下:用户刚拨号上网的时候,访问的第一个网站时,电信局在这个网站的HTTP包中增加一段弹出代码,弹出广告后再自动转移到正式的网站。弹出广告也有一定随机性,不是每次都弹出,而是随机挑选某些HTTP包进行拦截,所以通常我们再次刷新会发现没有广告弹出。

  这种广告手段是很卑劣的,并且也是违法的。电信局肯定也知道这一点,因此这种广告投放的非常隐蔽:浏览一个网站的时候才弹出,让别人误以为是这个网站的广告;并不是每次都弹出,而且弹出也没有什么规律性,以免引起用户注意;弹出代码使用技术进行隐藏,让别人找不到证据。

  这样的广告方式据说不少ISP都采用,我想大多数上网者都遇到过,由于其广告是在电信的路由器上安放的,因此很难屏蔽。不过并不是说我们一点办法也没有。最好的办法,就是抵制这个ISP,拒绝使用其服务。其次,安装GOOGLE工具条,GOOGLE工具条可以屏蔽大部分弹出广告。

2005年11月27日星期日

搜索引擎技术揭密:中文分词技术

  信息的飞速增长,使搜索引擎成为人们查找信息的首选工具,Google、百度、中国搜索等大型搜索引擎一直是人们讨论的话题。随着搜索市场价值的不断增加,越来越多的公司开发出自己的搜索引擎,阿里巴巴的商机搜索、8848的购物搜索等也陆续面世,自然,搜索引擎技术也成为技术人员关注的热点。

  搜索引擎技术的研究,国外比中国要早近十年,从最早的Archie,到后来的Excite,以及altvista、overture、google等搜索引擎面世,搜索引擎发展至今,已经有十几年的历史,而国内开始研究搜索引擎是在上世纪末本世纪初。在许多领域,都是国外的产品和技术一统天下,特别是当某种技术在国外研究多年而国内才开始的情况下。例如操作系统、字处理软件、浏览器等等,但搜索引擎却是个例外。虽然在国外搜索引擎技术早就开始研究,但在国内还是陆续涌现出优秀的搜索引擎,像百度(http://www.baidu.com)等。目前在中文搜索引擎领域,国内的搜索引擎已经和国外的搜索引擎效果上相差不远。之所以能形成这样的局面,有一个重要的原因就在于中文和英文两种语言自身的书写方式不同,这其中对于计算机涉及的技术就是中文分词。

  什么是中文分词

  众所周知,英文是以词为单位的,词和词之间是靠空格隔开,而中文是以字为单位,句子中所有的字连起来才能描述一个意思。例如,英文句子I am a student,用中文则为:“我是一个学生”。计算机可以很简单通过空格知道student是一个单词,但是不能很容易明白“学”、“生”两个字合起来才表示一个词。把中文的汉字序列切分成有意义的词,就是中文分词,有些人也称为切词。我是一个学生,分词的结果是:我 是 一个 学生。

  中文分词和搜索引擎

  中文分词到底对搜索引擎有多大影响?对于搜索引擎来说,最重要的并不是找到所有结果,因为在上百亿的网页中找到所有结果没有太多的意义,没有人能看得完,最重要的是把最相关的结果排在最前面,这也称为相关度排序。中文分词的准确与否,常常直接影响到对搜索结果的相关度排序。笔者最近替朋友找一些关于日本和服的资料,在搜索引擎上输入“和服”,得到的结果就发现了很多问题。下面就以这个例子来说明分词对搜索结果的影响,在现有三个中文搜索引擎上做测试,测试方法是直接在Google(http://www.google.com)、百度(http://www.baidu.com)上以“和服”为关键词进行搜索:

  在Google上输入“和服”搜索所有中文简体网页,总共结果507,000条,前20条结果中有14条与和服一点关系都没有。

  在百度上输入“和服”搜索网页,总共结果为287,000条,前20条结果中有6条与和服一点关系都没有。

  在中搜上输入“和服”搜索网页,总共结果为26,917条,前20条结果都是与和服相关的网页。

  这次搜索引擎结果中的错误,就是由于分词的不准确所造成的。通过笔者的了解,Google的中文分词技术采用的是美国一家名叫Basis Technology(http://www.basistech.com)的公司提供的中文分词技术,百度使用的是自己公司开发的分词技术,中搜使用的是国内海量科技(http://www.hylanda.com)提供的分词技术。由此可见,中文分词的准确度,对搜索引擎结果相关性和准确性有相当大的关系。

  中文分词技术

  中文分词技术属于自然语言处理技术范畴,对于一句话,人可以通过自己的知识来明白哪些是词,哪些不是词,但如何让计算机也能理解?其处理过程就是分词算法。

  现有的分词算法可分为三大类:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。

  1、基于字符串匹配的分词方法

  这种方法又叫做机械分词方法,它是按照一定的策略将待分析的汉字串与一个“充分大的”机器词典中的词条进行配,若在词典中找到某个字符串,则匹配成功(识别出一个词)。按照扫描方向的不同,串匹配分词方法可以分为正向匹配和逆向匹配;按照不同长度优先匹配的情况,可以分为最大(最长)匹配和最小(最短)匹配;按照是否与词性标注过程相结合,又可以分为单纯分词方法和分词与标注相结合的一体化方法。常用的几种机械分词方法如下:

  1)正向最大匹配法(由左到右的方向);

  2)逆向最大匹配法(由右到左的方向);

  3)最少切分(使每一句中切出的词数最小)。

  还可以将上述各种方法相互组合,例如,可以将正向最大匹配方法和逆向最大匹配方法结合起来构成双向匹配法。由于汉语单字成词的特点,正向最小匹配和逆向最小匹配一般很少使用。一般说来,逆向匹配的切分精度略高于正向匹配,遇到的歧义现象也较少。统计结果表明,单纯使用正向最大匹配的错误率为1/169,单纯使用逆向最大匹配的错误率为1/245。但这种精度还远远不能满足实际的需要。实际使用的分词系统,都是把机械分词作为一种初分手段,还需通过利用各种其它的语言信息来进一步提高切分的准确率。

  一种方法是改进扫描方式,称为特征扫描或标志切分,优先在待分析字符串中识别和切分出一些带有明显特征的词,以这些词作为断点,可将原字符串分为较小的串再来进机械分词,从而减少匹配的错误率。另一种方法是将分词和词类标注结合起来,利用丰富的词类信息对分词决策提供帮助,并且在标注过程中又反过来对分词结果进行检验、调整,从而极大地提高切分的准确率。

  对于机械分词方法,可以建立一个一般的模型,在这方面有专业的学术论文,这里不做详细论述。

  2、基于理解的分词方法

  这种分词方法是通过让计算机模拟人对句子的理解,达到识别词的效果。其基本思想就是在分词的同时进行句法、语义分析,利用句法信息和语义信息来处理歧义现象。它通常包括三个部分:分词子系统、句法语义子系统、总控部分。在总控部分的协调下,分词子系统可以获得有关词、句子等的句法和语义信息来对分词歧义进行判断,即它模拟了人对句子的理解过程。这种分词方法需要使用大量的语言知识和信息。由于汉语语言知识的笼统、复杂性,难以将各种语言信息组织成机器可直接读取的形式,因此目前基于理解的分词系统还处在试验阶段。

  3、基于统计的分词方法

  从形式上看,词是稳定的字的组合,因此在上下文中,相邻的字同时出现的次数越多,就越有可能构成一个词。因此字与字相邻共现的频率或概率能够较好的反映成词的可信度。可以对语料中相邻共现的各个字的组合的频度进行统计,计算它们的互现信息。定义两个字的互现信息,计算两个汉字X、Y的相邻共现概率。互现信息体现了汉字之间结合关系的紧密程度。当紧密程度高于某一个阈值时,便可认为此字组可能构成了一个词。这种方法只需对语料中的字组频度进行统计,不需要切分词典,因而又叫做无词典分词法或统计取词方法。但这种方法也有一定的局限性,会经常抽出一些共现频度高、但并不是词的常用字组,例如“这一”、“之一”、“有的”、“我的”、“许多的”等,并且对常用词的识别精度差,时空开销大。实际应用的统计分词系统都要使用一部基本的分词词典(常用词词典)进行串匹配分词,同时使用统计方法识别一些新的词,即将串频统计和串匹配结合起来,既发挥匹配分词切分速度快、效率高的特点,又利用了无词典分词结合上下文识别生词、自动消除歧义的优点。

  到底哪种分词算法的准确度更高,目前并无定论。对于任何一个成熟的分词系统来说,不可能单独依靠某一种算法来实现,都需要综合不同的算法。笔者了解,海量科技的分词算法就采用“复方分词法”,所谓复方,相当于用中药中的复方概念,即用不同的药才综合起来去医治疾病,同样,对于中文词的识别,需要多种算法来处理不同的问题。

  分词中的难题

  有了成熟的分词算法,是否就能容易的解决中文分词的问题呢?事实远非如此。中文是一种十分复杂的语言,让计算机理解中文语言更是困难。在中文分词过程中,有两大难题一直没有完全突破。

  1、歧义识别

  歧义是指同样的一句话,可能有两种或者更多的切分方法。例如:表面的,因为“表面”和“面的”都是词,那么这个短语就可以分成“表面 的”和“表 面的”。这种称为交叉歧义。像这种交叉歧义十分常见,前面举的“和服”的例子,其实就是因为交叉歧义引起的错误。“化妆和服装”可以分成“化妆 和 服装”或者“化妆 和服 装”。由于没有人的知识去理解,计算机很难知道到底哪个方案正确。

  交叉歧义相对组合歧义来说是还算比较容易处理,组合歧义就必需根据整个句子来判断了。例如,在句子“这个门把手坏了”中,“把手”是个词,但在句子“请把手拿开”中,“把手”就不是一个词;在句子“将军任命了一名中将”中,“中将”是个词,但在句子“产量三年中将增长两倍”中,“中将”就不再是词。这些词计算机又如何去识别?

  如果交叉歧义和组合歧义计算机都能解决的话,在歧义中还有一个难题,是真歧义。真歧义意思是给出一句话,由人去判断也不知道哪个应该是词,哪个应该不是词。例如:“乒乓球拍卖完了”,可以切分成“乒乓 球拍 卖 完 了”、也可切分成“乒乓球 拍卖 完 了”,如果没有上下文其他的句子,恐怕谁也不知道“拍卖”在这里算不算一个词。

  2、新词识别

  新词,专业术语称为未登录词。也就是那些在字典中都没有收录过,但又确实能称为词的那些词。最典型的是人名,人可以很容易理解句子“王军虎去广州了”中,“王军虎”是个词,因为是一个人的名字,但要是让计算机去识别就困难了。如果把“王军虎”做为一个词收录到字典中去,全世界有那么多名字,而且每时每刻都有新增的人名,收录这些人名本身就是一项巨大的工程。即使这项工作可以完成,还是会存在问题,例如:在句子“王军虎头虎脑的”中,“王军虎”还能不能算词?

  新词中除了人名以外,还有机构名、地名、产品名、商标名、简称、省略语等都是很难处理的问题,而且这些又正好是人们经常使用的词,因此对于搜索引擎来说,分词系统中的新词识别十分重要。目前新词识别准确率已经成为评价一个分词系统好坏的重要标志之一。

  中文分词的应用

  目前在自然语言处理技术中,中文处理技术比西文处理技术要落后很大一段距离,许多西文的处理方法中文不能直接采用,就是因为中文必需有分词这道工序。中文分词是其他中文信息处理的基础,搜索引擎只是中文分词的一个应用。其他的比如机器翻译(MT)、语音合成、自动分类、自动摘要、自动校对等等,都需要用到分词。因为中文需要分词,可能会影响一些研究,但同时也为一些企业带来机会,因为国外的计算机处理技术要想进入中国市场,首先也是要解决中文分词问题。在中文研究方面,相比外国人来说,中国人有十分明显的优势。

  分词准确性对搜索引擎来说十分重要,但如果分词速度太慢,即使准确性再高,对于搜索引擎来说也是不可用的,因为搜索引擎需要处理数以亿计的网页,如果分词耗用的时间过长,会严重影响搜索引擎内容更新的速度。因此对于搜索引擎来说,分词的准确性和速度,二者都需要达到很高的要求。目前研究中文分词的大多是科研院校,清华、北大、中科院、北京语言学院、东北大学、IBM研究院、微软中国研究院等都有自己的研究队伍,而真正专业研究中文分词的商业公司除了海量科技以外,几乎没有了。科研院校研究的技术,大部分不能很快产品化,而一个专业公司的力量毕竟有限,看来中文分词技术要想更好的服务于更多的产品,还有很长一段路。

  作者:Winter