2010年4月8日星期四

传雅虎将收购地理定位网站Foursquare

  据美国科技博客网站Silicon Alley Insider(SAI)报道,消息人士周二透露,Yahoo正考虑收购手机地理位置服务商Foursquare,出价为1亿美元左右。

  SAI援引知情人士的表述称,Yahoo收购Foursquare的主要目的是:大力提高Yahoo手机互联网业务实力。该消息来源称,Yahoo已就该收购意向同Foursquare高管层进行了接触。但知情人士特别指出,除Foursquare外,Yahoo也同其他类似潜在收购目标举行了商谈。

  上周期间,Foursquare联合创始人兼CEO丹尼斯·克罗利(Dennis Crowley)同硅谷多家知名科技公司进行了接触,其中包括苹果、Facebook和Twitter等等。对于Yahoo计划收购Foursquare的传闻,克罗利拒加评论。

  收购目的

  SAI认为,如果Yahoo能够成功收购Foursquare,将使Yahoo有能力向所有移动设备提供各类互联网服务。通过这种方式,YahooCEO卡罗尔·巴茨(Carol Bartz)将向员工及华尔街分析师证明,她确实正致力于Yahoo的技术创新。

  SAI指出,自Yahoo收购图片共享网站Flickr和社交书签服务网站Delicious以来,该公司一直没有针对消费市场推出过其他很有影响力的产品。在2007年之前,Yahoo本来有机会以10亿美元收购Facebook,但Yahoo时任CEO特里·塞梅尔(Terry Semel)认为该价格过高,且Facebook联合创始人马克·扎克伯格(Mark Zuckerberg)还开出了其他条件。

  情况不同

  克罗利也是另一家手机地理位置服务商Dodgeball的创始人,数年前Dodgeball被谷歌收购。克罗利近日在接受SAI的采访时表示,当初之所以将Dodgeball出售给谷歌,是因为Dodgeball无法获得任何风险投资。

  但现在Foursquare的情况却大为不同。近日有报道称,Khosla、Accel和Andreessen Horowitz等三家风险投资公司都希望获得向Foursquare投资的优先权,这些风险投资公司对Foursquare的估值为8000万美元以上。SAI认为,克罗利可利用Yahoo1亿美元的出价,要求投资者进一步提高对Foursquare的估值。

  对于上述传闻,Yahoo一位发言人拒加置评。

  来源地址:腾讯科技

  我对Yahoo此次行动的评价是:Yahoo其实才是真正的Web2.0网站杀手,毁了Flickr、Delicious、MyBlogLog 之后,又开始毁Foursquare了。哪位神仙赶快把Yahoo给收了吧。

2010年4月6日星期二

手机充值卡背后的渠道暗战

  这事儿是我昨天回家充话费的时候想到的,现在充值话费的渠道已经愈发多样化,而各种渠道之间的差异和竞争更是值得玩味。

  先来看一下我们现在可用的手机充值方式:

  营业网点(直冲、充值卡)

  传统线下渠道:便利商店(充值卡)、空中充值(直冲)

  第三方网上充值(C2C、B2C商城以及网银)(直冲、充值卡)

  运营商网上充值(直冲、充值卡)

  第一种也就是最传统的营业网点充值受限于成本和营业厅数量,覆盖人群有限,适合那种习惯去营业厅缴费的人使用,属于在未来会被越来越边缘化的一种充值缴费模式,现在很多朋友一年都不会去一次营业厅。

  第二种传统的线下渠道,例如手机通讯店、超市、报亭、便利商店。他们仍然占据很大的市场份额,他们的优势是几乎能覆盖所有地区,而且并不需要运营商去作额外的投入,也即零成本销售,但是会涉及到利润被销售代理商给分走一部分。

  第三种是现在用比较多的,各种第三方的网上充值,例如你可以在淘宝寻找卖家,或者在网上银行进行充值。优势是方便快捷,足不出户即可充值,缺陷是各种商家素质良莠不齐,在规则不是那么明确的情况下有上当受骗的可能,但是如果你是网购达人仍然可以通过购买自动发货商家的宝贝等方式来避免损失。

  同时第三种方式也有一个重要的特点,那就是那些商家大部分也有实体店,他们是线下线上同步展开,互联网只是他们新开拓的一个销售渠道。

  第四种就是运营商通常会提供网上的充值方式,也可以获取一定的折扣。安全方便,在未来有极大的发展空间。

手机充值卡

  ——萝莉控的分割线——

  看完各种充值方式,我们再来看看各个渠道之间的斗争。

  营业网点VS其他渠道

  营业网点覆盖窄、成本高、时间长,已经逐渐被其他充值缴费方式所取代,正如之前所述营业厅将会逐渐回到纯粹的业务办理,通过其他渠道不断吸收客户也有利于提高服务品质和降低服务成本。

  线下渠道VS网络渠道

  线下渠道现在仍然是不错的选择,至少在一段时间内它还将顽强地生存下去,因为我们没有办法保证随时随地的互联网和支付方式。但是可以预期的是它的市场空间一定会被网络渠道大幅打压,足不出户、更低的价格(尽管只有几毛钱)都成为网络渠道兴盛的理由。

  第三方网络渠道VS运营商网络渠道

  至少现在看来,第三方网络渠道的发展势头不错,不过运营商是处于产业链的上游,未来想要争夺市场并不是不可能的事情。运营商的优势是价格自由度大、充值快速安全,根据我个人的体会,四川联通的网上营业厅充值价格与淘宝持平,甚至还更低一些,甚至我还可以到营业厅索取发票。

  ——御姐控的分割线——

  不论怎么竞争,运营商都是利字当头,节约成本和增加利润需要同步进行。未来的趋势是,进一步减少对线下与传统营业网点的依赖,大力发展网络充值从而有效降低成本。并且在不影响大局的前提下发展自建网络渠道,再次降低成本。

  不过运营商再强势也不可能把所有市场霸占,只有团结好线上线下各大代理商,才能真正将这块市场蛋糕做大,一个合适的度是很多运营商正在思考的问题。

  来源:XJP投稿,原文地址

2010年4月5日星期一

未来移动运营商可能面临的三大难题

  这几年的移动电信行业的政策,例如降低漫游费、取消不合理收费等等,都是为了将自主权重新交还到消费者手中,进一步促进市场竞争、取消影响市场竞争的门槛,从而让消费者获益。

  未来两年时间内,最可能出台的政策是携号转网,这一政策是为了破除消费者切换运营商的成本障碍,让消费者可以在不换号的情况下自由选择移动运营商。除了号码以外,号码的地域限制也成为阻碍运营商公司之间竞争的一个障碍。

  例如,李小姐在成都拥有号码A,她准备前往北京发展,如果她不想忍受高额的漫游费就必须重新购买号卡。这是由于政策限制带给消费者的不便,也影响了消费者的对于运营商的自由选择权利。

  所以,除了本地携号转网以外,未来可能颁布不同地区、不同运营商之间的自由转网(过户)的政策,这样的政策一方面可以最大限度保障消费者的利益,更重要的是可以通过政策放开进一步促进移动运营商之间的自由竞争,提高服务品质与忧患意识。

移动运营商

  面临越来越开放的市场政策,移动运营商可能会三大难题:

  难题一:现有业务系统以及产品套餐的更新

  现在三大运营商的3G套餐都有淡化漫游费的趋势,如果未来不同地区、不同运营商之间互通开放之后,现有的大部分产品资费将会需要进行大幅更新,以适应新规下消费者的选择需要。包括取消漫游费,本地通话的定义(用户拨打/接听所在地为本地)等等。

  另外现有的网上业务系统可能也需要进行同步更新,例如我需要可以全国任何地方都可以充值花费,我需要可以在网上营业厅直接办理转入与转出手续,类似域名的自助转移流程。

  难题二:无法通过号码区分用户归属地及运营商

  现在很多拥有智能手机的朋友都会安装归属地查询软件,你可以快速查询某个联系人的所在地和运营商,其实质是一个包含了各地运营商的号码分配规律的数据库。

  但是一旦不同地区、不同运营商之间互通开放之后,手机号与地区、运营商信息之间的对应关系将不复存在,我们将不能通过号码来判断用户归属地以及运营商。不过对于运营商自己来说,仍然可以通过查询基站和通话信息来获得这一信息。

  难题三:跨地区结算大幅增加

  如果实现一号行全国的话,那必然跨地区结算会大幅增加,对于结算系统的及时性、准确性将会有新的要求。

  此外,各运营商的各地分公司的现行利益分配模式不能符合新模式下的需求,制定新的利益分配模式对于激励员工、保障分公司利益有重要意义。

  ——结束的分割线——

  我们总在向往国外的廉价资费和优质服务,尽管我们现在仍然处于发展初级阶段,但是对于电信业的市场化竞争的促进,在政策层面的引导都是必须的。

  临渊羡鱼,不如退而结网。

  来源:读者XJP投稿,原文地址

2010年4月4日星期日

探索中国独立博客的发展

  年前国内互联网严打,很多个人网站(包括独立博客)关掉,跟着又传网络新规“没有一百万不要搞论坛”,这些不利因素让人感到中国独立博客的发展是不 容乐观的。尽管如此,但是换个角度去看,社会的发展总是要朝向文明的方向去发展,独立博客是不可能全部关闭的。

  什么是独立博客?在这个词条还没有编入中国的辞海之前,可以引用维基百科的说明“独立博客一般指在采用独立域名 和网络主机的博客,既在空间、域名和内容上相对独立的博客。独立博客相当于一个独立的网站,而且不属于任何其他网站。相对于BSP下的博客,独立博客更自 由、灵活,不受限制”。

  从这个定义来看,独立博客的信息危害性要远远低于论坛,如果要关闭独立博客,也是应该要先关掉论坛。如果一个独立博客发布了不法信息,很容易追查, 要直接负责的也就是博主。而一个论坛如果有几十万会员,要追究当事人的直接责任是比较复杂的。

  中国独立博客的发展,在宏观方面的问题是让博客健康化发展,形成管理 规范和得到保护;而在微观方面的问题是一个独立博客如何生存发展,可以走向职业博客。为此,简哲提出如下几点思考:

  一、 博客协会

  独立博客可以成立博客协会,正规注册,吸收会员。中国是一个协会特别多的国家,成立协会从某种层面来讲就是这个行业或产业要规范发展,走向良性发 展。

  谁能为中国独立博客谋利益,走向正常化发展?还是需要有一个博客协会。不然,中国独立博客仍是一盘散沙,对明天的发展没有想象,只有担忧和顾忌。

  与其处于发展的茫然,不如主动提出管理规范化,让博客也能成为职业。

  一旦成立博客协会,这需要有发展基金才能确保博客协会得以运作,并保持可持续发展。关于资金的来源:前期可通过社会捐助,成立博客协会后可以收取会 员费用,博客内容可以用于商业出版,博客协会也可以推出联盟产品,如广告和付费写作等推广产品,相关博客的域名、虚拟主机销售。目前很多博客的创作内容都 没有得到版权保护,今后或许可以授权给博客协会代理,负责商业出版及侵权索赔的法律事务。当博客的网站被空间服务商无故关掉,博客可以寻求博客协会的帮 助,甚至是代理法律诉讼及索赔。如能做到这样,便会有更多的博客愿意加入博客协会。

  当下的中国互联网,有财力做博客协会的很多,但是对互联网有发展雄心的不多,假设周鸿祎创建博客协会,在国内很容易催生第五门户。因为借助博客资 源,可以获得内容和整合资源;在博客放置搜索服务和搜索联盟的广告,可以把搜索引擎推广出去。通过团队化的运作,可以让BSP的名人博客再开设独立博客 (从产品上可以设计为绑定个人域名的个人门户,可以通向他的新门户)。据cnnic调查:截至2009年12月,博客应用在网民中的用户规模达到2.21 亿。按周鸿祎的产品线,若成功借道博客,打造出新门户的机会是很大的。

  二、绿色认证

  独立博客在网站上引用博客协会的认证,表示这个独立博客没有不法信息或木马病毒。通过绿色认证的标志,网民发现不法信息或木马病毒,可以直接向博客 协会举报,博客协会查实后可以停止违规博客继续引用绿色认证。

  三、现时中国独立博客的盈利方式

  现时独立博客的盈利方式主要有如下几种:站点广告、付费文章、活动组织(购物)、销售商品及网站业务。

  1.站点广告

  例如销售网站固定的广告位,广告联盟广告(如Google AdSense、当当)。

  2.付费文章

  美国的“软文”市场很大,据称达到了两百多亿美元。但是,从国内提供付费文章经营业务的网站来看,独立博客通过这种方式获得的收入并不多。一是付费 文章的任务不多,二是稿酬低。对于普遍的独立博客而言,与其写软文,还不如向出版媒体投稿,或者成为付费内容网站(如起点网)的作者。

  从长远来看,国内的“软文”市场也会增长,对于流量大、知名度的博客而言,他们不用担心“软文”收入。

  3.活动组织(购物)

  这些独立博客应该是社区明星,擅长社交,利用社交资源发起活动,然后再获得业务提成。也可能就是购物狂人,或者是做类似淘宝客的业务。从某种角度而 言,他们是为了推广而做了独立博客。

  4.销售商品

  比较常见的是卖域名、主机、IT数码产品、手工艺品。

  5.网站业务

  设计业务:很多网页、平面设计师都在博客宣称提供设计业务。

  网络营销顾问业务:提供SEO、网络营销顾问服务也是常见的。

  经纪业务:如保险、二手车销售的博客。保险经纪会开一个博客大谈投资理财,然后欢迎你来咨询。

  专家业务:如律师、工程师博客。他们会通过在博客介绍案例、讲解专业知识来获得咨询,借此再获得业务成交。

  专业服务:英语达人会在博客上提示翻译服务,或者是本地的家教服务。很多具有专业技能的博客,几乎都在博客表示他们擅自于某项工作,明示或暗示有合 作的机会。试着回忆,你总会想起作家在博客上有图书销售的链接,职业写手表示愿意接活。

  四、当前职业博客的发展需要解决电子商务的应用

  简哲在分析多种原因后,发现中国职业博客的发展困境,除了政策环境的因素之外,中文博客的交易支付是个很大的问题。流量很大、知名度很高,这些不是 普遍的独立博客所拥有的,也就是通过网站广告和“软文”收入,不足以解决一个独立博客的生存发展。

  国外的博客可以在WordPress安装一个电子商务应用的插件,使用PayPal来完成最终的支付。中国的博客尽管同样可以在WordPress 安装电子商务的插件,但是由于中国网民爱用支付宝,WordPress安装的电子商务插件形同摆设。国产的Z-blog、PJblog、Bo-blog也是如此,连摆设也免了。

  现在国内还有人在开发新的博客程序,其实在博客发日志的方向,已经没有什么很大的创新突破,可以让博客放弃现在的程序来选择一个新的博客程序,可能 最好的机会就是在电子商务的突破。如果开发一个博客程序能实现商品销售(如 WordPress的e-Commerce)和付费阅读内容(如WordPress的Business Directory),那么这个新的博客程序还有出路,并且能得到商业发展。例如营业额不足1000元的免费,超过的则购买商业版权。另 外,国内做微支付的有很多家,找一家结盟,得到赞助,可在免费版推出独家接口,其它接口付费也行。

  像Z-blog这个程序,对搜索引擎支持很好,不少站长拿它做SEO 赚钱。如果Z-blog再走多一步,解决商品销售和付费阅读的问题,可能会飞跃发展。Z-blog现在的商业模式是主机和版权认证及增值服务,如果企业博 客流行,这种商业模式是不错的。

  如果一个博客程序不能解决电子商务的问题,那么中国独立博客将很难走向职业博客,普遍都会遇到发展瓶颈,无法实现成为职业博客。如果一个博客要用动易CMS或ShopEx,这个网站的站长还能叫独立博客吗?看一下国外WordPress的电子商务应用,不要怀疑博客要解决电子商务的应用。

  因此,中国独立博客若以博客为职业,在博客程序上还不具备良好的应用条件之下,作为国内网络支付代表的支付宝、财付通,有没有社会责任为独立博客提 供更完善的支付解决方案?例如WordPress的e-Commerce,谁可以完善它,添加支付宝、财付通的接口?微支付是网民的应用趋势,中国的博客 也超过两亿,为什么中国的独立博客却难以借道发展?中国的互联网,是缺少雷锋,还是缺少企业的远见?

  中国独立博客的未来,在于今天的创新和改变!

  作者:简哲,原文地址

2010年4月3日星期六

我们能用国外主机做点什么?

  为什么国外提供的服务器要比国内的idc空间流量都要大得多呢?动不动就是数十G的空间,数百G/月的流量,我总是用不完,说物美价廉一点也不过份啊,美的永远是商品,廉的不变是价格,我每个月能使用的连零头也不够,估计能用完这个流量的达人也不太多吧。这么大的空间,这么多的流量,放着多可惜,虽然价格低廉,可是总归是交了钱,总得想着法子用完才放心,请原谅我的无齿。

  看看咱们身处的网络环境,我们总是在一个被东西围起来的环境中,有没有想过,出去看一看呢?难道外面的世界,真如传说中一般的黑暗么?为什么我们不能以一种成熟的心态去看看别人怎么评价我们,去看看别人过什么样的生活,或者,看一些我们想看的东西。有时候,这种想法是一种奢侈,不管在任何地方,任何时间,总是有一只拥有无比魔力的手,在紧紧地拽着我们,对不起,这里你不能进去。oh my god,从小我就被这样管教过,你不能做……,总是盼望自己长大,这样就可以做自己想做的东西,说自己想说的话,可是没有想到,这个家长永远地存在。这个家长为了自己能够永远地担家长,也为了让家长们得到更多的好处,于是他们宣杨,在这个家庭里,只有我才能做家长,别人都不行,那种轮流坐庄的制度不适合我们,我们是受命于天。他们控制着我们的一切,他们害怕我们看到外面的阳光,让我们以为这个世界,只有自己家里最好。

  还好,我们有互联网,有无数的精英在奋斗,在为觉醒而奋斗,我们如同黑客帝国中的电池,在被机器控制的地方,你可以感觉到你在享受美食,你可以感觉到你的爱人,但,这一切都是假的,你不是你。我们需要真实的锡安,就算只能吃到粗米,但起码,这里是真实的。我不需要机器替我来选择,我有我自己的头脑,我是一个完整的人,我是一个能分辨是非的人,我需要的只是真实的感觉。

  拥有国外主机的人,你可以利用这个主机,来搭建一个探访锡安的电话线,如果你的主机还有SSL的话,比如Godaddy的用户,一般是买SSL来代替独立Ip的,那么你真是太幸运了。有一个叫Phproxy的程序,把它部署到你的服务器上之后,你就可以到达真实的锡安,看到任何你想要的东西,当然,你不能访问视频,更当然,还是有部分网站会导致程序出错无法访问,但是,你可以看到更多东西,好的,坏的,真的,假的,还有让人心神不宁的。

  中国文化的博大与精深在于,一个字可以有很多种意义,而在这个富有创造性的平台上,再加上我们富有创造性的人们,我们可以给一个字赋予太多太多的含义,如某位委员说,我们应该把3Q、槑之类的字禁掉,上帝啊,请原谅这位朋友的无知,因为他自己也不知道在做什么,他们是这个世界上最厉害的骗子,因为最厉害的骗子是把自己也骗了,有一种骗子,他相信他自己没有骗人,他被自己以及自己的团队给忽悠了,他认为自己是天使下凡来拯救黎民苍生,只可惜脑袋先着地了。他也太小看我们的智慧了,我们有太多太多的创造力,任何一个字,我们都可以赋予它新的含义,文字只是我们宣泄的一个载体,我们需要一种抗议,只是这种抗议是无声的,就像新浪会采用“评论15939条,显示123条”这种方式来表达默默的愤慨。

  我不知道是谁创造了佛跳墙这道菜,这个名字真是太有意思了,佛急了,也会跳墙的,何况你我?有主机的佛们,还在等待什么,需要看到真实的世界么?欢迎来到真实的世界。

  有一种鸟儿是永远也关不住的,因为它的每片羽翼上都沾满了自由的光辉。

  作者:conis,原文地址。版权声明:本文授转月光博客刊登,其他非授权网站媒体转载,需要添加作者网站地址http://iove.net,否则视为侵权。

获得来自搜索引擎的关键字

  一般情况下通过关键词进入的页面都是用户想要的内容,对于某些搜索搜录与关键词相关度不是很高的页面(例如列表页),我们需要根据用户搜索的关键词对用户进行引导,从而提高用户的体验,也可以提高网页的PV。

  本文的原理是通过获取来源页面,分析来源URL的结构,提取出关键字,这些都是比较简单的东西。本文阐述重点是如何区分出几种常见的URL编码方式,然后进行相应的解码。因为应用是在ASP中进行,因此本文若有代码相关的例子,均是在ASP下调试通过的。其他语言下思想相同,且实现相对简单些。

  提取各个搜索引擎的关键字

  现在的各大搜索引擎全是基于GET请求方式的,即在URL后面带有一串参数。例如:我搜索“秋寒博客”

  谷歌:http://www.google.cn/search?sourceid=navclient&hl=zh-CN&ie=UTF-8&rlz=1T4GGLL_zh-CN___CN352&q=%e7%a7%8b%e5%af%92%e5%8d%9a%e5%ae%a2

  百度:http://www.baidu.com/s?wd=%C7%EF%BA%AE%B2%A9%BF%CD

  必应:http://cn.bing.com/search?q=%E7%A7%8B%E5%AF%92%E5%8D%9A%E5%AE%A2&form=QBLH&filt=all

  谷歌和Google的 q=%e7%a7%8b%e5%af%92%e5%8d%9a%e5%ae%a2 ,百度的 wd=%C7%EF%BA%AE%B2%A9%BF%CD ,必应的 q=%E7%A7%8B%E5%AF%92%E5%8D%9A%E5%AE%A2 中带下划线部分就是关键词。 其他搜索引擎也大致相同,通过URL就可以看出关键词的字段是哪个,然后可以通过正则将关键词提出。

  提取主流搜索关键词的正则如下:

  (?:yahoo.+?[?|&]p=|openfind.+?query=|google.+?q=|lycos.+?query=|onseek.+?keyword=|search.tom.+?word=|search.qq.com.+?word=|zhongsou.com.+?word=|search.msn.com.+?q=|yisou.com.+?p=|sina.+?word=|sina.+?query=|sina.+?_searchkey=|sohu.+?word=|sohu.+?key_word=|sohu.+?query=|163.+?q=|baidu.+?wd=|baidu.+?kw=|baidu.+?word=|3721.com.+?p=|Alltheweb.+?q=|soso.+?w=|115.+?q=|youdao.+?q=|sogou.+?query=|bing.+?q=|114.+?kw=)([^&]*)

   以上正则是我根据网上的正则有所修改,让其支持soso、115、youdao、sogou、bing(必应)、114(或118114)这些搜索,感谢作者提供。因为网上转载太多,尚未注明原出处,因此我也无法标明原作者。

  编码类型的识别

  GB2312和UTF-8

  从上面的例子我们可以看出,同样是搜索“秋寒博客”,但是不同的搜索对URL编码后,形成的字符串也不同。谷歌和必应下面是“%e7%a7%8b%e5%af%92%e5%8d%9a%e5%ae%a2”,而在百度却是“%C7%EF%BA%AE%B2%A9%BF%CD”。相信对网页编码了解的朋友都应该了解这是怎么回事,不同的页面编码(charset)对相同的字符进行编码后,产生的编码也是不同的。UTF-8默认产生的是UTF-8的编码,默认解码也是UTF-8。GB2312等也一样的。谷歌和必应用的是UTF-8编码,而百度用的是GB2312编码,就造成了相同的关键词在不同的搜索下产生了不同的字符串。

  对于UTF-8和GB2312的解码都可以实现,但是如果不知道目标是什么编码方式,就不知道如何去解码了。如上面的两个字符串,初给你看,看不来是用何种编码方式。当然第一反应是通过搜索来判断编码方式,这种方法确实可行也有效。但是看看上面的正则,如果用这种方法,那么一个 if 后面要跟很多的 or 才行。网上一般用的也是这样的方法,我觉得这个不是最好的方法。我们得知的信息有:1、%xx%xx格式都是URL编码(UTF-8或GB2312);2、GB2312中汉字要两组%xx组成一个汉字,UTF-8要三组%xx组成一个汉字;3、如果用UTF-8解码方式去解GB2312的编码就会出现乱码。

  单从长度和编码的范围我们根本无法辨别编码方式,只能通过其他方式来判断。根据上面3点,我们可以做一个假设:如果用UTF-8解码方式来解GB2312的编码会出现什么情况?因为UTF-8是有三组%xx组成的,而GB2312是由两组%XX组成的,如果用UTF-8的解码方式去解GB2312且能解码成功,那解码后的字符的长度一定会变短。例如:GB2312URL编码的“秋寒博客”(%C7%EF%BA%AE%B2%A9%BF%CD)用UTF-8解码,若能解码成功,解码后的字符长度会是2个半汉字。如果不能解码成功,不用说就是GB2312编码方式了。

  OK,至此我们初步已经知道如何去识别URL的编码类型了,步骤如下:

  1、获取关键字编码串;

  2、取得编码串的组数(x),例如:“%C7%EF%BA%AE%B2%A9%BF%CD 为8组;

  3、用UTF-8解码方式去解取得的编码串;

  4、如果解码失败(即程序出错)跳到第 8 步;

  5、如果解码成功,取得解码后的字符串长度(y),与全面的编码串的组数除以3比较;

  6、如果 x!=y 那么跳转到第 8 步;

  7、如果 x=y 那么得到的字符串即为关键字;

  8、用GB2312方式解码,得到的字符串为关键字;

  上面步骤中,有几点需要注意:

  1、第1步中需要将非汉字的URL转义及英文去掉;

  2、第2、3、5步中的编码串为上面提到的字符串;

  3、第7、8步中解码需要对原字符串进行;

  UNICODE

  在测试的过程中,发现soguo从网页跳到图片去的时候,会将URL编码方式改为UNICODE。UNICODE的方式相对比较好区分,即判断是否为uxxxx或%uxxxx的形式即可。这个相对简单,只分享在ASP中的解码函数。

  以下代码来自CSDN论坛:

  方法一:

  response.Write vbsUnEscape("u5c0fu867eu7c73")

  Function vbsUnEscape(str)'解密

    dim i,s,c

    s=""

    For i=1 to Len(str)

      c=Mid(str,i,1)

      If Mid(str,i,2)="u" and i<=Len(str)-5 Then

        If IsNumeric("&H" & Mid(str,i+2,4)) Then

          s = s & CHRW(CInt("&H" & Mid(str,i+2,4)))

          i = i+5

        Else

          s = s & c

        End If

      ElseIf c="%" and i<=Len(str)-2 Then

        If IsNumeric("&H" & Mid(str,i+1,2)) Then

          s = s & CHRW(CInt("&H" & Mid(str,i+1,2)))

          i = i+2

        Else

          s = s & c

        End If

      Else

        s = s & c

      End If

    Next

    vbsUnEscape = s

  End Function

  方法二:

  s = "u5c0fu867eu7c73"

  s = Replace(s, "u", "%u")

  Response.Write Unescape(s)

  在C#中也没有发现能识别URL编码格式的函数或方法,不知在PHP和JAVA下有没有更好的方法呢?欢迎大家讨论。

  来源:读者沈力投稿,原文地址

2010年4月1日星期四

Google推出动物语言翻译

  Google 拥有悠久的愚人节历史和文化,一直以来,Google都会在4月1日愚人节的时候恶作剧,放出假新闻娱乐用户,今年也不例外。在今年的愚人节这一天,Google的愚人节搞怪动作几乎横跨了该公司的所有服务,下面,就让我们来具体看一下。
 
  Google推出动物翻译
 
  Google将通过向Android智能手机用户提供一款应用程序,去拉近人类与动物之间的距离,优化人与动物的交流方式。
 
  据了解,Android应用程序可把人类的常用词组或短语,翻译成动物(如猫)能够听得懂的语言。为此,Google技术开发团队将与全球顶级语言专家合作,力求开发出该动物语言翻译工具。

  Google更名为“Topeka”
 
  3月份,美国堪萨斯州首府托皮卡市市长宣布,托皮卡市要将名称改为Google,这令全世界吃惊。
 
  而4月1日,Google的首席执行官Eric Schmidt表示,我们高兴地宣布,从4月1日凌晨1点起,Google已正式将我们的名称改为“Topeka”。
 
  Schmidt指出,我们并不是轻率达成这个决议的,毕竟我们的旧名称拥有相当大的品牌资产。
 
  YouTube“TEXTp”选项
 
  为了缩减用户的带宽消耗,YouTube上的一些视频将会包含一个“TEXTp”质量设置,允许用户选择“TEXTp”的文本模式,去通过文本的方式查看相关的视频内容。

  Google Reader的ReaderAdvantage计划

  用户在Google阅读器上每阅读一篇文章,就会得到一个积分,用户使用这些积分可以换取各种各样的礼品。
 
  Google Wave通知方式改变
 
  Google宣布,当其协作通信工具Google Wave的收件箱收到新信息时,系统会发送一个真人来通知用户。
 
  Google Docs可以存储任何物件
 
  为了便于用户寻找和共享物件,GoogleDocs将把云计算(Cloud Computing)带入新的发展阶段,并允许用户向GoogleDocs服务中心上传任何真实世界中的物件,如钥匙、遥控器、铁路车票以及其他容易丢失的物品,该服务中心将予以妥善保管。价格为0.10美元/千克。
 
  Google Voice提供标准语音邮箱
 
  Google Voice中的新的标准语音邮箱模式将会为用户带来传统语音邮箱中的旧功能,其中包括在14天之后自动删除邮件等。
 
  Chrome Sounds
 
  Google将为Chrome浏览器带来一个新的插件“Chrome Sounds”,可以为用户带来一个更加神奇、令人陶醉的互联网体验。
 
  Chrome小组表示,在过去数个月中,他们一直醉心于心理声学模型、Whittaker-Nyquist-Kotelnikov-Shannon采样定理、Franssen效应、Shepard-Risset铃声以及11.1环绕声的研究,力求为Chrome用户带来一个先进的音频驱动的用户界面。
 
  当用户使用浏览器的时候,“Chrome Sounds”可以记录用户的音频反馈。
 
  LifeSize
 
  Picasa 的最新功能“LifeSize”将允许用户打印任何切割尺寸的纸板。
 
  Google图书
 
  Google称,Google图书将提供3D选项,使用户可查看具有立体感的文字和图片。
 
  Google进军核能研究领域
 
  最后一条是最搞笑的,那就是:为了解决美国当前所面临的能源危机,Google正大力进军核能研究领域,并组建一家铀浓缩工厂。

  去年愚人节,Google推出了“谷鸽鸟看”计划,前年则推出“人肉搜索引擎”计划。