2009年8月17日星期一

百度对于淘宝和支付宝的收录

  百度和其竞争对手阿里巴巴的竞争今年颇为激烈,在百度C2C产品“百度有啊”即将上线的时候,阿里巴巴的淘宝网站曾经屏蔽百度搜索爬虫,禁止百度搜索引擎抓取淘宝网站的网页内容,淘宝官方的解释是“杜绝不良商家欺诈”。

  淘宝屏蔽百度的方法是在网站的robots.txt文件中加上信息要求停止索引,搜索引擎要是遵守robots协议,那的确不会索引,但是对于淘宝网这样的知名网站,全部删除其页面对于百度搜索引擎的公信力会是一个挑战,因为很多用户还需要通过百度搜索淘宝网来访问淘宝,因此,至今为止,我们在百度中搜索site:www.taobao.com,可以看到百度还是收录了淘宝网的一个页面,就是淘宝网首页,说明百度并未按照淘宝的要求,删除关于淘宝的页面,用户在百度中搜索淘宝网依旧可以访问到淘宝。

百度屏蔽支付宝网站

  另外,对于阿里巴巴的支付宝网站,百度的收录也比较特别,在百度中搜索site:www.alipay.com,得出的结果是“抱歉,没有找到与‘site:www.alipay.com’相关的网页。”

百度屏蔽支付宝网站

  但是百度并没有屏蔽支付宝,在百度中搜索支付宝依然会显示出支付宝的首页,之所以site不出来内容,是因为支付宝使用了https这样的SSL方式访问,而百度似乎对于https的页面不进行收录。

  支付宝对于百度的依存程度远远高于淘宝网,主要原因是支付宝的域名太难记,使用部分拼音+英文的组合,这样的域名即使只有6位,也很难记住,不如完全拼音的域名好记,我现在也没有记住支付宝的域名,每次访问都是通过搜索引擎搜索来访问。

  支付宝的劣势是,没有使用一个拼音组成的较为好记的域名,不过即使如此,想要用支付宝的用户,依旧会使用搜索引擎去搜索寻找这个网站,难记的域名有时候也会成功,如果运营的好的话。