3月29日凌晨,腾讯旗下的微信和QQ等业务曾出现崩溃状况,包括微信语音对话、朋友圈、微信支付,以及QQ文件传输、QQ空间和QQ邮箱在内的多个功能无法使用。
虽然该故障在当天稍晚时候就被修复,且微信此前也出现过几次大小故障,但腾讯仍然对本次事故开出了堪称严厉的处罚单。
据了解,本次事故由广州电信机房冷却系统故障导致,腾讯将它定义为公司一级事故。
腾讯管理层认为,这次事故暴露出容灾设计方案和应急预案不完善的隐患,有关业务部门的风险防范意识不到位,所以对大量相关领导做出了处罚。其中包含公司高级执行副总裁、TEG(技术工程事业群)总裁卢山(LS)和WXG(微信事业群)副总裁周颢(harveyzhou)在内的管理者承担领导责任,被予以通报批评。值得注意的是,卢山目前为腾讯总办(腾讯总经理办公室,为公司最高决策机构)成员。
此外,TEG华南数据中心的两位总经理和总监被处以降级和免职处罚,WXG技术架构部的两位总监和组长当期绩效考核给予Underperform等评级(二星级别,最高为五星)。
早年间在腾讯内部的一次分享活动中,已经卸任腾讯CTO的主要创办人张志东曾直言,微信作为用户早晨起床第一个点击的国民应用,如果在登录、群聊、朋友圈和支付功能上出现故障,容易造成部分社会恐慌,用户会不断关机重启,受到惊吓。
不仅如此,目前腾讯有大量B端业务对微信有高依赖度,比如企业微信和小程序等。
根据官方公布的最新数据,小程序2022年的GMV已达到数万亿元。如果本次事故发生在电商年中大促(618)期间,导致用户无法顺利支付订单,可能会给商家造成数十亿甚至百亿级的损失,也会直接影响客户对腾讯的信任。
本次严厉处罚是腾讯近年来重视安全的一个缩影,尤其在腾讯加码的B端业务上,企业客户更加强调稳定性和安全性。不过,目前尚不清楚容灾方案和应急预案的缺失是否和整个集团层面推行降本增效有关。
稿源:界面新闻