不得不说,企业上云已是大趋势,越来越多的企业正意识到上云的重要性,从而选择合适自己的上云服务商。但就在近期,腾讯云因操作系统云盘发生故障致使用户数据清零暴露出的数据安全问题,正在引发企业对于上云安全性的担忧。
近日,腾讯云用户北京清博数控科技有限公司所属“前沿数控”向腾讯云提出千万元的索赔要求,因其平台的操作系统云盘受所在物理硬盘固件版本bug导致的磁盘静默错误(写入数据和读取出来的不一致)影响,文件系统元数据损坏。然而,腾讯云认为事故原因在于操作系统云盘发生故障,提出的仅是“赔偿+补偿”总金额达十几万元的解决方案。
其后,由于赔偿金额意见不一,双方都表示有可能通过法律途径解决问题。
《国际金融报》记者采访了解得知,目前,腾讯云和用户之间已经达成和解。但从这次故障的背后,有两个问题依然没解决:第一是从腾讯云的角度,三份备份全部消失匪夷所思;第二是从整个行业的角度,在几乎所有数据都在云端的情况下,云安全问题跃然纸上。
千万元数据丢失
这或许只是腾讯云的一起用户事故,但对于“前沿数控”而言更似一场“灾难”。
8月5日晚间,“前沿数控技术新媒体”在微博、今日头条、百度等公众平台上发布文章《腾讯云到底安不安全?为什么数据丢了不能恢复?——腾讯云给一家创业公司带来的灾难!》,自述腾讯云硬盘故障导致其公司平台数据全部丢失。
“前沿数控”是一家于2014年从微信公众号起家的创业公司,定位于数控、模具、机械行业,2016年获得投资后,该公司转型为打造行业的一站式平台,开发了包括网站、H5、小程序产品等。
文章显示,该公司选用腾讯云服务器是为应对迅速增加的流量趋势以及安全可靠的需求。自称是“前沿数控”创始人以及接口人的伍先生告诉《国际金融报》记者,“当时本来是想选择阿里云的,但后来想到有一项短信验证业务在腾讯云办的,一起做便于管理。”
万万没有想到的是,这种“把所有鸡蛋放在一个篮子里”的操作,竟让这家公司在数据丢失后一无所有。
7月20日晚间,“前沿数据”公司的网站、小程序、H5突然无法打开,且无法登陆云服务器,在向腾讯云后台发起求助后,腾讯云迅速给出了答复:北京三区部分云硬盘出现故障,正在紧急恢复中。
之后的两天内,腾讯云处理投诉的负责人向“前沿数控”表示,由于腾讯云硬盘发生的故障导致数据丢失,且几乎没有希望恢复数据,想听取要求赔偿的意见。
不过,“前沿数控”的第一需求并非赔偿,而是希望腾讯云尽全力恢复数据。一天后,上述负责人告知“前沿数据”,数据100%找不回来了。
“前沿数据”在文章中称,这次事故导致公司近千万元级的平台数据全部丢失,包括经过长期推广导流积累起来的精准注册用户以及内容数据,一瞬间一家创业公司被摧毁了……
因运维人员违规操作
事故发生后,“前沿数控”还咨询了IT行业专业人士,得到的回应是,腾讯云应该有容灾机制和数据完整性验证,以保证数据可恢复,即使全部损坏,只要硬盘没有物理毁灭也能恢复出数据。
腾讯云官网也显示,CVM(云服务器)搭载的云硬盘提供三副本存储策略,保证了数据在任一副本出现故障时快速进行迁移和恢复。
因此,对于平台数据以及备份完全消失,且无法恢复,伍先生向《国际金融报》记者坦言难以置信。
那么,云硬盘上的数据以及三份备份全部消失,且无法恢复的可能性有多少?
上海交大信息安全工程学院院长李建华告诉《国际金融报》记者,三套备份同时消失的几率非常小,如若是一般的文件删除或丢失,数据是有可能恢复的,如若是物理硬件损坏,数据就非常难以恢复。
8月7日,腾讯云在其官方微信公众号上发布了此次故障的技术复盘。复盘发现,该故障缘起于因磁盘静默错误导致的单副本数据错误,再加上数据迁移过程中的两次不规范的操作,导致云盘的三副本安全机制失效,并最终导致客户数据完整性受损。
事故源自磁盘静默错误导致的单副本数据错误。如果事故就到此,备份不发生意外,数据还是有可能恢复的。但据腾讯云的故障过程复盘,其运维人员在数据搬迁过程中进行了两项违规操作:
第一是正常数据搬迁流程默认开启数据校验,开启之后可以有效发现并规避源端数据异常,保障搬迁数据正确性,但是运维人员为了加速完成搬迁任务,违规关闭了数据校验。
第二是正常数据搬迁完成之后,源仓库数据应保留24小时,用于搬迁异常情况下的数据恢复,但是运维人员为了尽快降低仓库使用率,违规对源仓库进行了数据回收。
运维人员的违规操作导致异常数据扩散至三副本,进而导致客户数据完整性受损。
赔偿意见之争
在确认数据无法恢复后,双方在赔偿金额的诉求上产生了不小的矛盾。
腾讯云给出了“赔偿+补偿”总金额为136469元的解决方案。赔偿部分为“前沿数控”自2017年12月开户至今产生的实际消耗为3569元,腾讯云按赔偿条款中的上限现金全额返还;补偿部分为132900元现金或云资源的额外补偿。
《腾讯云服务协议》中关于违约服务补偿责任的内容显示,腾讯云公司的补偿责任总额不超过腾讯云公司就违约服务向客户收取的当次服务费用总额。
“其实,腾讯云这件事大家都觉得有些出乎意料。尽管它(腾讯云)说是一个极端小概率的事件,但确实是个低级失误。”达睿咨询创始人、首席分析师马继华认为,做云计算的公司,安全必须是第一位的,特别是存储安全。把用户的数据弄丢,这对任何企业来讲都是非常严重的失误,并非腾讯云所说的赔十几万元就能解决问题。
当然,“前沿数控”对于腾讯云的所谓解决方案也并不买账,其很快提出的赔偿金额为1101.6万元,双方提出的赔偿金额相差近81倍。
7月27日,“前沿数控”向腾讯云发送了文件《前沿数控技术平台损失预估》,包括前沿数控技术产品线发展及相关情况、丢失的数据、给前沿数控技术平台带来的影响、平台损失价值评估。
至于上述文件,伍先生以涉及商业机密为由拒绝向记者提供。他表示,1101.6万元是结合用户数、内容数以及成本计算得出。
那么,《腾讯云服务协议》的条款在法律层面是否有效?赔偿金额应该如何制定?
北京市康达律师事务所律师韩骁告诉《国际金融报》记者,若合同有明确的违约条款,则应当按照合同约定的赔偿方式进行赔偿。但如果合同约定的赔偿额度与客户的实际经济损失差距过大,可以依据实际损失额主张权利,而在直接经济损失的数额主张方面,“前沿数控”应当承担举证责任。
不过,双方的声明中还有另一个矛盾值得注意。腾讯云曾于8月6日的声明中提到,在双方的沟通中,“前沿数控”还提出希望以“获得腾讯投资”、“腾讯官方引流”等方式得到补偿。
随后,“前沿数据”发布严正声明称,“前沿数控平台与腾讯云的沟通既不是为了索赔,也不是为了获得腾讯投资、导流,更不希望对腾讯云产生诽谤……是腾讯云工作人员在表达数据恢复不了的情况下,主动提出希望利用腾讯可利用的资源来帮助我们恢复平台的运营、恢复流量。”
关于上述矛盾,《国际金融报》记者在腾讯云方面并未得到任何回应,而伍先生则向记者表示,与腾讯云沟通的整个过程都有录音。
此外,伍先生还主动向记者透露,“发送所有文件前都在腾讯的处理群里让他们确认过。”
意外的是,8月8日,当记者再次翻看“前沿数控技术新媒体”微博时发现,其“指控”腾讯云的三条微博已经删除,该公司在今日头条发布的文章也已经删除,腾讯云的官方微博上也看不到其于8月6日发布的相关声明。
随后,记者询问伍先生事件是否有了新的进展,伍先生回应:“我们与腾讯云还是希望可以尽快恢复前沿数控平台业务运营,因此已协商制定出双方认可的业务解决方案。”
不过,伍先生并未向记者透露业务解决方案的具体内容,随后记者试图向腾讯云求证,腾讯云直至记者截稿也未给出回复。
对于双方能够短时间内达成和解,北京志霖律师事务所副主任赵占领并不感到意外。他向《国际金融报》记者坦言,不管法院会判腾讯云赔偿多少,这个事情对腾讯云的声誉是有很大负面影响的。
不做本地备份有责任?
此次事件中,不少业内人士提出一个质疑:为何“前沿数控”自己没有进行数据本地备份?但“前沿数控”此前也搬出了腾讯云的宣传文案:“云服务器声称99.9999999%的数据可靠性,搭载了云硬盘提供三副本存储策略,也就是说只要把数据放在腾讯云上,只有十亿分之一出现数据丢失的可能性,另外还对数据提供了3个备份”。
腾讯云在8月6日的声明中曾提到:“基于云计算特性,为了杜绝概率极低的意外事故发生,我们在做好云平台数据备份保障外,也按照行业惯例在相关协议中提醒用户对自身重要数据,尤其是客户信息、程序代码、网页素材等进行数据本地备份。遗憾的是,在这次故障中,‘前沿数控’也表示目前没有任何本地备份数据可以用来恢复业务。”
伍先生却不这么认为,他向记者表示,网站上的数据是不断变化的,备份动态数据与拷贝固定文件是不一样的。
在李建华看来,“前沿数据”所给出的理由并不成立,无论是静态数据还是动态数据,都有方法进行本地备份。“‘前沿数控’不能把服务的责任全部转嫁到腾讯云上,这家公司本身在数据安全保护上有一定的漏洞。”
对此,伍先生则给出了这样的说法:“因为我们是创业公司,还没有做到那么完美。”
在马继华看来,云计算的确给很多初创公司降低了成本,不过成本虽然降低了,但风险确实也同样存在。
“我觉得腾讯云这方面的技术可能还不够成熟,毕竟腾讯云的客户并不是很多,这会对腾讯云的品牌形成一定影响。创业公司不一定能承担购买全部云设备的成本,核心数据确实有必要不能全部放在公有云上。”互联网经济杂志主编向坤告诉《国际金融报》记者,公有云有备份也是十分重要的,比如碰到一些数据并发数量太大的时候,即使很成熟的云服务也遇到过宕机的情况。云安全未来会存在很多问题,这个围绕云计算的安全问题会使得细分的云安全企业有更大的发展空间。
没有绝对安全
可以说,自云计算的概念产生以来,各类与云相关的服务纷纷涌现,随之而来的就是人们对云安全问题的关注。
CIC灼识咨询执行董事朱悦在接受《国际金融报》记者采访时表示,不论是面向公众服务的公有云还是主要面向企业的行业(私有)云,一个共同的问题就是如何提升安全防护能力。目前各个运营商、服务提供商以及安全厂商所提的云安全解决方案,大多根据自己企业对云平台安全的理解,结合本企业专长,专注于某一方面的安全。然而,对于用户来说云平台是一个整体,需要构建云平台的整体安全防护体系。
在朱悦看来,尽管私有云的安全性和可控性更高,但由于相对公有云而言相似的服务更加昂贵,初创企业在考虑运行成本和规模经济的情况下,往往更倾向于公有云。
朱悦认为,无论是公有云还是私有云都不是绝对安全的,对于特定核心数据的备份是必要的。“未来云服务,尤其是公有云会变得更为标准化。中国在个人数据和云计算数据安全领域的立法仍然处于发展阶段,相关法律主要从数据处理合法、用户权利、数据安全和披露等方面对数据保护提出了要求。而参考美国标准 TIA-942《数据中心的通信基础设施标准》从可用性、稳定性和安全性分为四个等级,用户根据需求选择相对应的云服务,在出现故障按标准化的渠道选择应对方案。”
那么,公有云是否也要数据灾备呢?
朱悦对此解释称,灾备是指容灾和备份,是指通过建立多套相同的IT系统互相监视切换或者通过异地备份的方式来增加数据的安全性。通常来说,任何形式的云服务都应有相应的灾备来增加数据安全性。中国公有云目前的灾备仍在发展当中,还没有形成相应标准化的解决方案和灾备评级,以至于企业在选择公有云的时候并没有一个可比的安全性标准。而同时,企业在选择公有云的时候常常处于一个经济效率和弹性需求的考虑,而对于数据安全意识并不强。在公有云被大量运用和数据损失案例频出后,对于数据安全的考虑势必增加,从而反向从企业需求方催生云服务的灾备市场。
按照朱悦的说法,当前的国内公有云市场呈现出四大阵营,以阿里云、腾讯云和百度云为代表的互联网企业阵营;以华为云为代表的IT基础设施厂商阵营;与微软Windows Azure结盟国内运营的世纪互联等国外厂商阵营;最后就是中国电信、中国联通和中国移动所组成的运营商阵营。在市场份额占比当中,阿里云约占市场超过40%的市场份额,紧随阿里云之后的云厂商有腾讯云、华为云、金山云等。
“目前中国公有云市场玩家各有特色,例如阿里云成立之初就是为了解决自己的需求,解决阿里巴巴、淘宝平台商家的需求,而紫光集团旗下的新华三,是企业级市场的巨头玩家,在政务、国企、行业等市场上具有一定的积淀。不过,由于云计算在中国市场尚处于初期阶段,一些中部玩家如金山云、Ucloud、青云QingCloud等,主要是先在游戏云、视频云、金融云等领域建立优势、形成口碑,然后再向其他领域横向拓展,它们也逐渐拥有了自己的市场竞争力,所以未来的市场格局仍然充满变数。”朱悦如是表示。