QQ空间|腾讯存储技术背后的十五年往事( 四 )


“另外这个单词又朗朗上口,中文译名‘有他’,给人安全可靠放心的感觉,我们在内部的分享课程,就是‘存储有他,能力无限’。”
而这个名字,也代表了腾讯存储部门的野心,这个存储系统的理论峰值是YB。
“我们现在一个集群可以存储1ZB的数据,如果是1000个这样的集群,那我们就可以存储一个YB的数据。”杨奋强很自信的说。
QQ空间|腾讯存储技术背后的十五年往事
文章插图
回到重做一个存储系统的问题上,为何腾讯会做出这样一个决定?
“我们当年将内部业务上云的时候,TFS系统支撑我们内部业务的海量数据都是没问题的,支持外部业务当然也没有问题,但我们要把目光放到十年以后。”谢明如是说。
但事实上,重新自研一个存储系统不是一件容易的事情。
再以谷歌为例,为什么谷歌不做一个适合于GCS的云上的Blob存储系统?其实Google也深谙ColossusV2的问题,在几年前,谷歌就组建了一个二三十人团队去做这件事,但最终却不了了之。
由于业务驱动着技术的变革,腾讯选择了Google没有成功的那条道路,YottaStore在2018年开始了研发,并于2019年正式上线。
“YottaStore,我一直说它是一个云数据存储系统,这跟当前业界绝大多数公司的做法是完全不同的,它的优势也是很明显的。”
杨奋强介绍说:“YottaStore的极限是一个集群可以管理超上千万台服务器,而要管理这上千万台的机器,我们原数据管理只需要用600G左右的空间,用一台机器就能存下所有的索引结构,管理上千万台的存储节点服务器,这在业界是绝无仅有的。”
此外,杨奋强表示,YottaStore一个集群可以同时支持各种不同的冗余模式、任意的EC编码,同时,集群可以自适应各种各样不同的机型;对于存储节点的升级,无论集群规模多大,YottaStore都可以在20分钟内完成一个集群的升级。
更令腾讯存储团队骄傲的是,YottaStore开始上线大规模支撑业务的前三个月一直维持百分之百的可用性,而目前系统仍实现单人值周零故障运行。
“YottaStore存储系统上线之后,一反通常系统上线后的紧张忙碌的状态。就在系统上线的第二天,我们研发团队怀着无比轻松的心情去吃了一顿人均500多的自助餐,来犒劳自己。”
杨奋强笑着对雷锋网说道。
用户最为直观感受的就是,基于YottaStore存储的腾讯云COS存储的最低价格为1分钱/GB/月,而其数据持久性达到了99.999999999%(11个9)以上。
YottaStore上线后即获得了腾讯公司级的业务突破奖。
而如今,基于YottaStore存储系统的腾讯云对象存储COS平台,正在为快手、OPPO、小红书、海康、猎豹、58同城等几十多万个企业客户提供了可靠的存储服务,整体数据量高达EB级别。
腾讯内部的“黄埔军校”从各种渠道的信息来看,关于腾讯这支存储团队的报道少之又少,但其实在内部,这支团队被称之为腾讯的“黄埔军校”。
现任腾讯云架构平台部研发中心总监朱建平也曾是这其中的一员。
“存储部门走出了很多人去负责很多其它方向的技术研发。比如做FPGA异构加速的,做医疗AI,做视频编解码,同时还从这个团队里面不断孵化出创新业务。”
朱建平接着说:“我们内部说存储部门是专家的摇篮,分布式存储平台,系统设计也好,还是运营等各个维度,面临的问题比较多,存储部门特别能锻炼人,所以过往一般都是最好的毕业生放进来,然后这边能力成熟了以后,慢慢又分流到其他战场去。”
据雷锋网了解,目前腾讯AI、服务器、运管、研效、搜索、CDN、视频编码等很多领域的带头人都是从存储团队出来的。
而也正是这样的一个团队,在为腾讯默默筑建着技术的根基。