更多 选择语言

短视频数据中心存储架构解决方案

摘要

  随着互联网内容不断更新迭代,短视频取代了文字、图片,占据了人们工作、生活之余的大部分碎片时间。在短视频业务快速扩张的背后,是各种技术的不断革新在质层,包括移动终端性能的提升,移动网络的提速,当然还有后端计算平台的日益强劲和稳健。

  当我们从看图时代转向视频时代时,数据中心又需要什么样的变革来适应新的业务应用?

背景介绍

  1、每月需存储PB级的数据

  视频相较文字和图片的存储需要更大的空间,以国内某短视频平台的对外公开数据来看,仅从存储的视频容量来看,平台每月新增的短视频容量都将超过1PB。按照单块硬盘8T,每块服务器12块硬盘,每月为了存储这些视频就需要新增12台服务器。

  2、占比高达80%的冷数据,如何处理

  视频行业的数据都有一个共同的特点——数据的热度不均且变化较快。大部分上传的数据的高热度状态仅能保持1周甚至更短的时间。在数据中心中热数据、温数据和冷数据占总数据量的比例约为5%、15%、80%。冷数据也可以被叫做“低价值度的数据”,占用了大部分的存储空间,但是通常不会再产生价值(被观看)。虽然如此,但平台需要保证保有的数据不会被删除,如何安全且低成本的保存这些数据也成了一个必须要解决的问题。

  3、如何面对高功耗的存储服务器带来的居高不下的运营成本

  服务器产品在维护阶段具有周期长、维护成本高的特点,一般2年的维护成本就会超过购买成本。所以在设备运行过程中降低耗电量和简化维护成了必须重视的部分。目前国内大部分的存储服务器仍是基于Intel 双路至强CPU,并没有针对温冷数据的存储应用进行优化。大多数数据中心中的存储系统都处于低负载高功耗的状态。

  1

解决方案介绍

  计算与存储分离,各司其职

  短视频背后的数据中心架构其实并不是特别复杂,从视频采集端到客户端,编解码、用户特征分析由专门的计算节点完成;CDN节点负责热点视频的缓存加速和分发;高密度的存储节点用于存储平台的视频数据。

  2

  CDN节点,考虑如何让热点数据最快发出

  由于视频流量大,CDN节点所承载的吞吐量较大,因此对于存储容量和扩容的便捷度要求更高。另外由于CDN需要存储的数据热度不一,视频数据需要分级存储,将不同热度数据放在不同的存储介质中,充分发挥部件的利用效率,提升存储能效比。

  对于CDN服务器的选择,通常会需要计算和存储两类服务器来支撑:

  计算型主要用于处理分发任务等,需高主频CPU,内存和硬盘容量的要求并不高;

  存储型用于关键节点的数据存储和快速分发,要求IT架构中需要大容量的SSD或高速HDD

  浪潮SA5212M,是一款计算存储均衡类服务器。

  存储性能上,SA5212M5搭配12块大容量SATA硬盘,单块容量达到8T,单机可容纳96T的CDN数据,满足CDN集群的庞大数据容量需求。对于相对热的数据,SA5212M5中可加入的4块2.5寸SSD盘位,将提升系统整体响应速度。

  经实测,使用SSD固态硬盘后单台服务器的服务能力提升了1倍以上。

  高密存储节点,提升存储能效比

  作为存储节点的高密度服务器、不需要太高的计算处理性能,可以选择基于Intel Xeon-D处理器家族的SA5224M4机型,搭配单颗D-1521 CPU,借助Xeon-D的SOC特性和低功耗优势,通过大容量8T硬盘的使用,以追求更优的TCO收益。从实际测试数据来看来看,搭载D-1531 CPU的SA5212M4的计算性能已经达到原E5-2620V3 平台服务器的80%左右,但是单CPU的TDP(散热设计功耗)只用45W,相比传统E5 CPU功耗降低35W以上。

  一般服务器的生命周期为三年,按此计算,1000台的存储服务器集群可节省至少1050万的电费。

  高硬盘IO和网络IO

  在短视频的传递链条中,用户端上传的视频直接存入4U36盘位组成的存储集群中,并通过分布在各地的CDN节点传送到用户端观看,因此对后端存储服务器的硬盘IO表现有较高的要求。

  SA5224M4机型,其36盘位顺序写的总带宽接近4.8GB,顺序读接近6GB,有力支撑了硬盘高IO读写的性能需求。此外, SA5224M4的板载万兆优势,可构建起10Gb的内部高速互联网络,保障了数据访问和传输所需的网络带宽。

  更高的机柜部署密度

  衡量服务器的磁盘密度不仅要看每U空间支持的磁盘数量,还要放在机房供电环境下,评估单机柜支持的磁盘密度。基于Intel Xeon-D平台的集成性和低功耗优势,在20A的机柜中,42U的空间内,SA5224M4可部署9-10台,单机柜磁盘部署密度提升25%,即以往双路4U36需要部署5个机柜的磁盘密度,当前4个机柜就能解决。不仅提高了单机柜供电利用效率,更减少了租赁机柜的数量,节省服务器生命周期内的运营成本。

  3

客户收益

  1、浪潮SA5212M是计算存储均衡类服务器,在存储性能上,搭配12块大容量SATA硬盘,单块容量达到8T,单机可容纳96T的CDN数据,满足CDN集群的庞大数据容量需求。而对于相对热的数据,SA5212M5中可加入的4块2.5寸SSD盘位,将提升系统整体响应速度,经实测,使用SSD固态硬盘后单台服务器的服务能力提升了1倍以上。

  2、搭载D-1531 CPU的SA5212M4的计算性能已经达到原E5-2620V3 平台服务器的80%左右,但是单CPU的TDP(散热设计功耗)只用45W,相比传统E5 CPU功耗降低35W以上。按照服务器三年的生命周期,1000台的存储服务器集群就能节省下至少1050万的电费。

  3、而目前应用的SA5224M4机型,其36盘位顺序写的总带宽接近4.8GB,顺序读接近6GB,有力支撑了这种硬盘高IO读写的性能需求

  4、于Intel Xeon-D平台的集成性和低功耗优势,在20A的机柜中,42U的空间内,SA5224M4可部署9-10台,单机柜磁盘部署密度提升25%,即以往双路4U36需要部署5个机柜的磁盘密度,当前4个机柜就能解决。不仅提高了单机柜供电利用效率,更减少了租赁机柜的数量,节省服务器生命周期内的运营成本。


线




×
联系我们
ERP、企业软件购买热线
400-018-7700
云服务产品销售热线
400-607-6657
集团客户投诉热线
400-691-8711
智能终端产品客服热线
400-658-6111