高性能计算网络平台解决方案,能够解决物探高性能计算中,基于GPU的程序必须调用IB 栈,而传统TCP/IP堆栈应用无法支撑高性能计算网络通信的问题。浪潮网络高性能计算网络方案采用支持ROCEV2架构的解决方案,获得了基于GPU计算的程序不用迁移直接运行在现有高性能网络的效果,同时网络传输效率和可靠性也得到加强,通过ROCEV2技术的运营降低了主机CPU消耗。
高性能计算简称HPC,是指利用聚集起来的计算能力来处理标准工作站无法完成的数据密集型计算任务,例如勘探业务中所需要的仿真、建模和渲染等。我们在处理各种计算问题时常常遇到这样的情况:由于需要大量的运算,一台通用的计算机无法在合理的时间内完成工作,或者由于所需的数据量过大而可用的资源有限,导致根本无法执行计算。HPC方法通过使用专门或高端的硬件,或是将多个单元的计算能力进行整合,能够有效地克服这些限制。将数据和运算相应地分布到多个单元中,这就需要引入并行概念。
不同类型的建模问题具有不同的可并行程度。以参数化扫描为例,这种问题求解多个具有独立的几何、边界条件或材料属性的相似的模型,几乎可以完全并行计算。具体的实现方法是为将每一个模型设置分配给一个计算单元。这类问题非常适合并行计算,因此通常称为“易并行问题”并行问题对集群中的网络速度和延迟非常敏感。(在其他情况下,由于网络速度不够快,无法有效处理通信,很可能导致速度减慢。)因此,可以将通用硬件连接起来,加快这类问题的计算速度。
传统网络中TCP/IP堆栈随着网络接入带宽的增长,对CPU的消耗越来越高,HPC网络通常采用RDMA技术对网络减少TCP/IP堆栈对计算节点CPU的消耗,降低网络传输延时。
RDMA允许在两台服务器的内存之间直接转移数据,而无需任何一台服务器的CPU参与(也称为零拷贝网络),因此可实现更高效的通信。这种处理在支持RDMA的网络接口卡(NetworkInterfaceCard,NIC)上进行,并且会避开TCP/IP堆栈,因而加快数据转移。如此,就可以直接将数据传送到目标服务器上的远程内存中,降低用于其他处理的服务器的CPUI/O工作负载
传统的IB交换体系架构利用了RDMA技术技术,通过业界最小的转发延时,为HPC提供高性能低延时的网络平台,但Infinband 交换机有自己的独立架构体系和协议(IB协议和规范),必须和支持IB协议的设备进行互联。2. Infinband 体系相对封闭,难以替换。3. Infinband 体系和传统网络对接需要单独的网关。
对于在整体HPC计算平台中,存在这大量对延时并非绝对敏感的应用,而以昂贵的IB交换端口来承载数目众多的这些应用无形中增加了企业的计算成本、维护成本、管理成本,制约了HPC整体系统的扩展。从业界以太网络基于10G/25G/40G/100G带宽增长的趋势的发展趋势来看,随着计算规模的不断扩增,原有很多基于IB建立的网络无论从带宽介质形态,端口密度等都需要扩容,对于非延时绝对要求的HPC应用接入,都倾向于采用以太网替换原有IB交换机以降低成本。
RoCE规范在以太网上实现了RDMA功能,ROCE需要无损网络,RoCE的主要优势在于:由于它的延迟较低,因此可提高网络利用率;同时它可避开TCP/IP并采用硬件卸载,因此CPU利用率也较低。
新RoCEv2标准可实现RDMA路由在第三层以太网网络中的传输。RoCEv2规范将用以太网链路层上的IP报头和UDP报头替代InfiniBand网络层。这样,就可以在基于IP的传统路由器之间路由RoCE。
利用这项创新,业界就能够满足企业内日益增长的高性能和横向扩展架构需求。RoCEv2可帮助其实现融合路径的持续性并提供高度密集的数据中心,同时为基于IB的应用移植,提供了快速迁移的方式,减少了开发工作量,提高了用户部署应用和迁移应用的效率。
典型应用场景,就是以浪潮CN12000为大接入核心,形成三张网:计算网、管理网、存储网,在计算网实现高密度,高转发,配合主机实现RDMA关键技术的运用,实现基于IB协议开发的高性能应用平滑迁移到更低成本的以太交换网络中来。
通过浪潮网络高性能产品的支持,极大简化了高性能网络架构,并降低了多级架构层次造成的延时,为关键计算节点接入带宽的平滑升级提供有力支撑。
采用RoCE v2标准作为核心,通过对计算节点RoCE v2、DCE/DCB的支持,消除了程序移植带来的复杂性和额外的工作量,降低了计算节点TCP/IP堆栈对主机CPU的消耗。
核心网络通过PFC/RoCE等技术的支撑,使得高性能计算网络具备更高的开放性,在没有降低计算效率的前提下,降低了整个高性能集群平台建设的成本。
浪潮网络HPC解决方案,通过浪潮智能云引擎ICE、浪潮智能数字化网络技术,使网络的构建和管理向更快速、更简单转变,有效简化运营、降低成本。
浪潮网络高性能解决方案通过和高性能计算业务的结合,能够发挥出平台的最大性能,搭建一个具备“低成本、高性能、开放性、易管理”特性的网络平台,为高性能计算提供了新的视角,助力高性能计算行业的发展。
未来,浪潮网络将继续加大研发投入,凭借浪潮深厚的本土理解能力,以及在行业内的积累实践,为客户提供更加优质的技术产品及服务。深耕能源行业,助力用户打造业务联接新势能!