河輋门户网站
河輋门户网站>科技 >华为推出全球最快AI训练集群Atlas 900

华为推出全球最快AI训练集群Atlas 900

2019-11-25 10:01:05 作者:匿名

9月18日,在华为互联大会上,华为副董事长胡侯坤发布了atlas 900 ai培训集群,以超强计算能力带来企业人工智能业务的极致体验。世界正在从数字化向智能化转变。人工智能产业作为一个关键的驱动力,面临着自身升级和进化的挑战。华为在超级人工智能计算能力和大规模分布式人工智能培训集群方面加快了智能世界的转型。

华为atlas 900 ai培训集群

Atlas 900 ai训练集群游戏攻略

用于大型数据集训练的神经网络体系结构涵盖图像识别、自然语言处理、视频实时分析和智能推荐系统等各个方面。训练这些神经网络模型需要大量浮点计算能力。近年来,单个人工智能处理器的计算能力和训练方法取得了很大进展。然而,在一台机器上,人工智能训练所需的时间仍然长得不切实际。因此,有必要通过大规模分布式人工智能集群环境来提高神经网络训练系统的浮点运算能力。

这次发布的atlas 900人工智能训练集群由成千上万个相互连接的910人工智能处理器组成。它是目前世界上最快的人工智能训练集群,代表了当今世界计算能力的顶峰。最后,其功率达到256p~1024p触发器@fp16,相当于50万台计算机的计算能力。

阿特拉斯900人工智能培训集群领先技术优势

人工智能计算行业领先

阿特拉斯900 ai训练集群使用业界计算能力最强的瑞星910 ai处理器,每个瑞星910 ai处理器内置32个达芬奇ai内核,单芯片提供业界两倍的计算能力(256tflops @ fp16)。阿特拉斯900人工智能训练集群将成千上万个正在崛起的910人工智能处理器相互连接起来,以构建业界第一个计算集群。

瑞星910 ai处理器采用soc设计,集成了“ai计算能力、通用计算能力、高速大带宽i/o”,大大减轻了主机cpu的数据预处理任务,充分提高了训练效率。

最佳集群网络

阿特拉斯900 ai训练集群采用“hccs、pcie 4.0和100g以太网”三种高速互联模式。100 tb全互联无阻塞专用参数同步网络将网络延迟和梯度同步延迟降低10-70%。

在ai服务器内部,正在崛起的910 ai处理器通过hccs高速总线相互连接。上升的910 ai处理器和cpu与最新的pcie 4.0 (16gb/s)技术互连,速度是业界主流采用的pcie 3.0(8.0gb/s)技术的两倍,使数据传输更快、更高效。在群集级别,采用面向数据中心的cloudengine 8800系列交换机来提供单端口100gbps交换速率,并将群集中的所有ai服务器连接到高速交换网络。

原无ilossless智能无损交换算法对集群中的网络流量进行实时学习和训练,实现网络零丢包和e2e μs级延迟。

系统级调谐

阿特拉斯900 ai训练集群通过华为的集体通信库和作业调度平台集成了hccs、pcie 4.0和100g roce三个高速接口,充分释放了正在崛起的910 ai处理器的强大性能。

华为的集体通信库提供培训网络所需的分布式并行库。通信库的网络拓扑训练算法进行系统级优化,实现集群线性度> 80%,大大提高作业调度效率。

极端散热系统

传统数据中心大多使用空气冷却技术来散热,但在人工智能时代,传统数据中心面临着巨大的挑战。cpu和ai芯片等高功耗设备带来更大的热岛效应,需要更有效的冷却方法。液冷技术可以满足数据中心对高功率、高密度部署和低pue的超高要求。

atlas 900 ai训练集群采用全液冷方案,创新性设计业界最强柜级密闭绝热技术,支撑>95%液冷占比。单机柜支持高达50kw超高散热功耗,实现pue

浙江快乐十二开奖结果 五百万彩票网 天津快乐十分开奖结果 河北快三投注 时时乐