芽祖资讯
首页 | 体育 | 教育 | 美食 | 动漫 | 游戏 | 社会 | 宠物 | 家居 | 国际 | 科技 | 文化 | 娱乐 | 母婴育儿 | 财经 | 历史 | 时尚 | 旅游 | 音乐 | 情感 | 星座运势 | 军事 | 健康养生 | 汽车 | 综合 | 搞笑 | 时事 |
华为Atlas 900 AI训练集群超强算力解析
作者:匿名 发布时间:2019-11-09 16:53:20 阅读量:1022


(观察家网络新闻)

9月18日,在华为互联大会上,华为副董事长胡侯坤发布了atlas 900 ai培训集群,为企业带来超级计算能力的人工智能业务的终极体验。世界正在从数字化向智能化转变。人工智能产业作为一个关键的驱动力,面临着自身升级和进化的挑战。华为在超级人工智能计算能力和大规模分布式人工智能培训集群方面加快了智能世界的转型。

Atlas 900 ai训练集群游戏攻略

用于大型数据集训练的神经网络体系结构涵盖图像识别、自然语言处理、视频实时分析和智能推荐系统等各个方面。训练这些神经网络模型需要大量浮点计算能力。近年来,单个人工智能处理器的计算能力和训练方法取得了很大进展。然而,在一台机器上,人工智能训练所需的时间仍然长得不切实际。因此,有必要通过大规模分布式人工智能集群环境来提高神经网络训练系统的浮点运算能力。

这次发布的atlas 900人工智能训练集群由成千上万个相互连接的910人工智能处理器组成。它是目前世界上最快的人工智能训练集群,代表了当今世界计算能力的顶峰。最后,其功率达到256p~1024p触发器@fp16,相当于50万台计算机的计算能力。

阿特拉斯900人工智能培训集群领先技术优势

人工智能计算行业领先

阿特拉斯900 ai训练集群使用业界计算能力最强的瑞星910ai处理器,每个瑞星910ai处理器内置32个达芬奇ai内核,单芯片提供业界两倍的计算能力(256tflops @ fp16)。阿特拉斯900人工智能训练集群将成千上万个正在崛起的910人工智能处理器相互连接起来,以构建业界第一个计算集群。

瑞星910ai处理器采用soc设计,集成了“ai计算能力、通用计算能力、高速大带宽i/o”,大大减轻了主机cpu的数据预处理任务,充分提高了训练效率。

最佳集群网络

阿特拉斯900 ai训练集群采用“hccs、pcie 4.0和100g以太网”三种高速互联模式。100 tb全互联无阻塞专用参数同步网络将网络延迟和梯度同步延迟降低10-70%。

在ai服务器内部,正在崛起的910 ai处理器通过hccs高速总线相互连接。上升的910 ai处理器和cpu与最新的pcie 4.0 (16gb/s)技术互连,速度是业界主流采用的pcie 3.0(8.0gb/s)技术的两倍,使数据传输更快、更高效。在群集级别,采用面向数据中心的cloudengine 8800系列交换机来提供单端口100gbps交换速率,并将群集中的所有ai服务器连接到高速交换网络。

原无ilossless智能无损交换算法对集群中的网络流量进行实时学习和训练,实现网络零丢包和e2e μs级延迟。

系统级调谐

阿特拉斯900ai培训集群通过华为的集体通信库和作业调度平台集成了hccs、pcie 4.0和100g roce,充分释放了正在崛起的910ai处理器的强大性能。

华为的集体通信库提供培训网络所需的分布式并行库。通信库+网络拓扑+训练算法进行系统级优化,实现集群线性度> 80%,大大提高作业调度效率。

极端散热系统

传统数据中心大多使用空气冷却技术来散热,但在人工智能时代,传统数据中心面临着巨大的挑战。cpu和ai芯片等高功耗设备带来更大的热岛效应,需要更有效的冷却方法。液冷技术可以满足数据中心对高功率、高密度部署和低pue的超高要求。

阿特拉斯900 ai培训集群采用全液冷方案,创新设计业界最强的柜级气密绝缘技术,支持> 95%的液冷比例。单机柜支持高达50kw的超高散热功耗,实现pue<1.1的极端数据中心能效。

此外,在节省空间方面,与8kw风冷式机柜相比,节省了79%的房间空间。极端液冷技术满足高功率、高密度设备部署和低pue的要求,大大降低了客户的总体拥有成本。

阿特拉斯900ai培训集群领先基准指数

华为在华为云上部署了一个atlas900ai培训集群,集群规模为1024个,增加了910个ai处理器。基于当前最典型的resnet-50 v1.5模型和imagenet-1k数据集,atlas 900ai训练集群可以在59.8秒内完成训练,居世界第一。

“imagenet-1k数据集”包含128万张图片,准确率为75.9%。在同样的精度下,业内其他两家主要制造商的测试结果分别为70.2秒和76.8秒。atlas900 ai训练集群比第二个集群快15%。

Atlas 900ai集群应用场景

Atlas 900 ai集群主要为大数据集神经网络训练提供超级计算能力。它可以广泛应用于科学研究和商业创新。它使研究人员能够更快地训练图像、视频和声音等人工智能模型,并使人类能够更有效地探索宇宙的奥秘、预测天气、勘探石油和加速自动驾驶的商业过程。

Atlas 900 ai cluster还可以提供云服务,以云的方式提供丰富而经济的计算能力资源,以及具有简单易用、高效率和全过程的ai平台,从而为客户提供“易于访问、经济实惠和方便”的通用ai计算能力和极致体验。

贵州11选5 江苏快3 广西快3投注 内蒙古快3投注



 
 
随机新闻
黑龙江省规范住宅小区供配电建设 新建小区停车位应配建汽车充电
西安交大副校长被“双开”,这份通报你看懂了吗
沙特受损产能将近恢复70%,原油期货跳水6%
北京CBD商圈惠普大厦楼盘8月写字楼的租金9.63元/㎡·天
150平米的房这样装修好看100倍,简约风格惊艳众人!-幸福
最新新闻
易观8月AppTop1000排行榜:AcFun领跑二次元社区
卢卡斯:期待第一次参加啤酒节,我和聚勒能说点法语
国际观察|拜登特朗普相互炮轰 弹劾调查激化政治缠斗
“湘非”经贸合作馆见证的中非深厚友谊
打伤上门滋事者 检察官认定正当防卫
最热新闻
Alphabet旗下Waymo宣布:纯无人驾驶汽车即将上路
仙乐健康科技股份有限公司首次公开发行股票 并在创业板上市之上
疑似荣耀 V30 屏幕曝光:前置双摄 + 挖孔屏幕
吉翔:很珍惜进入国家队的机会,里皮场上严格场下和蔼
德马库斯-考辛斯为湖人拍摄新赛季定妆照
栏目热门
疑似荣耀 V30 屏幕曝光:前置双摄 + 挖孔屏幕
互联网金融的风险管控
平安证券:IDC运营企业收入有望快速增长建议关注数据港
经济学人:印度有意打造本土芯片产业
魅族16T电商抢跑 全面屏设计/2499元起/10月下旬发布

 

© Copyright 2018-2019 faqspedia.com 芽祖资讯 Inc. All Rights Reserved.