华为发布ai处理器(华为发布AI处理器昇腾910)

  • A+

华为是如何率先推出ai处理器的

引入到手机终端并非易事。无论是普通的AI功能还是场景化AI服务,都需要手机完成复杂、密集的深度学习算法模型运算。与此同时,手机要具备强大的算力,不仅需要一定的运行环境,还对功耗、内存、存储空间有较高要求。

经过漫长的研发和测试,华为最终在2017年9月的柏林电子消费展上,正式发布了全球首款移动端AI芯片麒麟970,这也是全球首款内置了独立神经网络处理单元(即NPU)的人工智能芯片,其内置NPU性能大幅优于CPU、GPU和DSP这些通用计算单元。相比CPU,内置NPU拥有约50倍能效和25倍性能优势。这也就意味着,麒麟970芯片可以用更少的能耗更高效地完成AI计算任务。

一个月后,华为发布了搭载麒麟970的旗舰手机Mate 10,率先将专用NPU AI芯片引入手机。此后,苹果、三星等厂商纷纷跟进,到今天,AI芯片已成为众多手机厂商的旗舰配置。

据了解,有了NPU加持,手机的功能也会变得更加强大。例如,使用语音功能时,AI会对当前语境和内容做细致的分析,将语音识别的成功率提升到更高的级别,为用户带来精准的识别体验。未来,智能语音助手将能替代传统的手工输入,在人们的生活中扮演更重要的角色。或许,以后你在大街上再也见不到边玩边走“低头族”,而是会看到更多人对着手机“自言自语”了。

而在用户十分关心的拍照方面,AI的出现同样为喜欢手机摄影的用户带来不少福利。麒麟970搭载双通道ISP图像信号处理器,在动态影像捕捉和低光拍照上有很大的提升。双摄镜头 双ISP软硬件优化,再配合人工智能的计算机视觉分析,能帮助手机自动分析画面内的物体,选择最佳的拍照模式;甚至,还可以进行物体追踪对焦并预测拍照时机,为用户带来前所未有的拍照体验。

也就是说,麒麟970的推出,是传统智能手机和未来AI手机的重要分水岭,标志着AI手机的发展已从单纯的算法优化进入了硬件能力的真·人工智能比拼阶段。

2018年8月,同样是在柏林电子消费展上,华为又发布了全球首款7nm人工智能手机芯片——麒麟980。7nm是什么概念?要知道,一根头发丝的直径约为0.1毫米,7nm是头发丝的万分之一,相当于70个原子直径。而就是在这个不到1平方厘米的麒麟980芯片内部,布局有超过69亿个晶体管,这几乎逼近了硅基半导体工艺的物理极限,麒麟980真正实现了在针尖上翩翩起舞。

华为消费者业务CEO余承东表示,麒麟980的7nm工艺是由超过1000多名半导体工程师组成的团队历时3年、经历超过5000多次的工程验证精心打磨的成果。

相对于麒麟970,麒麟980有移动端双NPU强大算力加持,在性能上全面升级。以图像识别速度为例,麒麟970每分钟可识别约2005张图像,而麒麟980每分钟可识别4500张,速度提升120%。此外,麒麟980也给人脸识别、语音助手、AI拍照,及各类智能美拍P图等手机APP带来了全面升级。

除此之外,华为还推出了麒麟710、麒麟810芯片,意在让更多消费者享受到人工智能带来的体验升级。其中,后者是华为首款采用自研达芬奇架构NPU,第二款采用7nm工艺的手机芯片。

至此,华为完成了第一轮在手机端的AI芯片布局(麒麟970、麒麟980、麒麟710、麒麟810),带领着手机全行业正式走入了AI时代。

华为正式发布最强算力AI芯片升腾910,这款处理器到底有多强?

升腾 910 采用了 7nm EUV 工艺,并用上了 Da Vinic 达芬奇架构。华为官方在发布时提到,升腾 910 的运算能力相当于 50 个当前最前的 CPU,它的训练速度也是比目前最强的 AI 芯片还要强 50%-100%。

根据华为官方公布的测试数据,升腾 910 已经达到了设计规格预期。升腾 910 的 FP16 算力达到 256 Tera-FLOPS,INT8 算力达到 512 Tera-OPS。重要的是,升腾 910 达到规格算力所需功耗仅 310W,明显低于设计规格的 350W。

升腾 910 总体技术表现超出预期,已经把升腾 910 用于实际 AI 训练任务。比如,在典型的 ResNet50 网络的训练中,升腾 910 与 MindSpore 配合,与现有主流训练单卡配合 TensorFlow 相比,显示出接近 2 倍的性能提升。


华为发布最强AI训练集群Atlas 900的意义何在?

日前,在华为全联接2019大会上,华为副董事长胡厚昆发布了Atlas 900 AI训练集群。

此次发布的Atlas 900 AI训练集群由数千颗升腾910 AI处理器互联构成,每颗升腾910 AI处理器内置32个达芬奇AI Core,单芯片提供比业界高一倍的算力。集群总算力达到256P~1024P FLOPS @FP16,相当于50万台PC的计算能力。

华为已在华为云上部署了一个Atlas 900 AI训练集群,集群规模为1024颗升腾910 AI处理器。华为以极优惠的价格,面向全球科研机构和大学,即刻开放申请使用。

传统上,我们对华为的认知是一个做基站的通讯业厂商,后来华为开始做手机,是一个手机厂商,而事实上,华为还有一个企业业务BG,为企业服务也是华为的重要业务。

那么,华为搞这个Atlas 900 AI训练集群的目的是什么?这个东西到底有多先进?其意义何在呢?

一、 升腾910的实力

最近几年,随着深度学习算法的突破,人工智能开始热了起来。但是人工智能的计算模式与传统的CPU计算不太一样,这让算力成了瓶颈。

一开始,人们用很多CPU组成传统的超级计算机,做AI计算。

后来,人们用GPU并行计算的优势,把GPU做人工智能计算。我们熟悉的AlphaGO,就是在nVIDIA的GPU上训练的。

但是,从理论角度,GPU设计出来是跑 游戏 ,跑设计的,而不是为了计算的。后来nVIDIA的黄老板发现,这么强大的计算能力只用来玩 游戏 太浪费,搞出来通用计算,GPU才能跑计算。

而那个时候,深度学习还没突破,人工智能还没热闹起来,所以GPU跑AI计算其实也是兼职,不是专职。

最后,人们干脆搞专门的芯片用来做AI计算,谷歌在搞,百度在搞,中科院投资的寒武纪在搞。

华为一开始是买的寒武纪的IP,用在自己的麒麟970上面,但是很快华为发现这个东西自己也可以来,于是就开发出达芬奇架构,搞出来升腾910。

按照华为的数据,在7nm工艺上,升腾910相比Nvidia 12nm下的Tesla V100要快一倍。

因为Tesla V100不仅算AI,也要当超算的加速器用,阉割一下还得当显卡用,所以晶体管不能全部用在算AI上。

而升腾910是专用的,这个差别,类似于CPU挖矿,GPU挖矿和矿机芯片挖矿的区别。

从专用芯片比较,百度的昆仑,寒武纪公布的芯片算力效率也很强大。但是它们相比华为的硬件实力有很大差距。

所以,华为的产品已经流片上线,它们的产品还在PPT和流片实验阶段。

目前,你能用上的AI计算,华为的方案是最强的。

二、 华为的意图

目前,华为的升腾910和Atlas 900 AI训练集群对外不销售,而是通过网络提供廉价的算力。

从成本上看,Atlas 900 AI训练集群采用“HCCS、 PCIe 4.0、100G以太”三类高速互联方式,高速低延迟互联的另外一个涵义就是“贵!”。

而升腾910用7nm流片,7nm本身就很贵,nVIDIA还用便宜的12nm,华为用昂贵的7nm加上昂贵的高速互联,成本应该高很多。

但是,华为偏偏不高价卖。

nVIDIA的Tesla V100一个卖1万美元。谷歌对外租,但是你要租一个32核的算力一个小时24美元,租一年优惠价是37842美元。

华为的价格还没出来,但是华为说了会以极优惠的价格,面向全球科研机构和大学。

华为高成本搭建算力平台,低价出租,这是做慈善吗?

当然不是,华为的意图也很有意思。

现在人工智能热,相当于淘金。而华为,nVIDIA和谷歌(未来也许有百度、寒武纪)是卖水的。

在通讯行业,电信运营商是淘金的,华为、诺基亚,爱立信是卖水的。

华为知道卖水能发财,目前这个布局期,我卖便宜点,尽量让淘金者喝我的水,然后习惯用我的杯子,我的水桶(AI配套的软件框架),等你习惯了,整个AI业界都用我的算力。我再舒舒服服的收费,淘金者就只能从我这买水了。

这个策略,和当年微软纵容盗版Windows一样,你习惯用Windows不是个系统问题,而是整个生态都在Windows下没法换了。X86处理器也没法换。

这是华为的意图。

三、 华为的AI大局缺一个百度

我们知道,当年在桌面计算上。是Wintel联盟,英特尔出硬件,微软出软件,搭建生态系统。

后来移动领域,是AA,ARM和安卓,ARM和苹果。

华为要搞这个,不仅是开放算力的问题,还需要有一个搞软件,搞应用的把算力需求放到华为平台上来。

这个人是谁呢?百度最合适

百度深耕AI的年头很长,布局时间和谷歌差不多,其他家的AI还在概念的时候,百度的AI已经落地到工业企业,用于质检,物流,客服很多领域了。

百度的做法是,前台服务结合行业,后台算力在百度的AI云上,百度提供软件框架,落地到解决方案。百度云端相当于AI的大系统。

华为的AI卖水要成功,需要和百度结合起来,华为AI提供算力,百度把华为的AI算力,做成AI云平台,让应用端直接调用,应用端解决实际问题。

最后是任何行业需要AI提高效率,那么它就用百度AI云平台的方案,直接调动功能。而百度AI再使用华为的AI计算硬件的算力。

华为与百度联手,或者能够变成AI时代的Wintel。


2018年,华为退出全栈全场景ai解决方案。该解决方案中,哪一款产品

DoNews 3月28日消息(记者 赵晋杰)在3月28日的华为开发者大会2020上,华为宣布全场景AI计算框架MindSpore在码云正式开源,并推出企业级AI应用开发者套件ModelArts Pro。至此,华为在2018年全联接大会上发布的全栈全场景AI解决方案,已面向开发者全面落地。
在2018年华为全联接大会上,华为首次发布了全栈全场景AI解决方案,包括芯片、芯片使能、训练和推理框架和应用使能全堆栈方案,可在公有云、私有云、各种边缘计算、物联网行业终端以及消费类终端等全场景部署。
2年后的这场开发者大会上,华为系统展示了该解决方案的最新进展,尤其是面向开发者的具体落地成果,全面支持全球开发者更好地开发AI应用。据华为官方统计,华为开发者大会2020举办的第一天,全球在线观看人数超过1000万。
华为MindSpore首席科学家、IEEE Fellow陈雷教授宣布华为全场景AI计算框架MindSpore在码云正式开源,并将致力于构筑面向全球的开源社区,持续推动AI软硬件应用开源生态繁荣发展。
陈雷教授介绍,MindSpore着重提升易用性并降低AI开发者的开发门槛,“MindSpore原生适应每个场景包括端、边缘和云,并能够在按需协同的基础上,通过实现AI算法即代码,使开发态变得更加友好,显著减少模型开发时间,降低模型开发门槛。通过MindSpore自身的技术创新及MindSpore与华为升腾AI处理器的协同优化,实现了运行态的高效,大大提高了计算性能;MindSpore也支持GPU、CPU等其它处理器”。
针对行业AI应用开发者,华为云通用AI服务总经理袁晶还发布了业界首款企业级AI应用开发专业套件ModelArts Pro。华为云ModelArts Pro定位为企业AI生产力工具,提供了一种全新的行业AI落地方式,将算法专家的积累和行业专家的知识沉淀在相应的套件和行业工作流(workflow)中,以“授人以渔”的方式助力企业构建AI能力,赋能不同行业的应用开发者,让AI变得触手可及。
截至目前,华为表示已与数十家伙伴合作,推动基于华为升腾AI处理器的Atlas系列模块、板卡、小站、服务器在智慧交通、智慧电力、智慧金融、智慧城市、智能制造等数十个行业落地。
同时为了进一步丰富华为AI生态、支撑开发者自定义算子,华为Atlas数据中心业务总经理张迪煊在大会现场启动了高效算子开发工具TBE的正式公测,并计划激励100家以上贡献算子的高校和合作伙伴、充分释放升腾AI处理器的算力潜能。(完)

华为是如何率先推出ai处理器的?

华为ai处理器有什么用
华为ai处理器搭载AI芯片,AI芯片最大的优势就在于人工智能方面, 在引入人工智能的深度学习能力后,可实现系统内部资源智能分配以及用户行为预测。进而实现从UI、应用启动、系统响应、图像识别等方面,进行全面升级,带来持久流畅的体验。
ai处理器到底是什么
ai处理器搭载其手机是让AI处理器的手机成为名副其实的AI手机,让AI技术真正落地。它也将会是AI从云端到终端的重要一员。
AI芯片
AI芯片也被称为AI加速器或计算卡,即专门用于处理人工智能应用中的大量计算任务的模块(其他非计算任务仍由CPU负责)。当前,AI芯片主要分为 GPU 、FPGA 、ASIC。
AI芯片的原理是什么
AI的许多数据处理涉及矩阵乘法和加法。大量并行工作的GPU提供了一种廉价的方法,但缺点是更高的功率。具有内置DSP模块和本地存储器的FPGA更节能,但它们通常更昂贵。
AI芯片该使用什么方法原理去实现,目前仍然众说纷纭,这是新技术的特 点,探索阶段百花齐放,这也与深度学习等算法模型的研发并未成熟有关,即AI的基础理论方面仍然存在很大空白。这是指导芯片如何设计的基本前提。因此,目前集中在如何更好的适应已有的数据流式处理模式进行的芯片优化设计。

华为正式发布最强算力AI芯片升腾910,这款处理器到底有多强?

8月23日下午华为最新最强大的AI处理器升腾910,是目前为止世界上运算最强悍的AI处理器,名字带有中华古典文化气息,就叫做升腾910。同时发布的还有,全场场景AI计算框架MindSpore。

华为公司轮值董事长许直军在发布会上表示:“升腾910”,MindSpore的非出,标志着华为已经完成全栈场景AI,解决方案的构建,也标志着华为AI战略的,执行进入新的阶段,根据了解,升腾910采用7nm EUV工艺打造,内置华为32核自研达芬奇架构,其运算能力达到爱256tfops。

而POPPUR也了解到,升腾910,共有两大亮点,其一:它目前世界上运转能力最强,训练速度最快的AI芯片,运算力是国际顶尖AI芯片两倍,而训练速度也比目前最新最强的AI芯片,提升50%~100%,其二:配套MindSpore计算机框架如虎添翼。

MindSpore,创新编程范式,AI科学家和工程师更易使用,便于开放式创新,该计算机框架,可满足终端,边缘计算,云场景需求,更能保护好数据隐私。MindSppore计算框架与升腾910搭配,能最大化利用芯片算力。同时华为也宣布,MindSppre将在2020年第一季度实现开源,作为每位开发者,促进AI产业生态发展。

在会后的采访中,徐直军也表示升腾910只是Ascend-Max系列的产品,Ascend系列AI芯片还有Mini, Lite, Tiny和Nano这四个系列。

华为轮值董事长许直军还正在会上预告,华为全连接大会 2019年将于9月18日在上举行,届时,华为还会发布其他跟AI相关的产品。