算力时代,GPU和新架构的AI芯片推进人工智能落地

一、算力时代,GPU开辟新场景

从广义上讲,任何可以运行人工智能算法的芯片都称为人工智能芯片。但是,通常意义上的AI芯片是指专门为加速人工智能算法而设计的芯片。

AI芯片也称为AI加速器或计算卡,是专门用于处理人工智能应用中大量计算任务的模块(其他非计算任务仍由CPU处理)。截至目前,AI芯片算力的发展经历了三个阶段:

第一阶段:由于芯片算力不足,神经网络没有得到重视;

第二阶段:通用芯片CPU的计算能力得到很大提升,但仍无法满足神经网络的需求;

第三阶段:新架构的GPU和AI芯片推动人工智能落地。

图片[1]-算力时代,GPU和新架构的AI芯片推进人工智能落地-4747i站长资讯

▲AI芯片算力发展阶段

目前,GPT-3模型已被MIT 评选为2021年“十大突破性技术”之一。GPT-3 模型使用的最大数据集在处理前达到了 45TB 的容量。按照算力/s-days的统计单位,训练需要1800–days,而GPT-3使用–days。

图片[2]-算力时代,GPU和新架构的AI芯片推进人工智能落地-4747i站长资讯

▲自然语言模型/会话AI平台

AI运算是指以“深度学习”为代表的神经网络算法,需要系统高效处理大量非结构化数据(文本、视频、图像、语音等)。硬件需要具备高效的线性代数计算能力,计算任务具有单元计算任务简单、逻辑控制难度要求低、并行运算量大、参数多的特点。对芯片的多核并行运行、片上存储、带宽、低延迟内存访问等提出了更高的要求。

自 2012 年以来,人工智能训练任务所需的计算能力每 43 个月翻一番,远远超过芯片行业长期以来的摩尔定律(芯片性能每 18 个月翻一番)。针对不同的应用场景,AI芯片还应满足与主流AI算法框架的兼容性、可编程性、可扩展性、低功耗、尺寸和价格等要求。

从技术架构来看,AI芯片主要分为图形处理单元(GPU)、现场可编程门阵列(FPGA)、专用集成电路(ASIC)和类脑芯片四大类。其中GPU是比较成熟的通用人工智能芯片,FPGA和ASIC是满足人工智能要求特性的半定制和全定制芯片。类脑芯片的开发仍处于起步阶段。

图片[3]-算力时代,GPU和新架构的AI芯片推进人工智能落地-4747i站长资讯

▲三种技术架构的AI芯片类型对比

2019年全球人工智能芯片市场规模为110亿美元。随着人工智能技术的成熟和数字基础设施的不断完善,人工智能的商业应用将会增加,推动人工智能芯片市场的快速增长。预计2025年全球人工智能芯片市场规模将达到726亿美元。

图片[4]-算力时代,GPU和新架构的AI芯片推进人工智能落地-4747i站长资讯

▲2019-2025年全球人工智能芯片市场规模及预测(十亿美元)

二、GPU的三大下游应用市场

GPU实际上是硬件实现的图形函数的集合,这些函数主要用于绘制各种图形所需的操作。这些与像素、光影处理、3D坐标变换等相关的操作都是通过GPU硬件加速来实现的。图形运算的特点是对大量相同类型的数据进行密集运算——例如对图形数据的矩阵运算。GPU的微架构专为适合矩阵类型的数值计算,以及大量重复设计的计算单元而设计。这样的计算可以分为无数个独立的数值计算——数值运算的大量线程,并且数据不像程序执行那样在逻辑上相关。

GPU微架构的设计和开发非常重要,而先进和优秀的微架构对于提高GPU的实际性能至关重要。目前市面上有非常丰富的GPU微架构,如Volta、()、(),分别于2016年、2017年、2018年和2020年发布,代表了 GPU的最高技术水平。

GPU 的 API ( ) API 充当应用程序和显卡驱动程序之间的桥梁。目前GPU API可以分为2个阵营和其他几个类别。两大阵营分别是微软的标准和标准,其他类别包括苹果的Metal API、AMD的(地幔)API和英特尔的One API。

AI芯片(GPU/FPGA/ASIC)在云端同时承担人工智能的“训练”和“推理”过程,主要承担终端的“推理”过程,ASIC在性能和成本上都是最优的。ASIC作为专用芯片,相对于通用芯片GPU在计算能力和功耗方面具有绝对优势,但开发周期长,实现速度慢。需要一定的规模才能体现成本优势。FPGA可以看作是从GPU到ASIC的关键过渡计划。与GPU相比,可以在硬件层面进行深度优化。与ASIC相比,在算法不断迭代进化的情况下更加灵活,开发时间更短。

从生态和落地来看,GPU具有绝对优势,处于垄断地位。开发者可以通过 CUDA平台使用软件语言轻松开发 GPU实现计算加速,该平台已得到广泛认可和普及,积累了良好的编程环境。以TPU为代表的ASIC目前主要应用在巨头的闭环生态中,而FPGA在数据中心业务中发展迅速。

2020 年 GPU 市场规模为 2.5 美元4.1 亿美元,预计到 2027 年将达到 18.5 美元3.1 亿美元,从 2021 年到 2027 年的复合年增长率为 32. 82%。GPU 市场分为独立、集成和混合市场。集成在 2019 年主导了 GPU 市场份额,但由于混合处理器同时具有集成和离散 GPU 功能,因此混合细分市场预计将见证最高的复合年增长率。

市场分为计算机、平板电脑、智能手机、游戏机、电视等。2019 年,智能手机市场主导了全球 GPU 市场份额,预计这一趋势将在预测期内持续。然而,由于医疗设备等其他设备对小型 GPU 的需求不断增长cpu占用高装系统能解决吗,预计其他细分市场未来的复合年增长率最高。由于图形处理器在设计和工程应用中的广泛使用,预计汽车应用领域将在预测期内以最高的复合年增长率增长。

总的来说,GPU主要有三大应用场景:游戏、AI、自动驾驶

1、游戏

根据 IDC 数据,2020 年游戏 PC 和显示器的出货量同比增长 26.8% 至 5500 万台。游戏笔记本电脑在 2020 年增长了创纪录的 26.9%。与 PC 相比,游戏显示器在 2020 年也达到了新的高度,与 2019 年相比增长了 77% 以上,出货量达到了 1430 万台。

IDC 预计游戏显示器的销量将在 2021 年首次超过游戏台式机。即使游戏台式机获得牵引力,增加游戏笔记本电脑的显示器连接意味着游戏显示器市场的五年复合年增长率预计将超过 10%。IDC 预计 2025 年全球销售额将达到 7290 万台,年复合增长率为 5.8%。

2、人工智能

移动AI芯片市场不仅限于智能手机,潜在市场包括:智能手环/手表、VR/AR眼镜等市场。

在边缘计算场景下,AI芯片主要负责推理任务,通过将终端设备上传感器(麦克风阵列、摄像头等)采集的数据代入训练好的模型进行推理得到推理结果。由于边缘侧场景多样且不同,对计算硬件的考虑也不同,对算力、能耗等性能要求也有大有小。因此,应用于边缘侧的计算芯片需要针对特殊场景进行专门设计,以实现最优解决方案。

图片[5]-算力时代,GPU和新架构的AI芯片推进人工智能落地-4747i站长资讯

▲ 不同边缘计算场景对 AI 芯片的性能要求

安防摄像机的发展经历了从模拟到数字、数字高清到数字智能的发展历程。最新的智能相机除了简单的记录和存储功能外,还可以实现结构化的图像数据分析。安全摄像头每天可以生成 20GB 的数据。如果所有数据都回传到云数据中心,将极大地占用网络带宽和数据中心资源。

通过在摄像头终端和网络边缘侧加入AI芯片,实现摄像头数据的本地化实时处理。经过结构化处理和关键信息提取后,只将带有关键信息的数据发送回后端,将大大减少网络传输。带宽压力。目前主流的解决方案分为:在前端摄像头设备中集成AI芯片,在边缘侧采用智能服务器级产品。前端芯片在设计时需要平衡面积、功耗、成本、可靠性等问题,最好采用低功耗、低成本的方案(如DSP、ASIC);边缘限制较少,可用于较大的服务器级产品(例如,GPU、ASIC),用于大规模数据处理任务。

图片[6]-算力时代,GPU和新架构的AI芯片推进人工智能落地-4747i站长资讯

▲AI芯片在智能安防摄像头中的应用

人工智能服务器通常配备GPU、FPGA、ASIC等加速芯片。CPU与加速芯片的结合可以满足高吞吐量互联的需求,为自然语言处理、计算机视觉、语音交互等人工智能应用场景提供强大的算力。支撑已成为人工智能发展的重要支撑力量。与传统CPU服务器相比,在提供相同计算能力的情况下,GPU服务器在成本、空间占用和能耗方面是传统方案的1/8、1/。15 和 1/8。

目前,云场景中应用最广泛的AI芯片是英伟达的GPU,主要得益于:强大的并行计算能力(相对于CPU)、通用性和成熟的开发环境。2020年全球AI服务器市场规模为122亿美元。预计到2025年全球AI智能服务器市场规模将达到288亿美元,五年CAGR达到18.8%。

图片[7]-算力时代,GPU和新架构的AI芯片推进人工智能落地-4747i站长资讯

▲2020-2025年全球AI服务器行业市场规模及增长率(单位:亿美元)

在人工智能开发中,由于深度学习模型的开发和部署需要强大的计算能力,因此需要专用的芯片和服务器。如果开发者选择自己购买AI服务器,成本太高了。通过云服务模式,按需租用超算中心的计算资源,可以大大降低项目初期的资金投入,节省项目开发期的硬件运维成本,最大限度地发挥资金效率分配。

3、自动驾驶

全球自动驾驶已进入商用阶段,未来可期。根据IDC最新的《全球自动驾驶汽车预测报告(2020-2024)》),预计2024年全球L1-L5级自动驾驶汽车出货量将达到约5425万辆,2020-2024年复合年增长率(CAGR) 达到 18.3%;2024年L1和L2自动驾驶市场占有率预计分别为64.4%和34.0% 虽然目前L3-L5自动驾驶技术的应用具有开创性意义,但L1 -L2级自动驾驶仍将是未来五年推动全球自动驾驶汽车出货量增长的最大细分市场。

我国汽车市场规模不断扩大,自动驾驶正在从L2向L3过渡。中汽协数据显示,2021年1-3月,中国品牌乘用车累计销售210.8万辆,同比增长81.5%,占比占乘用车总销量的4%。1.5%,份额比上年同期增加1.4个百分点。2020年1-9月,L2级智能网联乘用车销量达到196万辆,占乘用车总销量的14.7%。

一些企业加快了L3级自动驾驶汽车的研发,在多地开展了自动泊车、自动公交、无人驾驶智能重卡等示范应用。到2025年,我国PA(部分自动驾驶)和CA(有条件自动驾驶)级ICV销量将占当年汽车总销量的50%以上,C-V2X(基于蜂窝通信的移动互联网)车辆)终端 新车组装率达到50%。

随着传感器、车载处理器等产品的进一步完善,将会出现更多的L3级车型。而L4、L5级自动驾驶有望率先在封闭园区的商用车平台上落地。在更广泛的乘用车平台上实现高水平自动驾驶需要技术、政策和基础设施建设相结合。预计至少要到 2025 年到 2030 年才会出现在一般道路上。

图片[8]-算力时代,GPU和新架构的AI芯片推进人工智能落地-4747i站长资讯

▲2016-2030年全球汽车市场自动驾驶渗透率预测

在短时间内感知道路环境并处理海量数据。处理器在驾驶过程中依靠雷达等传感器收集合理信息后,每秒需要实时分析数千兆字节的数据,每秒可产生1G以上的数据。处理器的计算要求很高。

自动规划,即时响应,确保安全。对实时数据进行处理和分析后,需要以毫秒级的时间精度规划行车路径和车速,以保证行车过程的安全,对处理器的计算速度要求较高。

GPU兼具技术成本优势,是自动驾驶领域的主流。

三、 国产AI GPU走上快车道

2020年国内AI芯片产业投融资额同比增长52.8%。2021年1-4月投融资事项及金额均超过去年全年。资本投资于国内半导体和集成电路领域。高的。

从热门领域来看,人工智能领域是2020年资本高度看好的细分领域之一。2020年资本投资主要针对相对成熟的AI芯片公司,获得1-2甚至2轮以上融资。

图片[9]-算力时代,GPU和新架构的AI芯片推进人工智能落地-4747i站长资讯

▲AI芯片产业公司成立时间、融资历程及估值

AI芯片行业的市场预期逐渐趋于理性,创业进入市场考验期。2015-17年成立了大量的AI芯片公司。未来1-2年,市场将真正考验各家厂商的产品和技术。市场期待AI芯片具有更高的算力、更低的功耗和更低的成本。

图片[10]-算力时代,GPU和新架构的AI芯片推进人工智能落地-4747i站长资讯

▲不同公司的芯片介绍

1、木溪IC:多场景高性能GPU

Muxi IC专注于为异构计算等各种应用设计具有完全自主知识产权的高性能通用GPU芯片。公司致力于打造国内最强商用GPU芯片。产品主要应用方向包括传统GPU及移动应用、人工智能、云计算、数据中心等高性能异构计算领域。重要基础产品水平。

计划采用业界最先进的5nm制程技术,重点研发与CUDA和ROCm生态完全兼容的国产高性能GPU芯片,满足HPC、数据中心和AI的计算需求。致力于研发和生产安全可靠的具有自主知识产权的高性能GPU芯片,服务于数据中心、云游戏、人工智能等众多需要高算力的重要领域。

2、比仁科技:推出云AI芯片

比仁科技成立于2019年,公司在GPU和DSA(专用加速器)领域拥有丰富的技术储备,专注于云通用智能计算,并在AI训练与推理、图形渲染、图形渲染等多个领域逐步赶超。高性能通用计算。超越现有解决方案,实现国产高端通用智能计算芯片的突破。

图片[11]-算力时代,GPU和新架构的AI芯片推进人工智能落地-4747i站长资讯

▲比仁科技发展历程

3、绥远科技:推中国最大AI计算芯片

2021世界人工智能大会期间,上海随源科技推出第二代云AI训练芯片随思2.0和训练产品云随T20/T21,以及全新升级的雨算2.0软件平台.

Susi2.0是目前国内最大的AI计算芯片。采用ASE2.5D封装的极限,在国内率先支持TF32精度,单精度张量TF32算力可达。同时,.0也是第一款支持最先进内存HBM2E的产品。公司主要服务于消费电子、汽车电子、计算机及周边、工业、数据处理、物联网等广泛应用市场的一站式芯片定制服务和半导体IP授权服务。

随源科技成立于2018年3月19日,成立至今已连续获得5轮融资,累计融资金额近32亿元。其最新一轮融资是今年1月完成的18亿元C轮融资,由中信产业基金、中金资本旗下基金、春华资本领投。

4、地平线:智能驾驶和人工智能应用领域的服务

基于创新的人工智能专用计算架构BPU,地平线成功流片中国首款边缘AI芯片——专注智能驾驶的征程1号和专注于AIoT的旭日1号;2019年,地平线推出中国 2020年,地平线将进一步加速AI芯片的迭代,推出新一代高效车载智能芯片——征途3和新一代AIoT边缘人工智能芯片平台旭日3。

图片[12]-算力时代,GPU和新架构的AI芯片推进人工智能落地-4747i站长资讯

▲视界发展历程

对智能物联网的需求将成倍增加云计算的负载。智能物联网是未来的趋势。海量碎片化场景和计算旭日处理器强大的边缘计算能力,帮助设备高效处理本地数据。

针对AIoT,地平线推出了 Sun系列边缘AI芯片。旭日2采用BPU .0架构,可提供4TOPS等效算力,旭日3采用伯努利2.0,可提供5TOPS等效算力。

地平线成为唯一一家覆盖L2到L4的全场景车载智能芯片解决方案提供商。从2019年中国首款车规级AI芯片征途2的量产,到2020年推出第二代车规级芯片征途3。目前征途2和征途3已实现预装量产长安、长城、东风蓝图、广汽、江淮、理想、奇瑞、上汽等多家自主品牌车企的多款主打热门车型。

地平线由 2架构加速的车级计算平台,结合深度学习感知技术,为高水平自动驾驶提供稳定可靠的高性能感知系统。

图片[13]-算力时代,GPU和新架构的AI芯片推进人工智能落地-4747i站长资讯

▲​​n 系列芯片

5、黑芝麻:智能驾驶系统解决方案

黑芝麻智能科技是一家专注于视觉感知技术和自主IP芯片开发的企业。公司主要专注领域为嵌入式图像和计算机视觉,提供基于光控技术、图像处理、计算图像和人工智能的嵌入式视觉感知芯片计算平台,为ADAS和自动驾驶提供完整的商业解决方案。

黑芝麻基于华山二号A1000芯片,提供四种智能驾驶解决方案。单芯片适用于ADAS辅助驾驶;单颗A1000芯片适用于L2+自动驾驶;双A1000芯片可互联实现算力,支持L3级自动驾驶;4颗A1000芯片可支持L4以上自动驾驶需求。此外,黑芝麻还可以根据不同的客户需求提供定制服务。

黑芝麻智能与上汽合作的第一颗芯片已实现量产,第二颗芯片A1000正在量产中。在汽车领域开始量产。黑芝麻智能已与一汽、蔚来、上汽、比亚迪、博世、滴滴、迅雷、亚太机电等公司就L2、L3级自动驾驶感知系统解决方案展开合作。

黑芝麻智能科技最新华山2号(A1000)芯片,算力40-,功耗低于8W,算力利用率超强,制程16nm,符合AEC Q-10< @0、单芯片ASIL B,系统ASIL D汽车功能安全要求,是目前国内唯一支持L3及以上自动驾驶的芯片,为应对不同市场需求,黑芝麻同步发布华山2号.

图片[14]-算力时代,GPU和新架构的AI芯片推进人工智能落地-4747i站长资讯

▲黑芝麻最新产品A1000系列参数对比

除了上述玩家之外,摩尔线程等公司近期也有了新的进展,如下表所示。

图片[15]-算力时代,GPU和新架构的AI芯片推进人工智能落地-4747i站长资讯

▲国产GPU最新进展

智视认为,在传统GPU市场cpu占用高装系统能解决吗,前三名AMD、英特尔的营收几乎可以代表整个GPU行业的营收。经过多年的探索和发展,国产CPU已经形成了一定的气候,产业和生态逐渐完善。不过,国内GPU市场规模巨大,潜力巨大,但发展却远远落后于国产CPU。在AI加速计算、国产芯片自主创新、摩尔定律放缓等因素推动下,国产GPU与海外巨头的差距将逐渐缩小。

文章来源:https://zhidx.com/p/307028.html

------本页内容已结束,喜欢请分享------

感谢您的来访,获取更多精彩文章请收藏本站。

© 版权声明
THE END
喜欢就支持一下吧
点赞5 分享