AI革命之算力-前瞻行业

AI革命之算力|前瞻行业

人工智能要想持续发展，算力必须快速提上去，空间和机会不言而喻。

文/每日财报刘锋

世界经济论坛发布的最新报告显示，未来五年内，由于人工智能、数字化以及绿色能源转型和供应链回流等其他经济发展，全球近四分之一的工作岗位将发生变化。

当然，不同的国家会因为人工智能技术的差异，取代速度也会有所差异。而目前这种取代趋势的快慢，并不受制于人工智能技术本身的发展，而是受制于算力。

所以AI要想继续发展，算力是第一位。

ChatGPT的总算力消耗大约为3640PF-days（每秒计算一千万亿次，需要计算3640天），且随着持续进化迭代，GPT所需的算力规模还在呈指数上升。据OpenAI首席执行官Sam Altman透露，GTP-5的参数量将是GTP-3的100倍，需要的计算量则是GTP-3的200-400倍。

千亿美金GPU

TrendForce 预计，2023 年全球 AI 服务器（推理）出货大约在 14.4 万台，到 2026 年预计实现出货量 20.0w 台。假设训练 AI 服务器和推理 AI 服务器的比例为 1:4，则可以得到 2023/2026 年训练服务器的数量大约为 3.60/5.00 万台。

GPU 在 AI 服务器中价值量占比接近 50%。

以 Nvidia DGX A100 为例，其搭载了 8 张 Nvidia A100 Tensor GPU，根据新浪科技数据，Nvidia DGX A100 售价约为 19.9w 美金；Nvidia A100 Tensor 价格为 1.00~1.20w 美金。按照 1.20w 美金售价计算可得出 GPU 在 Nvidia DGX A100 价值量占比约为 48.24%。

GPU 是图形处理器的简称，它是一种专门用于处理图形、视频、游戏等高性能计算的硬件设备。GPU 相对于传统的中央处理器（CPU）而言，其拥有更多的计算核心和更快的内存带宽，能够大幅度提高计算效率和图形渲染速度。现阶段，随着例如英伟达 A100、H100等型号产品的发布，GPU在算力方面的优势相较于其他硬件具有较大优势，GPU 的工作也从一开始的图形处理逐步转化为计算。

游戏和娱乐市场一直是GPU市场的主要驱动力，因为这些领域需要高性能的 GPU来支持更高质量的游戏画面和娱乐内容。同时人工智能和机器学习的发展对GPU市场也有着巨大的影响，因为这些技术需要大量的计算能力，而 GPU可以提供比CPU更高的效率。此外，科学和研究领域的需求以及新兴市场（如游戏机和数据中心）也对 GPU 市场的规模产生了影响。根据 Verified Market Research 数据，2021 年全球 GPU 市场规模为 334.7 亿美金，预计到 2030年将达到 4473.7 亿美金，期间 CAGR 33.3%。

在集成电路中，Intel 创始人之一戈登摩尔曾今提出：集成电路上的可容纳晶体管数量大约在 24 个月就会增加一倍，后续这个时间被更新为 18 个月。目前在 GPU 领域，英伟达创始人之一黄仁勋也给出了自己的理解：GPU 性能提升一倍所需的时间约为 1 年，这相较于摩尔定理在集成电路中的速度提升了 1.5 倍左右。

根据英伟达总裁 Bill Dally 表示，自 2012 年开始直到 2021 年的 A100 产品面世，GPU 单芯片推理性能提升了约 317 倍，而其中工艺制程仅由 28nm 提升至 7nm。

国产替代，势在必行

全球范围内，人工智能、云端计算和独立 GPU主要为英伟达主导，旗下深度学习旗舰 GPU 产品 A100 和 H100 最高浮点算力分别实现 19.5 TFLOPS 和 67 TFLOPS；PC GPU由于涵盖集成 GPU，英特尔由于为全球 CPU 龙头，使其在 PC GPU 中份额最高。根据 Jon Peddie Research 数据，2022 年四季度 PC GPU中，英特尔、英伟达、AMD 份额分别为 71%、17%、12%；2022Q4 独立 GPU 中，英特尔、英伟达、AMD 份额分别为 6%、85%、9%。

2022 年 8 月，美国政府通知英伟达，其需要获得许可才能够向中国和俄罗斯出口任何基于最新架构的 A100 GPU 或 DGX/HGX 等系统，同时该项规定也同时适用于最新发布的 H100 GPU 或者实现类似功能的产品。

国产替代，势在必行。

国产 GPU 厂商近几年不断涌现，其中景嘉微是国内首家成功研制国产 GPU 芯片并实现大规模工程应用的企业，掌握了包括芯片底层逻辑/物理设计、超大规模电路集成验证、模拟接口设计、GPU 驱动程序设计等关键技术，在GPU体系结构、图形绘制高效处理算法、高速浮点运算器设计、可复用模块设计、快速大容量存储器接口设计、低功耗设计等方面有深厚的技术积累，先后研制成功 JM5系列、JM7 系列、JM9 系列等具有自主知识产权的高性能 GPU 芯片，为国内GPU的突破发展做出了突出的贡献。

寒武纪成立于 2016 年，专注于 AI 芯片的研发和创新。云端产品线方面，公司已先后推出了思元 100、思元 270、思元 290 和思元 370 芯片及相应的云端智能加速卡系列产品、训练整机。与互联网行业、金融领域及多个行业客户展开了合作。边缘产品线方面，公司面向边缘计算场景推出的思元 220 芯片和边缘智能加速卡已落地多家头部企业，自发布以来累计销量突破百万片。

沐曦集成电路于 2020 年 9 月成立，核心成员平均拥有近 20 年高性能 GPU 产品端到端研发经验，其打造全栈 GPU 芯片产品，推出 MXN 系列 GPU（曦思）用于 AI 推理，MXC 系列 GPU（曦云）用于 AI 训练及通用计算，以及 MXG 系列 GPU（曦彩）用于图形渲染，满足数据中心对“高能效”和“高通用性”的算力需求。沐曦的产品均采用完全自主研发的 GPU IP，拥有完全自主知识产权的指令集和架构，配以兼容主流 GPU 生态的完整软件栈（MXMACA），具备高能效和高通用性的天然优势，能够为客户构建软硬件一体的全面生态解决方案。

壁仞科技首先聚焦云端通用智能计算，逐步在人工智能训练和推理、图形渲染等多个领域赶超现有解决方案，实现国产高端通用智能计算芯片的突破。

2022 年，壁仞科技推出旗下首款旗舰 GPU 芯片BR100，其采用 7nm 制程，支持 PCIe 5.0 接口，根据壁仞科技发布会，BR100 16 位浮点算力达到 1000T 以上，8 位定点算力达到 2000T 以上，单芯片峰值算力达 PFLOPS 级别。

由于算力紧缺，ChatGPT近期频繁下调提问限制次数，GPT-4的提问上限次数先后从每4小时100次下调到50次。4月5日，OpenAI一度暂停了Plus付费会员的申请。人工智能要想持续发展，算力必须快速提上去，空间和机会不言而喻。返回搜狐，查看更多

责任编辑：