一、FP8成为AI算力发展关键,国产芯片积极布局
近年来,随着大模型参数量与推理需求的急剧增长,低精度计算成为提升能效和降低推理成本的重要路径。FP8(8位浮点数)作为一种新兴的低精度数值格式,自2022年起受到业界广泛关注。2023年9月,由AMD、Arm、Intel、Meta、Microsoft、NVIDIA及Qualcomm等行业领军企业联合推出MX微缩放(Microscaling)规范,进一步推动了FP8的标准化与硬件支持。
与传统的FP16(半精度)和FP32(单精度)相比,FP8在保持可接受的精度损失前提下,显著提升了计算吞吐量、降低了显存占用与能耗。具体而言,FP8可带来以下优势:
Ø 推理吞吐量提升:单位时间内处理数据量相比FP16实现翻倍;
Ø 显存占用减半:支持更大模型装载或降低硬件部署成本;
Ø 能效显著优化:适用于大规模推理服务,有助于数据中心实现绿色低碳目标。
在这一技术趋势下,国产AI芯片企业积极推出原生支持FP8的产品。目前已量产或回片的相关芯片包括S5000、FP150/300、580/590、L600、C600/C680、BI-V200/260、VA10/16、910D、LM5050/5070等超过15款。尽管当前产能仍优先服务于高毛利及战略项目,但其技术路线已明确指向FP8生态。
二、绕过硬件限制:软硬协同成为国产算力突围新路径
在美国持续加强对华高端AI芯片出口管制的背景下,中国AI产业面临严峻的算力瓶颈。国产芯片虽然在FP16及更高精度算力方面与国际顶尖产品存在差距,但通过FP8与算法协同优化,正在构建一条具有中国特色的发展路径。
DeepSeek等国内AI企业在软件与算法层面率先实现对FP8的深度支持,为国产芯片提供了“软硬协同”的创新范式:
Ø 扬长避短:依托FP8高效率计算单元与上层模型优化,国产芯片可在特定推理场景中显著缩小与国际顶尖硬件的性能差距;
Ø 软件定义算力:竞争焦点从纯硬件性能转向“算法-硬件”协同设计,通过软件优化最大限度发挥现有算力潜力;
Ø 推动国产化替代:形成“模型–软件–芯片–服务器–应用”全内循环生态,加速国产AI基础设施落地。
三、DeepSeek带动A股市场关注国产AI产业链
DeepSeek在FP8支持方面的技术突破,不仅体现为算法能力的提升,更被资本市场视为国产AI产业链成熟度提高的重要信号。A股市场相关板块近期表现活跃,投资逻辑主要包括:
Ø 软件生态成熟驱动硬件商业化:DeepSeek的成功验证了国产硬件在先进算法加持下的可行性,提振了整个产业链信心;
Ø FP8芯片企业受益明显:包括S5000、FP150/300、L600、C600/C680、Ascend 910D等在内的国产FP8支持芯片企业关注度显著提升;
Ø 系统级与生态级投资机会显现:覆盖芯片设计、服务器制造、云平台服务及AI应用等多个环节。
这一市场反应不仅体现技术突破本身,更反映市场对“中国式创新路径”的认可——即通过软件能力弥补硬件差距,以系统级优化实现整体性能提升。
四、NVIDIA H20停产:政策与市场双因素下的必然结局
NVIDIA专为中国市场推出的特供版AI芯片H20近日传出停产消息。该产品自推出之初就受到美国出口管制政策与中国自主可控战略的双重影响,其生命周期成为中美科技竞争的一个典型样本。
1. 美出口管制与H20的诞生
2022年10月,美国商务部工业与安全局(BIS)发布对华高端计算芯片出口限制新规,直接针对NVIDIA A100/H100等产品。为维持中国市场,NVIDIA于2023年底推出包括H20在内的“合规版”芯片。其基于Hopper架构,FP16算力不足H100的五分之一,但保留了96GB HBM3显存。
2. 中国市场反响平淡与政策再加码
2024年,H20在中国市场未获广泛采纳。其性能难以满足大规模训练需求,而国产芯片如华为昇腾910B在性能、本土化服务和政策支持方面展现出竞争优势。2025年4月,美国进一步收紧出口限制,将H20纳入许可管理范围,导致其出货暂停。
3. 短暂许可与最终退市
2025年7月,NVIDIA与美国政府达成协议,可通过缴纳15%销售额获准对华出售H20。然而,中方随后明确建议国内企业优先采用国产芯片,并对H20潜在安全风险提出质疑。2025年8月,英伟达决定停止H20生产。
五、总结与展望
企业对算力的需求,促进了算力平台的发展,天罡智算平台(https://www.tiangangaitp.com)就是其中的佼佼者:提供弹性GPU算力,灵活选择GPU类型和数量,按需动态使用,打破固定时长租期的束缚,只需为实际使用的资源付费。除了算力,还提供镜像、存储服务等一系列配套服务,并对完成实名认证的企业客户,提供4090 GPU 50个卡时的免费使用优惠。

FP8不仅是一项技术演进,更是中国在全球AI算力竞争中新策略的体现。通过算法创新与硬件协同,国内企业正逐步摆脱对国际高性能GPU的绝对依赖。DeepSeek在FP8支持方面的突破,以及国产芯片企业的快速响应,表明中国AI产业正在形成以内循环为主、软硬结合的新发展模式。
与此同时,NVIDIA H20的退市反映出在日益复杂的国际政策环境中,纯粹依靠“降规特供”模式难以持续。未来,中国AI产业需继续推进基础芯片研发、扩大软件生态影响力,并在开放合作与自主可控之间寻求更优平衡。

登录 或 注册 后才可以进行评论哦!
还没有评论,抢个沙发!