一、模型算力需求现状与差距
头部大厂模型水平逼近 GPT3.5,GPT4.0 所需算力约为 GPT3.5 的 10 倍,预计为 4 - 5 万 P,智谱大模型与 GPT4.0 有较大差距。推理端 AI 算力需求持续上升,自去年第四季度以来,上线产品日活用户数稳定增长,如商汤月需求约每月增长 15%,绘图、视频生成及相关 AI 技术需求显著上升。
二、行业算力需求情况
整体供需状况:算力需求极为庞大,供需比约在 1:10 甚至更高,许多行业尚未充分意识到自身算力需求,如传统电商和游戏行业。
需求客户领域
传统云大厂:如 BBAT 等,因采购量大,通常直接从英伟达直采并自建 AIDC,并非算力租赁潜在客户。
大模型厂商:如科大讯飞、北京智源、质谱华章等在各地积极寻找稳定算力合作伙伴,每家对算力需求均在万 P 以上。
科研院所和大专院校:大学的生物医药、计算机和数理化等专业算力需求巨大,平均在 1000P 以上,仅 39 所 985 高校打包算力需求就在 4 万 P 以上,中科院体系预估 1 万 P 以上,整体科研院所后续需求接近 10 万 P。
游戏公司:对 AI 多持观望态度,主要受牌照和大模型技术路径不确定影响,但按其上报需求,一款游戏需求可能在 5000P 以上,主要用于优化 NPC 和场景皮肤及早期游戏设计。若每年有 500 款新游戏上线,仅游戏领域对算力需求将超 25 万 P,这也是众多游戏公司囤算力的原因,小公司积极锁定租赁客户。
银行、电力、市政等:目前需求不大,但已开始规划,银行因客户数据量巨大已入场抢算力,上海等地在数据产业布局上较为前瞻,其他地区正跟进。
三、英伟达发货政策及国内分配情况
发货政策:优先本土,国内货量不到两成。
国内分配:优先互联网大厂,小鹏去年直采量较大,BBAT 也直采,整体占国内量一半。剩余部分通过服务器厂商出货,浪潮信息占此份额的 70%,新华三等七八家占其余部分。
四、服务器相关情况
白牌与品牌服务器差异:传统云计算服务器白牌和品牌无明显差别,但 AI 服务器因类 NVLink 和大数通等,下游很多客户点名要浪潮品牌服务器,因其在调试集群时通过率差距较大。与浪潮信息合作重要,其保供对算力租赁品牌推动作用大,未来客户不仅关注英伟达,也重视服务器品牌稳定性。
国产算力服务器状况:各家都在测试,单卡性能与英伟达不相上下,但集群方面差距明显,如华为升腾单卡超英伟达同级别,但集群各项指标有差距。
五、算力租赁价格走向
按经验,90% 以上算力需求未苏醒,以游戏公司为例,若其后续意识到 AI 能力,仅游戏领域对算力租赁需求一年可达百亿以上。目前供需比 1:10 大致准确,若考虑英伟达供应紧缺,比例可能更高。
六、算力租赁公司情况
约十几家算力租赁公司(含传统云计算厂商)号称要做或正在做。传统 IDC 有现成客户和资源,但闲置率高,老板投入魄力不足,可能因前几年投入过剩。AIDC 与 IDC 区别大,AIDC 能耗要求远高于 IDC,网络配置难度高,堪比 5G 基站复杂度,需英伟达、浪潮和机房网络工程师共同协作。
七、未来方向探讨
海外算力是一个可探索方向,需在海外寻找合适专线、能耗达标机房且电费低廉,因很多游戏公司出海,海外大学也是巨大市场,且海外买卡相对容易。对英博、中贝、六尺等算力租赁公司进行了评价,英博前瞻能力强但缺资金;六尺团队有比特币及矿机经验,在芜湖运作;中贝动作大,到处签项目和买卡,还计划涉足海外算力。

本文地址:http://www.wjmplastics.com/weiketang/554.html
未标注转载均为时寒冰微课堂内容,转载请注明文章出处:
发表评论