3个月27亿AIGC大单国产“算力黑马”杀疯了
时间: 2024-02-23 16:27:51 | 作者: bob线上平台官网
2023年,国内AI企业纷纷患上“算力饥渴症”。从互联网大公司到生成式AI新秀,在推出首款大模型后,算力成为提升产品竞争力的核心资源。
尽管云巨头相继推出令人眼馋的大模型训推“全家桶”,但实际可用的算力仍是稀缺资源。百模大战空前激烈,快速迭代刻不容缓,大模型企业们必须在格局稳定前占领市场的前排。
就在过去半年,百川智能、MiniMax、深言科技,这三家知名的国内大模型初创公司,纷纷投向了一家算力新贵的怀抱。
它是“彩票大王”鸿博股份的全资子公司,踩着英伟达GPU算力红利的顺风,扛起了母公司转型的希望,带动鸿博股份股价在2023年最高飙涨580%,一扫连跌六年的阴霾;又因为与英伟达的合作伙伴关系引发种种遐想,曾招致深交所数份关注函的“灵魂发问”。
它拿下了国内最大资金规模的算力服务协议:10月,与北京京能签订共建超大型智算中心的合同,总金额近10亿元;12月,与大模型公司百川智能签订近14亿元算力大单,同月公布与多模态大模型公司MiniMax近3亿元的合同。
神秘、跨界、炒作、妖股……各种传言长期聚拢在英博数科的周遭,但随着一个个大模型算力订单公布,质疑声逐渐消散,取而代之的是对其商业模式的关注:
从籍籍无名到算力黑马,从摸着石头过河到连签过亿订单,一家没有算力背景的年轻公司,如何拿到稀缺的英伟达算力资源?又凭什么从云大厂“虎口夺食”,获得了国内头部大模型创企们的青睐?作为传统行业转型算力租赁的典例之一,鸿博股份和英博数科代表了怎样的产业真相?
近日,智东家对话鸿博股份副总裁、英博数科CEO周韡韡,揭开十亿级大模型算力订单与算力租赁商业模式背后的思考。
在国外,美国密码货币挖矿商CoreWeave成为年度最火“算力黑马”之一,凭借转型兜售GPU云服务,以数万块GPU芯片狂揽数十亿美元的算力大单,全年营收预估暴涨1567%。
在国内,受益于如火如荼开展的“百模大战”,多个算力概念股被热潮带飞,股价连涨一年。“彩票大王”鸿博股份、“味精大王”莲花健康、舷外机龙头恒润股份、游戏大厂世纪华通……都踏上了买卡、建智算中心、出租GPU算力的道路。
相关智算基建布局在2023年下半年集中爆发。千P级智算中心建设规划、数亿到10亿元的GPU服务器采购及算力租赁订单比比皆是。狂热的GPU算力烈焰一路烧到2024开年。仅是在1月3日~4日两天,锦鸡股份、青云科技公布了三笔亿级AI算力出租大单,合计超过12亿元。
而在一众算力股中,最抢眼的当属互联网彩票龙头鸿博股份,其全资子公司英博数科已经拿下了几家大模型公司的算力订单。
包括百川智能、MiniMax、深言科技在内的大模型创企,潞晨科技、无问芯穹等明星大模型中间层技术服务商,以及中科朗克等细分垂直行业领军企业,都已经是英博数科的客户。
鸿博股份由尤玉仙、尤丽娟姐妹创办于1999年,2008年5月凭借彩票印刷业务在深交所上市,成为“互联网彩票第一股”,上市首日收盘价3.35元/股。鸿博股份的股价在2015年最高涨到30.16元/股,也是在这一年,其主营业务受政策影响遭逢重挫,从此开始频频探索跨界转型。
这家互联网彩票印刷龙头的转型方向包括大数据、5G、RFID智能标签、手游……但几度跨界都不顺利,自2018年起,其印刷业务营收连年下降,并处于亏损状态。到2022年8月终止跨界收购广州智能扫地机器人研发商科语机器人时,鸿博股份的股价已跌至7.92元/股。
当外界为它的再度转型失败而唏嘘时,鸿博股份又马不停蹄地一脚迈进算力赛道。
2022年4月,鸿博科技跟英伟达签订采购协议,非常爽快得买了20台A100 DGX;6月1日,鸿博股份投资1000万元设立英博数科;2个月后,由英博数科运营的北京·AI创新赋能中心项目落地,鸿博股份郑重进入AI算力租赁业务板块。
这个前瞻性的选择,让鸿博股份开启了“算力黑马”模式的新副本,并在半年后吃上了AIGC算力供需失衡的红利,股价冲天,身价暴涨。
由前搜狗CEO王小川与前搜狗COO茹立云创办的百川智能成立于2023年4月,自6月起以几乎每月一次的速度高频迭代其模型,已经挺进国内大模型创企第一梯队,对算力的需求可谓饥渴。
在8月举行的百川智能沟通会上,王小川透露称已有阿里云、腾讯云、火山引擎、浪潮、顺丰科技等超过150家合作伙伴使用Baichuan模型,百川智能在同时使用阿里、腾讯的云服务。
10月,王小川在云栖大会上作为大模型企业代表,透露了阿里云支撑百川智能完成千卡大模型训练任务;没多久,百川智能又为腾讯云背书,联合腾讯云向量数据库搭建基于用户知识库的智能问答演示系统。而后,阿里、腾讯、小米等这科技巨头都参与了百川智能的3亿美元A1融资。
在接受媒体采访时,王小川曾谈道,大模型行业训练和推理算力的合计成本占大模型总成本的40%以上。这道出了大模型创企普遍面临的资源压力:在首轮排位赛角逐出胜负之前,大模型训练对算力的渴求没有止境。
就当大家还在观望哪家云巨头能拿下更多大模型订单时,12月初,一纸围绕百川智能的云服务协议公告,将业界的视线聚拢到了一家名不见经传的“小公司”英博数科身上。
根据鸿博股份12月5日公布的交易合同内容,英博数科将分别在不晚于2024年1月30日、4月30日前分两批交付协议约定的英伟达DGX/HGX H系列智算服务器,涉及总金额13.82亿元。
同月,AI多模态大模型公司MiniMax也与英博数科就GPU算力租用达成签约,合同总金额接近3亿元,包括多款GPU的租赁使用等。
往前看,10月,英博数科与北京京能签署了近10亿元合同,由北京京能作为主要出资主体,双方共建超大型智算中心。
在更早的6月份,英博数科与大模型创企深言科技签约,将提供不低于1280P的算力。此时英博数科累计签约合同额超过2亿元,已完成5120P AI算力租用服务协议的订单签约。
来自国内大模型“顶流”创企们的背书,给英博数科的履约能力、库中和途中GPU存量保证带来了真金白银的认证,也代表着英博数科已经站上了大模型算力造富运动的前锋。
成立不满17个月、团队超过50人、背靠几度转型失败的“彩票大王”,英博数科的手里似乎并没有特别亮眼的王牌。
可就是这样一家小公司,在激烈的云服务与算力租赁竞争中,接连拿到头部大模型创企的订单,独享了“泼天的富贵”。
2023年,英博数科先是在2月交付了首个DGX A800算力集群,6月H800陆续到货,8月完成1000P由A&H系列智算服务器组成的AI算力集群部署调优,10月累计交付3000P AI算力,能向客户交付相当规模的GPU算力资源。
据艾瑞咨询统计,大模型占据2023年中国智能算力总需求的58.8%,是最大需求方。
当美国政府的一纸限令叫停了英伟达对华高性能GPU芯片的供应,当云巨头对外可供训练的算力资源告急,拥有完整DGX交付能力的英博数科“备胎转正”,顺其自然成为大模型企业的首选。
据周韡韡分享,在国内,大集群的稀缺性带来溢价收入,128台机器的集群,每台设备单价会高于同级别客户使用32台集群的单价租金。
此前鸿博股份曾在互动平台披露,截至2023年9月,英博数科仅对外提供服务器整机包月一种租赁方式,A系列服务器刊例价为16万元/月/台,H系列服务器刊例价为29.9万元/月/台。
鸿博股份可以在一定程度上完成跨界转型逆风翻盘,离不开促成DGX合作的关键人物周韡韡。
她曾是媒体人,拥有澳大利亚阿德莱德大学金融学学士、悉尼大学传播学硕士、国际政治经济关系博士学位,曾任澳视传媒执行董事、澳中文化友好交流协会秘书长及36氪副总裁。
2014年刚回国时,她一边学习正处于国内风口的互联网+,一边利用以往累积的财经、科技信息做早期阶段项目的投后跟进,这其中有互联网彩票、游戏、DSP流量平台等,也有后来知名的商用无人驾驶公司图森未来,这些项目基本都在5年内完成独立IPO或并购成功退出。
2017年8月,图森未来宣布完成数千万美元B轮融资。当英伟达赫然出现在投资方之列,图森未来的一众技术大牛们狂喜。正是从他们口中,周韡韡明确感受到科技从业者们对英伟达的认可。
命运的齿轮开始转动。大约在三年前,判断元宇宙必将成为未来生产生活方式后,周韡韡萌生了承接算力基建的念头。她相信现有进程与真正的元宇宙之间还差一个通用AI(AGI),而AGI必然会开启一波新的基建潮。
在她看来,这个基建具有强刚需、高粘性、少SKU的特点,值得一干,而英伟达几乎是提供算力硬件的最佳选择。
从2021年底开始,周韡韡带着团队进行智算行业调研,并集海内外多方力量、资源、团队为算力储备努力,目标就是打造北京智算中心样板,然后在全国推广复制。
一直到2022年8月,鸿博股份等多方共同发起北京·AI创新赋能中心,由英博数科作为唯一指定运营主体,推进算力出租、云资源采购一站式服务、AI教育培训、产业实验室等主要业务。
此时生成式AI方兴未艾,AI文生图应用现象级走红,但“大模型”概念尚未出圈。在英博数科成立3个月后,AI领域的里程碑产品ChatGPT才惊世出场,在整个科技行业掀起一股堪称改朝换代的创新狂澜。周韡韡的关注重心也随之转向通往元宇宙的中间工具——AIGC(AI内容生成)。
2023年,AI行业迎来了新燃点。大模型与AIGC热潮,将英伟达推上万亿美元市值的王座,也给许多亟待转型的传统企业们送来了前所未有的机遇:大量的英伟达GPU设备采购协议铺天盖地,“AI算力”几乎成了提振股民热情的永动机。
但困难也接踵而至。产品涨价、竞对降价、设备禁售……一道道难关开始摆在英博数科的眼前。
2023年2月,智算中心一期所有设备及配套软件全部到货,共有100P算力的DGX标准单元SuperPOD集群开始组网调优。此时周韡韡发现,能租得起、用得上庞大DGX算力的客户,只有大模型企业。
在英博数科成立初期,周韡韡跟王小川就AI发展前途和基础设施建设需求来做讨论。在王小川的建议下,英博数科在第一阶段确立了“专业多模态大模型AI算力服务平台”的定位,并将核心任务锁定在一件事上——买货。
针对大模型训练需求,一期智算中心的DGX系列服务器由原计划的40G版本升级为80G版本。当别的企业还在观望时,英博数科2月向原厂商完成了远超现阶段业务需求的算力设备订单锁定,随后其第一批设备赶上了美国对华芯片限令,团队立即将计划提速,在6月30日前完成了未来14个月的算力需求订单储备。
基于这些先手,当10月美国调整对华贸易政策致使许多高性能AI算力芯片贸易受阻时,英博数科正面回复:美对华芯片贸易政策对已经交付和系统内已存在的订单交付没有影响。
到货只是第一步,英博数科接下来要应对的挑战,是如何通过集群优化和软硬协同调优,真正支撑起大模型训练的高效运转。
周韡韡记得,从第一个由20台DGX服务器(160张GPU)组成的100P算力集群开始,客户与英博数科一手一脚一同搭建并调试出超越原厂标准参数的训练效率,用超高的性价比的国产通讯设备跑出了与昂贵进口设备基本持平的效果。
百川智能在4月成立之初就跟英博数科签署了未来12个月的英伟达GPU算力租赁服务合同,是英博数科智算中心测试期的合作伙伴和顾问,也是其智算中心5月正式运营后的第一个签约付费客户,英博数科由此开始产生营收。
在英博数科技术团队尚处于组建的阶段,百川智能的技术骨干为英博数科智算平台提供了从短期服务定位到长期发展目标、集群优化、极限峰值压力测试等一系列的沟通建议,以及对智算集群极限压力测试所使用的大模型。
由此积累的集群优化与模型发展相结合的调优加速能力,也成为了英博数科构建差异化竞争力、加速获客的优势所在。
从6月底开始,H800服务器批量到货并进行了首轮单机对比测试。英博数科团队公开了大语言模型实际测试数据,希望可以帮助客户结合自己发展阶段做出更具性价比的参考。
但算力租赁赛道已经相当拥挤,也没什么高技术壁垒,美国对华限令不见松动,凭借硬件设备储备的优势来营生终归不是长久之计。
在英博数科第一个算力集付的时候,周韡韡曾被问过一个尖锐的问题:“如果有一天,英博数科失去了设备原厂支持,甚至失去了硬件优势,之后该怎么生存?”
她很清楚,鸿博股份是传统企业出身,做技术研发拼不过互联网大公司,所以英博数科要做“窄、小、深、沉”的事:
窄,是大厂不稀罕做的细致划分领域;小,是一个小团队能够把它跑起来;深,是行业隐形护城河要深;沉,是足够下沉,行业覆盖的足够广,必须是个未来5-10年有发展空间的朝阳产业。
以算力出租服务为例,看似生意逻辑简单,怎么以便宜的价格拿货、怎么找到客户……这些隐形护城河其实很高。
但单一的算力出租业务不是长久的生存法则。周韡韡意识到,大模型、AI应用接入几乎所有产业的生产加速是必然的,随着对高端算力需求的规模持续增长,这个赛道需要一个能够解决从基建到商业化落地问题的一站式服务平台。
因此,英博数科将自身定位升级为:AGI全栈服务商,要形成中国版的App Store(应用商店)+Hugging Face(开源开发者和模型社区)。
建生态,是周韡韡跟英伟达学到的重要一课。大模型企业基本上都会用Hugging Face、GitHub去研究和发现问题,周韡韡认为,将这些人汇聚到一起,会自然而然形成一个交流社区,这是英博数科向全生态链过渡的中间阶段。
英博数科研发的GPU云管平台搏博云(Bob Cloud,Best of the Best Cloud)由此成为核心,旨在实现跨平台GPU算力管理、统筹、调度及整合,实现GPU算力、数据化产品共享。
在周韡韡看来,有更多人愿意加入你的平台,通过你的平台去赚钱,这样才可以良性循环起来,形成生态。
在搏博云中,APP Store提供基于多模态大模型的多款应用体验版及Pro版;Tools Store提供ETL自助式数据清洗工具以及无问芯穹、潞晨科技等合作伙伴的PaaS训练加速部署服务。
此外,还有数据商店提供用于垂类场景模型训练的数据产品;模型商店能方便客户下载各类合规的基础与训练大模型,用于自研、定制化开发。
由于英博数科不提供单纯的算力设备贸易销售,智算中心采用与合作方共建、交付后英博数科代运维管理的模式,所以所有英博数科参与的智算中心均会安装搏博云云管系统。
除了算力大单收入外,英博数科计划从搏博云各类商店产生的开发者分成、GPU云服务、梧桐计划、MM豆计划、产业聚合、开发者生态大赛、金融服务、AI通识教育推广、股权投资收益等方面扩张其商业化体系版图。
“这些就是英博数科的生存之道和应对之策。”周韡韡预估,在完成这些板块升级后,英博数科有望实现2倍于现有签约数据的增值收益。
回顾2023年,在“百模大战”狂潮之中,算力成为躺赚的生意,一批传统行业龙头摇身一变成为热门的“算力概念股”。经过一年的大浪淘沙,谁在盛名之下其实难副?谁是真枪实剑披挂上阵?时间已经给出阶段性的答案。
有玩家已经败下阵来。如恒润股份,因高喊规划万P算力而风光了大半年,然而2023年12月其董事长因涉内幕交易被刑拘,致使股价“一夜回到解放前”,跌回了2023年开年时的水平。
也有些玩家还在路上。比如CoreWeave和英博数科,找到了云计算巨头与芯片巨头合作的裂缝,成为AI时代向掘金者们卖铲子的人。
但算力服务会是一条可以通过时间检验的转型之路吗?一边是市场之间的竞争暗潮汹涌,另一边是进口芯片难以维系,相比位于美国本土、邻近英伟达货仓、不受美国出口限令约束的CoreWeave,日趋紧张的算力存货导致部分供应无法按期,已是困住一众国内算力供应商们的“紧箍咒”。
2024年1月3日,青云科技宣布原协议约定GPU服务器无法按期交付,其销售合同从原总价款6.9亿元减少为1.4亿元;1月9日,锦鸡实业发公告称美国限制令升级对原合同3.12亿元AI服务器的交付产生一定的影响,深湾科技退还部分预付款。
轰轰烈烈的算力竞赛才刚开始。进入2024年,AI算力短缺的情况预计会促进加剧,但“算力黑马”们仍需解决很多不稳定不可控的因素,一旦产业风口变换、算力需求放缓,它们还能否顶住压力,在算力基建路上继续坚持?
即便是在大模型算力订单竞争领先一步的英博数科,前路亦需克服许多变化与挑战,在公布了AGI全栈服务商的新定位后,其商业版图的叙事更加宏大,要交出好的答卷也变得更难。