国产AI算力芯片,有两把刷子
【导语】国产AI算力芯片步入批量应用与规模化落地新阶段在今年的世界人工智能大会上,国产AI算力芯片成为一大亮点。各大厂商纷纷推出新产品、新技术和新场景应用,标志着国产AI算力芯片正进入大批量应用、大规模落地的新阶段。经过数年的发展,这些芯片已在不同程(chéng)度(dù)上(shàng)获(huò)得(de)市场认可,并拓展了丰富的应用场景。超节点布局、训推一体芯片的新品发布,更是为国产AI芯片行业注入了新的活力。
“国产AI算力芯片正在进入大批量应用、大规模落地新阶段。”这是记者参加完今年的世界人工智能大会,看过各国产AI算力芯片厂商新产品、新技术、新场景争奇斗艳之后,最直观的感受。
经过过去几年的发展,国内各AI算力芯片厂商的旗舰产品,得到了不同程度的市(shì)场(chǎng)认(rèn)可(kě),凝(níng)聚(jù)了(le)一(yī)批(pī)业(yè)内(nèi)有(yǒu)代(dài)表(biǎo)性(xìng)的(de)下(xià)游(yóu)客(kè)户(hù),积(jī)累(lèi)了(le)一(yī)定(dìng)的(de)应(yīng)用(yòng)部(bù)署(shǔ)经(jīng)验(yàn)。面(miàn)对(duì)竞(jìng)争(zhēng)仍(réng)然(rán)激(jī)烈(liè)的(de)AI芯(xīn)片(piàn)市(shì)场(chǎng),各(gè)企业仍在持续强化产品表现,抢占AI算力部署战略机遇期。
应用体系建设,初具规模
应用场景拓展,是国产AI芯片行业最近一年的发展亮点。
进入了腾讯供应链的燧原S60芯片,应用场景逐步扩展,现已从个别简单功能的支持扩展到搜索广告推荐等诸多核心场景。燧原科技创始人兼COO张亚林表示,燧原S60已经能够支持包括大语言模型、多模态大模型、搜索广告推荐、传统AI模型等超过300个应用场景。“燧原的算力,就在各位的手掌心上。”张亚林自豪地说。
张亚林称燧原S60落地规模已达7万卡
“随着我们产品的迭代,技术越来越成熟,我们已经支持了很多以前不能支持的场景。”当问及最近一年的最新进展,摩尔线程现场工作人员这样告诉记者,“比如我们与合作伙伴一起开发的这种工业小盒子,已经能够支持盾构机、挖掘机等诸多工业场景;我们的产品还能应用在机器人、机器狗、智能座舱等场景中。应用场景的拓展,是我们今年的一大亮点。”
摩尔线程工作人员接受《中国电子报》记者采访
沐曦股份正在以一个算力底座,赋能六大重点行业。沐曦股份展台工作人员在接受《中国电子报》记者采访时表示:“走向大市场是我们最近一年最突出的业务亮点。医疗健康、能源、交通、金融、教科研、大文娱是我们重点开拓的六大行业。AI赋能行业、AI赋能场景是我们今年的工作重点。”
超节点布局,如火如荼
超节点部署,正成为近期算力芯片企业与服务器厂商的技术推进焦点。
华为384超节点真机在展会上首次亮相,将384颗昇腾NPU和192颗鲲鹏CPU通过全新高速网络MatrixLink全对等互联,形成一台超级“AI服务器”,算力规模达到300 PFlops。
华为云CloudMatrix 384超节点已在行业中得到应用,支撑多品类 AI 模(mó)型(xíng)服(fú)务(wu)供(gōng)应(yīng)商(shāng)硅(guī)基(jī)流(liú)动(dòng)每(měi)天(tiān)为(wèi)600万(wàn)用(yòng)户(hù)提(tí)供(gōng)推(tuī)理(lǐ)服(fú)务(wu);支(zhī)持(chí)中(zhōng)科(kē)院(yuàn)自(zì)研(yán)模(mó)型(xíng)训(xun)练(liàn)框(kuāng)架(jià),构(gòu)建(jiàn)AI4S科(kē)研(yán)大(dà)模(mó)型(xíng);推(tuī)动(dòng)面(miàn)壁(bì)智(zhì)能(néng)“小(xiǎo)钢(gāng)炮(pào)”模(mó)型(xíng)推(tuī)理(lǐ)业(yè)务(wu)性(xìng)能(néng)提(tí)升(shēng);为(wèi)360“超(chāo)级(jí)搜(sōu)索(suǒ)”纳(nà)米(mǐ)AI搜(sōu)索(suǒ)提(tí)供(gōng)性(xìng)能(néng)领(lǐng)先(xiān)、贴(tiē)合(hé)需(xū)求(qiú)的(de)AI算(suàn)力(lì);助(zhù)力(lì)讯(xùn)飞(fēi)大(dà)模(mó)型(xíng)实(shí)现(xiàn)推(tuī)理(lǐ)性(xìng)能(néng)等(děng)。
7月(yuè)28日(rì),上(shàng)海(hǎi)仪(yí)电(diàn)(集团(tuán))有(yǒu)限公司(以下简称“上海仪电”)联合上海曦智科技有限公司(以下简称“曦智科技”)、上海壁仞科技股份有限公司(以下简称“壁仞科技”)、中兴通讯股份有限公司(以下简称“中兴通讯”),正式发布国内首个光互连光交换GPU超节点——光跃LightSphere X。该超节点基于曦智科技全球首创的分布式光交换技术,采用硅光技术的光互连光交换芯片和壁仞科技自主原创架构的大算力通用GPU液冷模组与全新载板互连,搭载了中兴通讯高性能AI国产服务器及仪电智算云平台软件。
图为光跃LightSphere X中的服务器
受限于传统数据中心单机柜功耗天花板,单机柜GPU密度提升存在瓶颈。光跃LightSphere X采用光互连技术,通过增加机柜数量构建超节点,能够突破传统互连方式下超节点的物理限制,从而突破单机柜功耗束缚,支持万卡级弹性扩展。
壁仞科技相关负责人表示:“从光直连技术到光互连光交换OCS GPU超节点,这是我们与曦智科技共同合作实现的第三代产品,已经在逐步实现规模化商业落地。
算丰信息128卡高密度机柜
国产化算力服务企业算丰信息展出了基于国产GPU沐曦C500的128卡高密度机柜。较同类产品布局面积减少70%,实现单机柜35.2PFLOPS的算力。算丰信息高级架构师吴泽在接受《中国电子报》记者采访时表示:“与之前的服务器方案相比,新的超节点方案PUE(电源使用效率)由原来的1.5降低至1.2以下。一个中等规模AI企业,采用新方案将节省约80万元电费。”
此外,燧原科技云燧ESL超节点系统正在测试中,单节点最高64卡全带宽互联,采用液冷方案,实现高性价比、高密度、高能效,可实现9216GB单节点存储容量、230TB/s单节点存储带宽、51.2TB/s单节点聚合带宽、单节点可支持PD分离优化。
训推一体芯片上新,技术再摸高
相比于之前以推理芯片见长,今年WAIC上,AI算力芯片企业推出了支持模型训练的芯片新品。
燧原科技推出第四代训推一体产品燧原L600,面向训练及推理场景,采用原生FP8低精度算力,拥有144GB存储容量、3.6TB/s存储带宽、800GB/s互联带宽。
基于燧原L600,燧原科技也推出了全新计算系统——云燧OGX系列产品。其中, OGX400实现了单机八卡OAM全互联,拥有1152GB单机存储容量、28.8TB/s单机存储带宽、2.8TB/s单机聚合带宽,单机可支持DeepSeek满血版。
沐曦股份曦云C600通用GPU
沐曦股份推出全新旗舰GPU曦云C600,集成大容量存储与多精度混合算力,支持MetaXLink超节点扩展技术,并内置ECC/RAS多重安全防护模块,为金融、政务等关键领域提供算力基座,满足下一代生成式AI的训练和推理需求。