
连年来,跟着东说念主工智能(AI)期间的爆发式增长,英伟达(NVDA.US)与AMD(AMD.US)等主流芯片巨头纷繁将研发重点和产能向利润丰厚的AI低精度计算歪斜。研讨词,这一策略转向正在产生一个令东说念主出东说念主料念念的四百四病——好意思国国度现实室因难以采购到随和高精度科学计算需求的芯片,运行将眼神转向新兴芯片初创公司。据报说念,位于新墨西哥州科特兰空军基地的桑迪亚国度现实室,正在测试以色列初创公司NextSilicon的芯片,以寻求冲破供应链窘境的新旅途。
大厂转向AI,高精度计算需求遭“生僻”
桑迪亚国度现实室是好意思国三大肃穆核刀兵研发与爱戴的现实室之一。其基地内的液冷超等计算机长年承担着顶点复杂的模拟任务——从模拟高妙音速核刀兵穿越大气层的轨迹,到推演一枚核弹头在另一枚近邻引爆的场景。以前十余年间,解决这些高玄机、高需求任务的芯片主要来自英伟达和AMD等主流半导体企业。
研讨词,桑迪亚现实室高性能计算团队愚弄SteveMonk默示,跟着主流芯片公司日益将产物假想向AI歪斜并濒临供应链缺少,现实室在获取随和其高精度科学计算需求的芯片方面承受着越来越大的压力。从供应链到计算才气,双重压力让团队对将来任务托付才气感到担忧。
中枢不合在于一项被称为“双精度浮点计算”(FP64)的期间辩论。关于核刀兵物理模拟等科学计算而言,芯片需要大致在不失掉精度的情况下同期解决极大和极小的数值。多年来,英伟达和AMD一直在追求加快此类计算的率先地位,并凭此获取了繁密大学与政府现实室的超算协议。但AI磨砺和推理管事并不依赖双精度计算,这使得芯片假想的天平运行歪斜。
FP64是维系当代飞机遨游、火箭起飞、疫苗研发乃至核刀兵平日运作的要道期间,大致抒发朝上18.44万亿亿个唯独数值,是科学计算鸿沟的“黄金圭臬”。比较之下,当代AI模子频繁使用FP8精度进行磨砺,仅能抒发256个唯独值。
英伟达最新发布的RubinGPU诚然在AI算力上收场了质的飞跃——推理速率达到50petaFLOPS,是上一代Blackwell的2.5倍——但其FP64峰值性能约为33teraFLOPS,本色上比四年前推出的H100还要低1teraFLOPS。尽管英伟达推出了基于Ozaki决议的FP64软件仿真期间,宣称可在CUDA库中收场高达200teraFLOPS的矩阵性能,2026年世界杯官网是硬件性能的4.4倍,但AMD方面对此冷落质疑。AMD研究员NicholasMalaya指出,这种仿真形态在某些基准测试中进展尚可,但在材料科学或毁灭代码等确切物理模拟中的可靠性存疑,且存在IEEE合规性不及、内存花消翻倍等问题。
芯片接洽公司MoreThanMoore的首席分析师IanCutress指出,英伟达行将推出的Rubin芯片在双精度性能方面,按某些辩论估计反而有所着落,这让高性能计算鸿沟的好多科学家感到担忧。
初创公司顺势崛起
芯片巨头的策略编削,正在为NextSilicon等新锐企业洞开阛阓空间。这家修复于2017年的以色列初创公司,历程八年研发,已累计完成约3.03亿好意思元的种子轮及三轮风险融资,估值一度达到约15亿好意思元。
与英伟达和AMD基于GPU或CPU的传统期间道路天悬地隔,NextSilicon的旗舰芯片“Maverick-2”接受智能数据流架构,大致通过软件界说的数据流硬件收场运行时动态重构与优化,芯片可及时从头编程以更高效运行。在电力效果方面,数据流架构减少了数据在计算系统内存之间走动搬运的时期和能耗。
桑迪亚国度现实室肃穆测试新式计算架构神态的高档科学家JamesLaros对此给出了高度评价:“NextSilicon的性能限度令东说念主印象深入,展现出在无需盛大代码修改的情况下进步计算才气真的切后劲。”
周一,桑迪亚国度现实室、NextSilicon以及匡助将NextSilicon芯片集成到超等计算机中的PenguinSolutions纠合布告,搭载NextSilicon芯片的超等计算机系统已通过一系列通用超算测试的要道期间里程碑,使其有经验在本年秋季进一步接受更迫临核安全本色管事的高难度计算任务测试。
Laros默示,现实室积极联袂NextSilicon这类中小芯片企业,中枢主义是构建多元化芯片采购体系,即便头部芯片企业策略赛说念更动,也能握续判辨获取适配科研任务的算力芯片。
“咱们必须保握可用的采取来完成责任2026年世界杯官网,因为这项责任莫得退路,”Laros强调。