AMD 迈向混合 CPU-GPU INSTINCT MI300A 的道路漫长而曲折,充满了挑战与突破。
回溯到 2012 年,当时的 AMD 在数据中心领域面临着严峻的困境,CPU 业务摇摇欲坠,GPU 业务几乎停滞。
然而,美国能源部的一笔投资宛为 AMD 带来了希望。AMD如何从早期的异构系统架构(HSA)理念出发,逐步演化至集成了CPU和GPU的混合架构Instinct MI300A,这一里程碑式的成就不仅重塑了高性能计算的格局,也预示着计算新时代的到来。
AMD的转折点:美国能源部的助力
2012年,AMD正处于艰难时期,数据中心CPU业务的前景黯淡,而GPU部门亦未能崭露头角。
关键时刻,美国能源部伸出了援手,提供了关键的资金支持,用于研究内存技术和百亿亿次级混合CPU-GPU计算。尽管金额有限,但这笔投资为AMD打开了创新的大门,播下了日后CPU和GPU业务蓬勃发展的种子。
从HSA到百亿亿次级计算:AMD的创新之路
AMD的创新历程始于异构系统架构(HSA),这是一种旨在优化CPU和GPU协同工作的设计理念。
通过一系列的FastForward和DesignForward项目,AMD专注于异构计算、内存处理、高速缓存以及低压逻辑和新内存接口的研究。这些项目不仅为AMD积累了关键技术,也为后来的Instinct MI300A奠定了理论与实践基础。
在2015年的PathForward项目中,AMD与行业巨头如英特尔、NVIDIA、Cray、IBM、AMD和惠普企业共同探索百亿亿次级系统的开发,而非仅仅停留在理论研究层面。这些项目总计投入超过6.378亿美元,为AMD及其合作伙伴赢得了在百亿亿次级计算领域的领先地位。
从EHP-1到MI300A:AMD的架构演进
AMD的百亿亿次异构处理器设计经历了多次迭代,从最初的EHP-1到最终的Instinct MI300A,每一次迭代都反映了AMD对技术趋势的深刻洞察和不懈追求。
EHP-1:这一设计聚焦于HPC工作负载,采用四核设计,配备四个256位向量和高性能GPU复合体。尽管初期设计未充分考虑低精度格式,但为后来的AI工作负载奠定了基础。
EHP v2:面对成本上升和技术挑战,AMD转向小芯片设计,同时开始评估内存处理器(PIM)方法的可行性。这一阶段,AMD认识到HBM内存堆叠的潜力,但受限于当时的技术水平。
EHP v3:2016年,AMD引入了有源中介层,GPU被分割,HBM内存堆栈置于GPU之上,增强了内存访问能力。然而,有源中介层和3D堆叠内存的经济性问题促使了设计方向的调整。
EHP v4:在认识到经济和技术限制后,AMD采用了系统板视角,利用Infinity Fabric链接拼接更大规模的计算资源,从而实现了更高效的CPU-GPU协同。
Instinct MI300A:AMD的巅峰之作
2024年,AMD终于推出了Instinct MI300A,这款混合CPU-GPU架构实现了真正的APU愿景。MI300A不仅集成了先进的Epyc CPU和高性能GPU,还创新性地使用了PCI-Express端口与外部世界通信,形成了紧密耦合的计算复合体。这一设计的复杂性和先进性堪称历史之最,为HPC和AI应用提供了前所未有的性能优势。
El Capitan 的 Instinct MI300A,AMD 终于实现了打造真正 APU 的目标。这一成果不仅在硬件上取得了巨大进步,更重要的是在软件层面实现了 CPU 和 GPU 的真正统一,大大简化了编程的复杂性。
在某些科学计算任务中,以往需要在 CPU 和 GPU 之间频繁地进行数据传输和同步,这不仅增加了编程的难度,还降低了计算效率。而 MI300A 的架构使得代码编写与仅使用 CPU 的架构没有太大区别,极大地提高了开发效率。
市场的考验才刚刚开始。MI300A 在价格、性价比和散热方面与 Nvidia 的竞争产品相比究竟如何,目前还缺乏足够的数据进行全面的比较。但可以肯定的是,AMD 的这一突破为高性能计算领域带来了新的选择和可能性。
AMD 在混合 CPU-GPU 领域的探索仍将继续。随着人工智能、大数据等技术的不断发展,对计算性能的需求将持续增长。AMD 能否凭借 MI300A 及后续产品在市场中占据一席之地,不仅取决于技术的持续创新,还取决于其对市场需求的精准把握和营销策略的有效实施。
小结
AMD的故事是技术创新与市场需求相结合的典范,它不仅证明了在逆境中坚持创新的重要性,也展示了在高性能计算领域取得成功的无限可能。随着“El Capitan”超级计算机的部署,AMD的技术实力将进一步得到验证,开启高性能计算的新篇章。
本文转载自:芝能汽车