AMD的混合CPU-GPU架构：从HSA到Instinct MI300A

周一, 5 八月 2024 - 16:56

AMD 迈向混合 CPU-GPU INSTINCT MI300A 的道路漫长而曲折，充满了挑战与突破。

回溯到 2012 年，当时的 AMD 在数据中心领域面临着严峻的困境，CPU 业务摇摇欲坠，GPU 业务几乎停滞。

然而，美国能源部的一笔投资宛为 AMD 带来了希望。AMD如何从早期的异构系统架构（HSA）理念出发，逐步演化至集成了CPU和GPU的混合架构Instinct MI300A，这一里程碑式的成就不仅重塑了高性能计算的格局，也预示着计算新时代的到来。

AMD的转折点：美国能源部的助力

2012年，AMD正处于艰难时期，数据中心CPU业务的前景黯淡，而GPU部门亦未能崭露头角。

关键时刻，美国能源部伸出了援手，提供了关键的资金支持，用于研究内存技术和百亿亿次级混合CPU-GPU计算。尽管金额有限，但这笔投资为AMD打开了创新的大门，播下了日后CPU和GPU业务蓬勃发展的种子。

从HSA到百亿亿次级计算：AMD的创新之路

AMD的创新历程始于异构系统架构（HSA），这是一种旨在优化CPU和GPU协同工作的设计理念。

通过一系列的FastForward和DesignForward项目，AMD专注于异构计算、内存处理、高速缓存以及低压逻辑和新内存接口的研究。这些项目不仅为AMD积累了关键技术，也为后来的Instinct MI300A奠定了理论与实践基础。

在2015年的PathForward项目中，AMD与行业巨头如英特尔、NVIDIA、Cray、IBM、AMD和惠普企业共同探索百亿亿次级系统的开发，而非仅仅停留在理论研究层面。这些项目总计投入超过6.378亿美元，为AMD及其合作伙伴赢得了在百亿亿次级计算领域的领先地位。

从EHP-1到MI300A：AMD的架构演进

AMD的百亿亿次异构处理器设计经历了多次迭代，从最初的EHP-1到最终的Instinct MI300A，每一次迭代都反映了AMD对技术趋势的深刻洞察和不懈追求。

EHP-1：这一设计聚焦于HPC工作负载，采用四核设计，配备四个256位向量和高性能GPU复合体。尽管初期设计未充分考虑低精度格式，但为后来的AI工作负载奠定了基础。

EHP v2：面对成本上升和技术挑战，AMD转向小芯片设计，同时开始评估内存处理器（PIM）方法的可行性。这一阶段，AMD认识到HBM内存堆叠的潜力，但受限于当时的技术水平。

EHP v3：2016年，AMD引入了有源中介层，GPU被分割，HBM内存堆栈置于GPU之上，增强了内存访问能力。然而，有源中介层和3D堆叠内存的经济性问题促使了设计方向的调整。

EHP v4：在认识到经济和技术限制后，AMD采用了系统板视角，利用Infinity Fabric链接拼接更大规模的计算资源，从而实现了更高效的CPU-GPU协同。

Instinct MI300A：AMD的巅峰之作

2024年，AMD终于推出了Instinct MI300A，这款混合CPU-GPU架构实现了真正的APU愿景。MI300A不仅集成了先进的Epyc CPU和高性能GPU，还创新性地使用了PCI-Express端口与外部世界通信，形成了紧密耦合的计算复合体。这一设计的复杂性和先进性堪称历史之最，为HPC和AI应用提供了前所未有的性能优势。

El Capitan 的 Instinct MI300A，AMD 终于实现了打造真正 APU 的目标。这一成果不仅在硬件上取得了巨大进步，更重要的是在软件层面实现了 CPU 和 GPU 的真正统一，大大简化了编程的复杂性。

在某些科学计算任务中，以往需要在 CPU 和 GPU 之间频繁地进行数据传输和同步，这不仅增加了编程的难度，还降低了计算效率。而 MI300A 的架构使得代码编写与仅使用 CPU 的架构没有太大区别，极大地提高了开发效率。

市场的考验才刚刚开始。MI300A 在价格、性价比和散热方面与 Nvidia 的竞争产品相比究竟如何，目前还缺乏足够的数据进行全面的比较。但可以肯定的是，AMD 的这一突破为高性能计算领域带来了新的选择和可能性。

AMD 在混合 CPU-GPU 领域的探索仍将继续。随着人工智能、大数据等技术的不断发展，对计算性能的需求将持续增长。AMD 能否凭借 MI300A 及后续产品在市场中占据一席之地，不仅取决于技术的持续创新，还取决于其对市场需求的精准把握和营销策略的有效实施。

小结

AMD的故事是技术创新与市场需求相结合的典范，它不仅证明了在逆境中坚持创新的重要性，也展示了在高性能计算领域取得成功的无限可能。随着“El Capitan”超级计算机的部署，AMD的技术实力将进一步得到验证，开启高性能计算的新篇章。

本文转载自：芝能汽车

AMD的混合CPU-GPU架构：从HSA到Instinct MI300A

阅读推荐