现代GPGPU 架构汇总

本篇是GPGPU 架构汇总的总章,参考的是AMD公布OpenCL 手册,该手册总结了AMD. Nvdia 早年的GPGPU体系架构,以及Opencl 各个API 与硬件结构的映射关系 。本篇除了整理这两家的GPU 架构,也会增加Intel dGPU的架构(牙膏厂终于回过神了 。。。。)
对于现代的 GPU,通常的它的控制逻辑单元比较简单(和 cpu 相比),cache 也比较小  。
线程切换开销比较小,都是轻量级的线程
GPU 的每个“核”有大量的 ALU 以及很小的用户可管理的 cache 。
内存总线都是基于带宽优化的 。150GB/s 的带宽可以使得大量 ALU 同时进行内存操作  。

现代GPGPU 架构汇总

文章插图
*  AMD GPU 硬件架构
*  Nvdia GPU Femi 架构
*  Intel  GPU Gen11 架构
【现代GPGPU 架构汇总】

    经验总结扩展阅读