系统软件层

Triton 通过使用 ROCm 的 HIP(Heterogeneous-compute Interface for Portability)API 与底层 GPU 进行交互。具体流程如下:

  • Triton 生成的代码将被编译为适用于 AMD GPU 的 HCC(Heterogeneous Compute Compiler)或 LLVM IR(Intermediate Representation)代码。
  • 通过 HIP API(例如 hipModuleLoad, hipLaunchKernel 等)来加载和执行这些编译后的代码,确保高效的计算任务在 AMD GPU 上运行。

这种设计使 Triton 能够充分利用 AMD 硬件的性能,同时提供一种统一的编程模型,以支持多种计算任务。