运行时环境层

Triton 的设计使得它能够灵活地与 GPU 进行交互,涉及多个层次的抽象和转换。

除了 CUDA Driver API,Triton 还可以利用 CUDA Runtime API,这是建立在 Driver API 之上的更高级别接口,常见的操作包括:

  • 使用 cudaLaunchKernel 来启动内核。
  • 为 AMD GPU 提供支持,使用 ROCm 与 HIP API 进行交互。