运行时环境层
Triton 的设计使得它能够灵活地与 GPU 进行交互,涉及多个层次的抽象和转换。
除了 CUDA Driver API,Triton 还可以利用 CUDA Runtime API,这是建立在 Driver API 之上的更高级别接口,常见的操作包括:
- 使用
cudaLaunchKernel
来启动内核。 - 为 AMD GPU 提供支持,使用 ROCm 与 HIP API 进行交互。
Triton 的设计使得它能够灵活地与 GPU 进行交互,涉及多个层次的抽象和转换。
除了 CUDA Driver API,Triton 还可以利用 CUDA Runtime API,这是建立在 Driver API 之上的更高级别接口,常见的操作包括:
cudaLaunchKernel
来启动内核。