1.
引言
2.
技术栈架构概述
2.1.
AI 技术栈层次
2.2.
AI技术栈的的意义
2.3.
AI技术栈分层方法与应用
3.
NVIDIA 平台
3.1.
CUDA
3.1.1.
技术栈架构
3.1.2.
系统软件层
3.1.3.
运行时环境层
3.1.4.
编程模型和语言层
3.1.5.
计算库层
3.1.6.
框架模型层
3.2.
OpenCL (NVIDIA)
3.2.1.
技术栈架构
3.2.2.
系统软件层
3.2.3.
运行时环境层
3.2.4.
编程模型和语言层
3.2.5.
计算库层
3.2.6.
框架模型层
3.3.
SYCL(NVIDIA)
3.3.1.
技术栈架构
3.3.2.
系统软件层
3.3.3.
运行时环境层
3.3.4.
编程模型和语言层
3.3.5.
计算库层
3.3.6.
框架模型层
3.4.
Triton (NVIDIA)
3.4.1.
技术栈架构
3.4.2.
系统软件层
3.4.3.
运行时环境层
3.4.4.
编程模型和语言层
3.4.5.
计算库层
3.4.6.
框架模型层
3.5.
Apache TVM (NVIDIA)
3.5.1.
技术栈架构
3.5.2.
系统软件层
3.5.3.
运行时环境层
3.5.4.
编程模型和语言层
3.5.5.
计算库层
3.5.6.
框架模型层
3.6.
OpenXLA (NVIDIA)
3.6.1.
技术栈架构
3.6.2.
系统软件层
3.6.3.
运行时环境层
3.6.4.
计算库层
3.6.5.
框架模型层
3.7.
OpenACC
3.7.1.
技术栈架构
3.7.2.
系统软件层
3.7.3.
运行时环境层
3.7.4.
编程模型和语言层
3.7.5.
计算库层
3.7.6.
框架模型层
4.
AMD 平台
4.1.
ROCm / HIP
4.1.1.
技术栈架构
4.1.2.
系统软件层
4.1.3.
运行时环境层
4.1.4.
编程模型和语言层
4.1.5.
计算库层
4.1.6.
框架模型层
4.2.
OpenCL (AMD)
4.2.1.
技术栈架构
4.2.2.
系统软件层
4.2.3.
运行时环境层
4.2.4.
编程模型和语言层
4.2.5.
计算库层
4.2.6.
框架模型层
4.2.7.
对比和思考
4.3.
SYCL (AMD)
4.3.1.
技术栈架构
4.3.2.
系统软件层
4.3.3.
运行时环境层
4.3.4.
编程模型和语言层
4.3.5.
计算库层
4.3.6.
框架模型层
4.4.
Triton (AMD)
4.4.1.
技术栈架构
4.4.2.
系统软件层
4.4.3.
运行时环境层
4.4.4.
编程模型和语言层
4.4.5.
计算库层
4.4.6.
框架模型层
4.5.
Apache TVM (AMD)
4.5.1.
技术栈架构
4.5.2.
系统软件层
4.5.3.
运行时环境层
4.5.4.
编程模型和语言层
4.5.5.
计算库层
4.5.6.
框架模型层
4.6.
OpenXLA (AMD)
4.6.1.
技术栈架构
4.6.2.
系统软件层
4.6.3.
运行时环境层
4.6.4.
计算库层
4.6.5.
框架模型层
4.7.
ONNX (AMD)
4.7.1.
技术栈架构
4.7.2.
系统软件层
4.7.3.
运行时环境层
4.7.4.
编程模型和语言层
4.7.5.
计算库层
4.7.6.
框架模型层
5.
Intel 平台
5.1.
oneAPI
5.1.1.
技术栈架构
5.1.2.
系统软件层
5.1.3.
运行时环境层
5.1.4.
编程模型和语言层
5.1.5.
计算库层
5.1.6.
框架模型层
6.
算能 TPU 平台
6.1.
TPU MLIR
6.1.1.
技术栈架构
6.1.2.
系统软件层
6.1.3.
运行时环境层
6.1.4.
编程模型和语言层
6.1.5.
计算库层
6.1.6.
框架模型层
7.
摩尔线程平台
7.1.
MUSA
7.1.1.
技术栈架构
7.1.2.
系统软件层
7.1.3.
运行时环境层
7.1.4.
编程模型和语言层
7.1.5.
计算库层
7.1.6.
框架模型层
8.
总结与展望
9.
附录——AI技术栈安装指南
9.1.
NVIDIA平台
9.1.1.
CUDA
9.1.2.
OpenCL (NVIDIA)
9.1.3.
SYCL(NVIDIA)
9.1.4.
Triton (NVIDIA)
9.1.5.
Apache TVM (NVIDIA)
9.1.6.
OpenXLA (NVIDIA)
9.1.7.
OpenACC
9.2.
AMD 平台
9.2.1.
ROCm / HIP
9.2.2.
OpenCL (AMD)
9.2.3.
SYCL (AMD)
9.2.4.
Triton (AMD)
9.2.5.
Apache TVM (AMD)
9.2.6.
OpenXLA (AMD)
9.2.7.
ONNX (AMD)
9.3.
Intel 平台
9.3.1.
oneAPI
9.4.
算能 TPU 平台
9.4.1.
TPU MLIR
9.5.
摩尔线程平台
9.5.1.
MUSA
Light
Rust
Coal
Navy
Ayu
AI技术栈解析及应用- 作者:张真瑜 | 山东大学智能创新研究院
oneAPI