1.
引言
2.
技术栈架构概述
2.1.
AI 技术栈层次
2.2.
AI技术栈的的意义
2.3.
AI技术栈分层方法与应用
3.
NVIDIA 平台
3.1.
CUDA
3.1.1.
技术栈架构
3.1.2.
系统软件层
3.1.3.
运行时环境层
3.1.4.
编程模型和语言层
3.1.5.
计算库层
3.1.6.
框架模型层
3.2.
OpenCL (NVIDIA)
3.2.1.
技术栈架构
3.2.2.
系统软件层
3.2.3.
运行时环境层
3.2.4.
编程模型和语言层
3.2.5.
计算库层
3.2.6.
框架模型层
3.3.
SYCL(NVIDIA)
3.3.1.
技术栈架构
3.3.2.
系统软件层
3.3.3.
运行时环境层
3.3.4.
编程模型和语言层
3.3.5.
计算库层
3.3.6.
框架模型层
3.4.
Triton (NVIDIA)
3.4.1.
技术栈架构
3.4.2.
系统软件层
3.4.3.
运行时环境层
3.4.4.
编程模型和语言层
3.4.5.
计算库层
3.4.6.
框架模型层
3.5.
Apache TVM (NVIDIA)
3.5.1.
技术栈架构
3.5.2.
系统软件层
3.5.3.
运行时环境层
3.5.4.
编程模型和语言层
3.5.5.
计算库层
3.5.6.
框架模型层
3.6.
OpenXLA (NVIDIA)
3.6.1.
技术栈架构
3.6.2.
系统软件层
3.6.3.
运行时环境层
3.6.4.
计算库层
3.6.5.
框架模型层
3.7.
OpenACC
3.7.1.
技术栈架构
3.7.2.
系统软件层
3.7.3.
运行时环境层
3.7.4.
编程模型和语言层
3.7.5.
计算库层
3.7.6.
框架模型层
4.
AMD 平台
4.1.
ROCm / HIP
4.1.1.
技术栈架构
4.1.2.
系统软件层
4.1.3.
运行时环境层
4.1.4.
编程模型和语言层
4.1.5.
计算库层
4.1.6.
框架模型层
4.2.
OpenCL (AMD)
4.2.1.
技术栈架构
4.2.2.
系统软件层
4.2.3.
运行时环境层
4.2.4.
编程模型和语言层
4.2.5.
计算库层
4.2.6.
框架模型层
4.2.7.
对比和思考
4.3.
SYCL (AMD)
4.3.1.
技术栈架构
4.3.2.
系统软件层
4.3.3.
运行时环境层
4.3.4.
编程模型和语言层
4.3.5.
计算库层
4.3.6.
框架模型层
4.4.
Triton (AMD)
4.4.1.
技术栈架构
4.4.2.
系统软件层
4.4.3.
运行时环境层
4.4.4.
编程模型和语言层
4.4.5.
计算库层
4.4.6.
框架模型层
4.5.
Apache TVM (AMD)
4.5.1.
技术栈架构
4.5.2.
系统软件层
4.5.3.
运行时环境层
4.5.4.
编程模型和语言层
4.5.5.
计算库层
4.5.6.
框架模型层
4.6.
OpenXLA (AMD)
4.6.1.
技术栈架构
4.6.2.
系统软件层
4.6.3.
运行时环境层
4.6.4.
计算库层
4.6.5.
框架模型层
4.7.
ONNX (AMD)
4.7.1.
技术栈架构
4.7.2.
系统软件层
4.7.3.
运行时环境层
4.7.4.
编程模型和语言层
4.7.5.
计算库层
4.7.6.
框架模型层
5.
Intel 平台
5.1.
oneAPI
5.1.1.
技术栈架构
5.1.2.
系统软件层
5.1.3.
运行时环境层
5.1.4.
编程模型和语言层
5.1.5.
计算库层
5.1.6.
框架模型层
6.
算能 TPU 平台
6.1.
TPU MLIR
6.1.1.
技术栈架构
6.1.2.
系统软件层
6.1.3.
运行时环境层
6.1.4.
编程模型和语言层
6.1.5.
计算库层
6.1.6.
框架模型层
7.
摩尔线程平台
7.1.
MUSA
7.1.1.
技术栈架构
7.1.2.
系统软件层
7.1.3.
运行时环境层
7.1.4.
编程模型和语言层
7.1.5.
计算库层
7.1.6.
框架模型层
8.
总结与展望
9.
附录——AI技术栈安装指南
9.1.
NVIDIA平台
9.1.1.
CUDA
9.1.2.
OpenCL (NVIDIA)
9.1.3.
SYCL(NVIDIA)
9.1.4.
Triton (NVIDIA)
9.1.5.
Apache TVM (NVIDIA)
9.1.6.
OpenXLA (NVIDIA)
9.1.7.
OpenACC
9.2.
AMD 平台
9.2.1.
ROCm / HIP
9.2.2.
OpenCL (AMD)
9.2.3.
SYCL (AMD)
9.2.4.
Triton (AMD)
9.2.5.
Apache TVM (AMD)
9.2.6.
OpenXLA (AMD)
9.2.7.
ONNX (AMD)
9.3.
Intel 平台
9.3.1.
oneAPI
9.4.
算能 TPU 平台
9.4.1.
TPU MLIR
9.5.
摩尔线程平台
9.5.1.
MUSA
Light
Rust
Coal
Navy
Ayu
AI技术栈解析及应用- 作者:张真瑜 | 山东大学智能创新研究院
系统软件层
该程序使用 -- 获取设备信息,并提取设备的名称、最大计算单元数和全局内存大小等信息,并将这些信息打印到控制台。
示例代码:
#1
结果:
2