动手课系列 · 中文授课

AI 编译器:从 PyTorch 到底层硬件

理解 torch.compile 的完整编译栈——Dynamo、Inductor、Triton,以及 TVM 和 TensorRT 的定位。 动手看 FX Graph、看 Triton kernel、排查 Graph Break。

3节课(持续更新)
2份术语表
~15 分钟每节课

课程目录

参考资料

这门课怎么用

1. 打开一课,读一遍(~5 分钟)

每课只讲一个主题,图文配合,读完不超 5 分钟。概念课建立 mental model,动手课教你实操命令。

2. 做课后 Quiz

每课末尾有选择题。建议认真做——提取练习是加深记忆最有效的方式之一。

3. 动手课:在终端里跑代码

标了"动手"标签的课需要你在自己的 PyTorch 环境里跑代码。看到真实的输出比只看文字记得牢得多。

4. 有问题问 AI 老师

每节课里都有提醒——在 Claude Code 里直接问就行。这节课模糊的地方、你的代码实际跑的 graph break——都可以拿来咨询。

课程目标

以下内容来自 MISSION.md

学完这个系列,你能:

✓ 用自己的话讲清楚 torch.compile 的完整编译流程
✓ 解释 IR 在编译栈中的角色
✓ 对比 TVM vs Triton vs TensorRT 的训练/推理适用场景
✓ 对你的 PyTorch 训练任务做出"要不要换 TVM"的技术判断