目录:

  • 简介

    • 理解Gradient Checkpointing的基本概念

    • 为什么我们需要存储中间结果?

    • Gradient Checkpointing到底是怎么工作的呢?

  • 实验部分

  • 结论

 

完整内容见微信公众号文章:https://mp.weixin.qq.com/s/IwcfUP_j6JYFXH_xhnWWJQ