写CUDA到底难在哪?

2025-06-23 22:00:16

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?
广告位810*200
相关阅读
大家都喜欢用什么浏览器?

大家都喜欢用什么浏览器?

在Win11时代,微软丧心病狂地在Edge里面塞入了太多莫名...

2025-06-27
为什么一直唱衰的php语言反而日渐活跃?

为什么一直唱衰的php语言反而日渐活跃?

很多开发都是站在自己和身边环境角度来看,实际在web开发、小...

2025-06-27
5070ti什么时候才能回归正常价格?

5070ti什么时候才能回归正常价格?

上次矿潮,一大堆前一秒还在骂黄牛的,下一秒在jd抢到卡,都来...

2025-06-27
前端想要学习后端,选择哪种语言好一点?

前端想要学习后端,选择哪种语言好一点?

我看很多回答都在推荐各种编程语言,其实无论是 Go、Pyth...

2025-06-27
有什么是你去了上海才知道的事情?

有什么是你去了上海才知道的事情?

强行松弛感,遍地打卡仙人,遍地人造网红景点。 以下所有图片...

2025-06-27