写CUDA到底难在哪?

2025-06-24 20:40:15

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?
广告位810*200
相关阅读
如何评价首个女性友好的编程语言HerCode?

如何评价首个女性友好的编程语言HerCode?

我开发了一个语言 herlang: justj***ac/h...

2025-06-22
Electron是否有作为游戏引擎的潜力?

Electron是否有作为游戏引擎的潜力?

Electron既不是游戏引擎,也不是新时代,也不会带来变革...

2025-06-22
通过 GraalVM 将 J***a 程序编译成本地机器码后,效率能和rust比吗?

通过 GraalVM 将 J***a 程序编译成本地机器码后,效率能和rust比吗?

有两个项目 用过 graalvm的 native-image...

2025-06-22
PHP初学者,我能不能使用PHP来开发桌面应用?

PHP初学者,我能不能使用PHP来开发桌面应用?

盘点一下这些年PHP在桌面应用方面的解决方案今天作者给大家盘...

2025-06-22
比亚迪最近绩效减半,这是卸磨杀驴么?

比亚迪最近绩效减半,这是卸磨杀驴么?

我的看法是资金链快断了 5月增长的销量百分比太低,无法供养固...

2025-06-22