写CUDA到底难在哪?

2025-06-23 04:50:14

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?
广告位810*200
相关阅读
被时代淘汰的水果有哪些?

被时代淘汰的水果有哪些?

想一下,还真有不少。 ⭕️ 黑皮西瓜 这种小的黑绿皮西...

2025-06-27
电视支持4K120hz,为什么连接电脑后4K下最高只能选择60hz?

电视支持4K120hz,为什么连接电脑后4K下最高只能选择60hz?

嗯,确实,T8E Max只有85寸是真的4K120hz 出现...

2025-06-27
「牛奶湖」游客排队接奶,当地表示可以放心喝,是否符合食品安全标准?此营销行为对当地牧业是否有宣传作用?

「牛奶湖」游客排队接奶,当地表示可以放心喝,是否符合食品安全标准?此营销行为对当地牧业是否有宣传作用?

牛奶罐两个小时换一次,看似很安全。 实际确实很安全。 但...

2025-06-27
学编程要不要买电脑?

学编程要不要买电脑?

小时候看我哥玩红色警戒,但他不让我碰电脑,我实在是想玩啊 于...

2025-06-27
Android为什么不直接执行Linux的程序?而是自己搞一套?

Android为什么不直接执行Linux的程序?而是自己搞一套?

安卓其实是可以执行Linux程序的,因为安卓自己就是基于Li...

2025-06-27