CUDA C
2018-02-09 23:23:57 5 举报
AI智能生成
cuda编程模型博客组织结构,组织结构图
作者其他创作
大纲/内容
CUDA C
1. 异构并行计算
2. CUDA 编程模型
概述
核函数计时(nvprof)
组织并行线程
设备管理
3. CUDA执行模型
线程束执行的本质
并行性的表现(nvprof)
避免分支化
展开循环
动态并行
4. 内存
全局内存模型
CUDA内存模型概述
内存管理
内存访问模式
内核可达到的带宽
eg: 矩阵加法
共享内存
数据布局
减少内存访问
合并内存访问
常量内存
线程束洗牌指令
5. 流和并发
并发内核执行
重叠内核执行和数据传输
重叠GPU和CPU执行
6. 指令级原语
程序化指令
7. GPU加速库
8. 多GPU编程
GPU间细分计算
点对点通讯
e.g. 多GPU上的差分
跨GPU集群扩展应用程序
9. 注意事项
开发过程
配置文件驱动优化
CUDA 调试
收藏
0 条评论
下一页