1. 概述
2. 将 OpenACC 与 NVIDIA HPC 编译器一起使用
3. 已实现的功能
OpenACC 入门指南
»
目录
v25.1 |
PDF
|
Archive
目录
1. 概述
1.1. 系统先决条件
1.2. 准备您的系统
1.3. 支持文档和示例
2. 将 OpenACC 与 NVIDIA HPC 编译器一起使用
2.1. CUDA 版本
2.2. 计算能力
2.3. PTX JIT 编译
2.4. OpenACC 中的 C 结构体
2.5. OpenACC 中的 C++ 类
2.6. OpenACC 中的 Fortran 派生类型
2.7. Fortran I/O
2.7.1. OpenACC PRINT 示例
2.8. OpenACC 原子操作支持
2.9. 用于全局变量和 Fortran 模块变量的 OpenACC Declare Data 指令
2.10. OpenACC 错误处理
2.11. C 示例
2.12. Fortran 示例
2.12.1. GPU 上的向量加法
2.12.2. 利用多设备的 多线程程序
2.13. 故障排除提示和已知限制
3. 已实现的功能
3.1. OpenACC 规范合规性
3.2. 默认值
3.3. 环境变量
3.4. OpenACC Fortran API 扩展
3.4.1. acc_malloc
3.4.2. acc_free
3.4.3. acc_map_data
3.4.4. acc_unmap_data
3.4.5. acc_deviceptr
3.4.6. acc_hostptr
3.4.7. acc_is_present
3.4.8. acc_memcpy_to_device
3.4.9. acc_memcpy_from_device
3.4.10. acc_get_cuda_stream
3.4.11. acc_set_cuda_stream
3.5. 已知限制
3.5.1. ACC 例程指令限制
3.5.2. C++ 和 OpenACC 限制
3.5.3. 其他限制
3.6. 与优化的交互
3.6.1. 与内联的交互