芯片资讯
- 发布日期:2024-10-24 07:24 点击次数:130
NVIDIA (辉达) 今天宣布推出 17.7 版 PGI 2017 编译器与工具,协助高效能运算系统开发者针对搭载多核 CPU 与异质化 GPU 加速器的系统,开发出效能更高的软体,同时大幅简化程式设计流程。
即日释出的 PGI 17.7 编译器与工具的关键特点包括:
支援Tesla V100 GPU: PGI OpenACC 与CUDA Fortran现已支援新款NVIDIA Volta GV100 GPU,提供更多记忆体频宽、串流多重处理器、新一代NVIDIA NVLink以及全新微架构功能,堆砌出更好的效能与可编程功能。
OpenACC支援CUDA整合记忆体:PGI 17.7 版编译器能利用 CUDA 整合记忆体,简化针对 GPU 加速系统程式的编译流程。藉由开启简易编译器选项,OpenACC 即可在 CUDA 整合记忆体中配置资料的存放位置,而不需撰写资料移动程式码或指令。
支援多核 CPU 的 OpenMP 4.5 :初始针对 OpenMP 4.5 语法与功能的支援,即可针对大多数运行于多核CPU系统中的 OpenMP 4.5 平行处理进行编程。程式中的目标区块(TARGET)在预设支援条件设定后,会将多核系统当成目标,而PARALLEL 以及DISTRIBUTE等程式迴圈则能分散到所有OpenMP执行绪进行平行处理。
对Fortran语法的衍生类别进行深层复製: 透过 OpenACC 指令能在CPU主控端与GPU元件记忆体之间搬移匯整或深层巢状Fortran资料物件,包括指标型物件的巡行与管理作业。
C++ 语言方面的改良:PGI 17.7 C++ 编译器内含许多逐次扩增的 C++17 功能,并将其汇整到 CUDA 9.0 NVCC 主编译器的支援範围内。在 LCALS 迴圈处理性能量测指标中效能平均提升了20%。
在 OpenACC 程式区段中使用 C++14 Lambdas 函数:C++ 语言的lambdas函数,能在匿名函式物件被唿叫或是以参数形态被传递时, 亿配芯城 提供一种便利的方法来定义其物件。从 PGI 17.7 版开始,C++语言撰写程式的 OpenACC 运算区段都支援 lambdas 函数,包括针对不同编程模型或平台生成对应的程式码。 C++14 则引进更多lambdas函数用法,尤其是多类型的 lambdas函数。上述这些功能都可运用在 OpenACC 程式中。
与cuSOLVER 函式库互通:透过使用 PGI 提供的介面模组与 PGI 17.7 内建的 PGI 版 cuSOLVER 函式库,即可唿叫包括 CUDA Fortran、OpenACC Fortran、C 以及 C++ 等语言的最佳化 cuSolverDN 函式。
支援 NVIDIA Tesla GPU与多核 CPU 处理的 PGI Unified Binary:使用 OpenACC 编译出的程式不仅支援 GPU 加速,还能在多核CPU上支援平行处理。在搭载GPU的系统上运行时, OpenACC 支援区段分载以及在GPU上执行程式。当在没有安装GPU的系统上运行时,OpenACC 的程式区段能分散到系统中所有CPU核心上同步处理。
全新分析功能支援 CUDA 整合记忆体与OpenACC :PGI 17.7 Profiler现已加入多项全新 OpenACC 分析功能,包括支援有连结 GPU 与无连结 GPU 的两种多核 CPU 平台,另外还新增全新的摘要(summary)检视功能,能显示处理每种 OpenACC 程式码结构所耗费的执行时间。新增的 CUDA 统合记忆体功能,能追踪出每项 CPU 分页错误对应到哪些程式码,以及这些程式码所涉及的资料所在位置,并支援全新 CUDA 整合记忆体分页频繁的置换、节流、远端对应事件、NVLink以及其他诸多功能。
PGI 17.7的其他功能与改良包括所有支援全方位平台环境模组、预製热门开源函式库与程式,以及新推出的《运用 OpenACC 执行平行运算》的教学系列影片 。
- 罗德与施瓦茨推出首个针对5G双频率范围的自动化EMC测试系统2024-11-04