自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 Roofline模型(二):有哪些性能低于roofline的原因?

性能低于roofline的原因

2023-01-16 14:57:09 774

原创 Roofline模型(一):概念、基本公式、图像分析

并行计算Roofline性能分析

2023-01-13 13:19:08 3586 2

原创 文献笔记(1):适用于任意网格的大规模并行CFD计算框架PHengLEI

适用于任意网格的大规模并行CFD计算框架PHengLEI文章精读思维导图

2023-01-10 10:51:37 211

原创 GPU/DCU减少cudaMemcpy/hipMemcpy时间方案

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档GPU/DCU减少cudaMemcpy/hipMemcpy时间方案前言一、传输延迟测试二、减少传输时间方案1.数据重用2.Pinned Memory3.高维矩阵传输4.传输、计算时间重叠5.批量传输、选择大粒度并行总结前言CUDA是GPU加速器上的编程语言,HIP是DCU加速器上的编程语言,二者生态相似,CUDA可通过hipify工具转换为HIPHIP docs: https://rocmdocs.amd.com/en/late

2021-04-02 13:18:46 6427

原创 求解线性方程组的方法总结

求解线性方程组的方法总结高斯消元法的复杂度为 O(n^3)。一般来说,直接法对于阶数比较低的方程组(少于20000至30000个未知数)比较有效;而后者对于比较大的方程组更有效。在实际计算中,几十万甚至几百万个未知数的方程组并不少见。在这些情况下,迭代法有无可比拟的优势。另外,使用迭代法可以根据不同的精度要求选择终止时间,因此比较灵活。...

2019-08-22 14:50:20 3084

原创 FortranCL简单乘法

FortranCL简单乘法OpenCL简要介绍OpenCL是面向由CPU、GPU和其他处理器组合构成的计算机进行编程的行业标准框架。OpenCL通过公布硬件来提供高度的可移植性(支持N卡、A卡、CPU等),而不是将硬件隐藏在精巧的抽象下,这表明OpenCL程序员必须显示的定义平台、上下文,以及在不同设备上的调度工作。在一个典型的宿主机程序中,程序员不仅定义上下文和命令队列,定义内存和程序对...

2019-08-19 20:14:48 581

原创 FortranCL错误:forrtl: severe (157): Program Exception - access violation

FortranCL错误:forrtl: severe (157): Program Exception - access violation!错误代码段: double precision :: ax(nx,ny) ...... colume_in_bytes = int(nx, 8)*8_8 row_in_bytes = int(ny, 8)*8_8 ...... cl...

2019-08-19 16:09:33 8595

原创 FortranCL clBuildProgram出错返回错误代码-11

FortranCL clBuildProgram出错返回错误代码-11通过在cl.h中搜索来可以了解OpenCL错误代码的含义。-11表示CL_BUILD_PROGRAM_FAILURE。此错误通常是由内核代码中的语法错误引起的。可以使用标志CL_PROGRAM_BUILD_LOG调用OpenCL函数clGetProgramBuildInfo来访问编译器生成的日志。此日志包含在命令行上编译时...

2019-08-07 10:25:18 1464

原创 There is no matching specific subroutine for this generic subroutine call.

There is no matching specific subroutine for this generic subroutine call.VS-Fortran工程包含外部lib,引入该lib中函数API报错:There is no matching specific subroutine for this generic subroutine call.出错原因:传给API中的参数类...

2019-08-01 17:11:52 1761 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除