自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

异构开发技术社区官方博客

关注异构计算的技术发展与创新,分享异构开发工具及技巧,提供最新的资讯和开发资料,为开发者营造一个轻松、高效的异构开发学习交流平台。

  • 博客(22)
  • 资源 (14)
  • 收藏
  • 关注

翻译 OpenCL 2.0 :设备队列和工作组内建函数

在上一篇文章中,我们探讨了OpenCL™2.0管道(pipes)。而本文将讲述另一个重要的特性:设备队列(device enqueue)。同时会讲述新的内建工作组函数。 要想最大程度地掌握本文内容,我们建议做好下面的准备工作:l  参考注释,通读每篇博文的代码片。l  请点击这里下载AMD OpenCL2.0驱动,下载页中列出了已支持平台的清单。l  请点击这里下载范例代码

2014-12-02 09:43:11 6854 5

翻译 OpenCL 2.0 规范 – Pipes(管道)

上一篇文章我们介绍了OpenCL2.0的新特性共享虚拟内存(SVM)。本文将继续讲述另一个新特性,“pipes(管道)”。

2014-12-02 09:41:41 4402

翻译 OpenCL 2.0 规范 – SVM共享虚拟内存

OpenCL2.0规范相对于1.2版本做出了重大改进,使得一个多元系统中各个硬件之间增强了通信与协作能力。在接下来的系列文章中,将着重讲解OpenCL2.0的新特性,探究其重要性以及对开发、性能等方面会产生什么影响。

2014-12-02 09:40:55 8564 1

翻译 通过 Autostereograms 案例学习 OpenGL 和 OpenCL 的互操作性

在过去的十年里, GPU (图形处理单元)已经从特殊硬件(特供)转变成可以在数值计算领域开辟新篇章的高性能计算机设备。许多算法可以使用拥有巨大的处理能力的GPU来高速执行和处理大数据量。即使在通常的情况下,不可能将图形硬件编程化, 图形硬件也可以加快算法与图像的处理。 举个例子:通常情况下可以用来计算图形差分,模糊图像, 合并图像,甚至是进行图像(或数组)平均值计算。

2014-06-29 09:09:05 2765

翻译 游戏开发人员使用CodeXL:如何为GCN分析HLSL

AMD Radeon™ R7、R9系列,几乎所有的HD 7000系列显卡,包括史上最快显卡AMD Radeon™ R9 295X2与流行的AMD Radeon™ R9 290X显卡均采用了下一代图形架构GCN。下一代游戏主机也将采用GCN,对游戏开发人员而言,首要任务是为此架构优化着色器。以前,游戏开发人员可以使用GPU ShaderAnalyzer(GSA),分析DirectX® HLSL着色器性能。但目前GSA不支持GCN。最近发布的CodeXL 1.4通过CodeXL的命令行工具提供了此项功能。具体

2014-06-09 14:57:11 3931

翻译 AMD Mantle与Media SDK的异同

原文链接:http://electronicdesign.com/dev-tools/whats-difference-between-amds-mantle-and-media-sdk What'sThe Difference Between AMD's Mantle and Media SDKAMDMantle与MediaSDK的异同AMD is well known for

2014-04-30 14:18:38 2271

翻译 CodeXL1.4发布!

今天是很高兴的一天 - CodeXL最新发布刚通过了QA测试,并且进行了出版发行。以下是本次发布的最新内容:• Visual Studio2013 CodeXL扩展 Visual Studio最新版的适配器现在可以直接通过Visual Studio IDE使用CodeXL。• CodeXLAnalyzer命令行工具中的新ShaderAnalyzer(仅限Windows)应大众要求,原名为GPU的Shader Analyzer (GSA) 在雪藏两年多后现在成为了CodeXL命令行工

2014-04-28 10:40:01 2651

原创 AMD中国研究院急聘实习生

[急聘实习生][急聘实习生]AMD中国研究院职位介绍: AMD Research China Lab is seeking interns for emerging machine learning workloads acceleration. The workload is a cutting edge and very complicated problem which earn

2014-04-14 13:29:42 1871

翻译 视频编码引擎(VCE)简介

简介如今使用电池的手持设备已具有一系列复杂功能,比如播放高质量图片/拍摄视频/录制以及实时语音/视频聊天等,因此更高级的多媒体功能是许多技术厂商希望掌握的御宝。视频压缩系统中高效的硬件和软件结构在诸多使用范围广泛的应用中扮演着重要角色,比如转码、视频编辑、视频会议、流媒体视频、以及诸如无线显示和云游戏等新兴技术。VCE是AMD独有的固定功能H.264/AVC视频编码引擎。其

2014-03-12 15:10:44 9460

翻译 利用AMD Media SDK处理视频

Media SDK不仅是编解码器!这些年来,AMD为在Windows设备上观看视频的用户提供了数量众多的视频质量处理算法,提高了其视频体验。视频质量处理算法(类似于电视机等商用电子产品算法)的目标是提高视频播放的感知质量,或诸如视频转码和视频会议等操作的质量。在一些用例中,视频质量处理算法用于有争议的人工视频痕迹。而其他用例中该算法则用于调整显示限制或用于个人偏好。倾斜颜色轮盘以提高色彩矩阵特

2014-03-05 16:49:33 4471

翻译 统一视频解码器(UVD)简介

如果你拥有一台搭载了AMD显卡的计算机、移动设备和/或游戏控制器,你一定会拥有更好的流畅视频体验和更长的待机时长。无论你播放流媒体、进行视频聊天、在Windows媒体播放器中播放视频或观看DVD/蓝光光碟,你都很可能正在无缝使用AMD统一视频解码器(UVD)。

2014-03-03 16:41:06 5429

翻译 Media SDKv1.0 正式版发布

对AMD多媒体而言,今天意义非凡。我非常荣幸的宣布第一款Multimedia SDK产品于今日发布。借此发布,开发者便可利用我们近些年来开发的优秀软件和硬件IP。让我们快速了解一下Multimedia SDK,以及对开发者而言它所具有的巨大效用。

2014-02-27 10:05:38 3148

翻译 不可视的OpenCL和APU芯片驱动加速

AMD认为,加速处理器(APU)将在数据中心有一席之地,它是将CPU和GPU整合在一起而成。它所推动的软件开发工具,更容易在GPU芯片上调度程序,比单独在CPU上运行更快。AMD这一看法让服务器领域的竞争变得更为激烈。AMD在美国加州圣何塞所举办的APU13开发者峰会上,它是关于服务器的一大主题。该公司还展示一些早期的基准测试结果,证明其APU如何更完美地加速Java应用程序。

2013-12-30 09:59:36 2248 1

原创 《OpenCL异构计算》新版中译本派送中!

《OpenCL 异构计算》讲解了OpenCL 和如何为复杂的异构系统(多核处理器、GPU和APU)进行并行编程。第 2 版根据OpenCL 1.2 最新开发动态进行修订,包括新的架构和功能。其中译版日前已由清华出版社出版。立即关注异构开发社区,免费获得新书!

2013-09-22 14:48:19 5530 11

原创 AMD异构计算校园宣讲会火热进行中(9月活动结束,演讲资料即将发布)

2013 AMD异构计算走进校园。从服务器到移动端,异构计算正成为学术界和产业界的热点技术。异构计算利用CPU和GPU的协同计算,突破CPU计算瓶颈,获取更优性能和更低功耗,以及更炫的视觉体验。AMD及众多业界领导者推动着从硬件架构到软件开发的技术革新,以普及异构计算。

2013-09-11 14:37:50 3442 4

翻译 用PGCL为安卓编写有效的OpenCL代码

在前一篇文章中,我们介绍了创建一款可用于OpenCL的安卓应用所的安卓应用所需的基本步骤,这款应用可与作为OpenCL计算设备的NEON/SIMD扩展程序并行运行于多个ARM CPU内核。本文我们重点介绍使用PGCL为多核ARM编写有效的OpenCL代码,而PGCL是一种用于以ARM处理器为基础的系统级芯片(SoCs)的OpenCL编译器架构。你需要了解OpenCL执行和编程模型的基本概念

2013-09-11 14:17:23 2736

翻译 在2013 美国计算器图形学年会(SigGraph 2013)上, WebGL成主角

1996年,我从法国来到加利福尼亚加入硅谷图形公司(Silicon Graphics )的IRIS Performer团队。如今,作为一名Performer BOF(Birdsof a Feather)小组成员在SigGraph上发言是我职业生涯中最值得纪念的时刻。在Performer BOF期间,我们谈论了添加至SDK的新特性和HW(硬件)启用功能,并演示了原型现在的功能。IRIS Perfor

2013-08-27 17:57:36 2375

翻译 ARM Mali系列GPU加强应用ASTC技术—高动态范围成像和3D

Khronos将ARM的ASTC技术(自适应可伸缩纹理压缩技术)列为业内标准纹理压缩的新方案。我在上一篇日志中提到,ASTC技术支持高动态范围成像和三维纹理压缩,我将花些时间演示如何处理纹理,以及在图像内容中它们可以采用怎样的冷色效果。高动态范围成像(High Dynamic Range)正常颜色(低动态范围成像或LDR)的图片在屏幕上显示的颜色亮度为介于0(最低亮度)

2013-08-15 11:40:58 6117

翻译 AMD兼容图像处理器(GPU)代码生成用于Java:案例分析

GPU卸载是加速并行程序的一种知名技术,但由于当前的Java 虚拟机(JVMs)缺乏GPU代码生成的支持,因此其嵌入Java空间的速度较慢。Sumatra是首个开源项目,旨在将GPU卸载能力直接集成到Java 虚拟机中。

2013-08-15 11:15:01 3470

原创 Linux上使用AMD的OpenCL开发运行环境

本文对Linux上怎样安装和运行AMD的OpenCL开发环境做了说明,step by step!

2013-07-29 10:44:56 10570 1

翻译 OpenCV-CL: OpenCL加速计算机视觉技术

从OpenCV 2.4.3开始,到作了重大改进后的OpenCV 2.4.4,至将来发布的各种新版本中,OpenCV都会得到了OpenCL的有力支持。 OpenCV-CL正逐渐地成为功能优异而性能高效的计算机视觉库,且在AMD的APU处理器和GPU显卡上表现出优异性能。

2013-07-23 10:51:02 9954 3

原创 异构开发技术社区——博客征文活动

异构计算被视为计算机处理器继单核、多核之后的第三个时代,它将实现使用不同类型指令集和体系架构的计算单元,比如CPU和GPU之间的“协同计算、彼此加速”,从而突破CPU发展的瓶颈,有效解决能耗、可扩展性等问题。 2012年,“异构开发技术社区”落户CSDN,联合学术界和产业界的异构计算领导者,为中国异构开发人员打造学习和交流的平台。在此,我们启动异构开发社区有奖博客征文活动--面向社会各界朋

2012-11-08 11:31:15 82804 40

Nandini Raamani:Java在异构计算中的角色

Oracle Java平台副总裁Nandini Ramani表示,HSA非常重要,能够实现一套程序可在多平台上移植,真正做到异构跨平台计算。

2014-05-29

Phil Rogers:触摸云端的编程之道

AMD高级院士Phil Rogers将向与会者介绍AMD自上次峰会以来在异构计算领域取得的最令人激动的最新成果。在上次论坛中,Phil关注了HSA APU以及客户工作量如何从中受益。今年Phil将展示AMD HSA产品如何能够高效、低功耗的运行在服务器和嵌入式场景中。Phil所展示的范例将显示出前所未有的可能性。

2014-05-29

Mark Papermaster:驱动下一代环绕计算体验

AMD CTO Mark Papermaster展示了能够提高环绕计算体验的软硬件进步,包括IP开发的新方法、处理器构架和开发者能实现的功能。环绕计算致力于创造一种令人与技术交流变得完全自然的环境,令数码视听通过利用云功能、客户端和嵌入式计算,完全实现人所具有的复杂感官能力。

2014-05-29

Mike Muller:异构计算有什么新料?

ARM CTO Mike Muller将在本次主题演讲中讨论当今的异构结构究竟是什么。人们始终认为嵌入式系统是异构的,那么是什么变化导致如今人们纷纷关注此类计算研究?Muller将围绕不断改进的能耗、明显改善的编程工具、异构结构的新的开发者友好型外形以及SoC,探究变化的本质以及仍需采取的措施。

2014-05-29

Erik Noreke:明日的技术与教育工具

Khronos Group商务副主席Erik Noreke在主题为《明日的技术与教育工具》的演讲中,重点介绍了OpenCL生态系统及OpenCL 2.0(预测版)新特点。他指出OpenCL 2.0预测版大大加强了内存和执行模型,以应对新兴的硬件性能并为开发者提供更高的灵活度、功能和性能。

2014-05-29

Gary Frost:从软件的角度看HSA

AMD院士Gary Frost在主题演讲中,详细介绍了新兴的异构系统架构HSA。据了解,HSA为一种智能计算架构,通过无缝地分配相应的任务至最适合的处理单元,使CPU、GPU和其他处理器和谐工作在单一芯片上。

2014-05-29

HSA(异构计算架构)介绍

来自AMD的资深工程师陆璐讲解了异构系统的体系结构(HSA)诞生的历史以及现在的软件生态系统。视频请见:http://v.csdn.hudong.com/s/article.html?arcid=15816958

2014-05-29

OpenCL简介

OpenCL(全称Open Computing Language,开放计算语言)是第一个面向异构系统通用计算目的并行编程的开放式、免费标准。OpenCL使得程序员能够充分复用其宝贵的源代码开发投资,轻松应用于多核心处理器(CPU),图形处理器(GPU)和新型加速处理器(APU)。

2014-05-29

OpenCL编程与优化Part I

来自AMD的资深工程师谢海波从GPU的体系结构、线程与调度、内存层次结构、以及指令吞吐等方面讲解了GPU编程优化的一般技巧。

2014-05-29

OpenCL编程与优化Part II

来自AMD的资深工程师谢海波从CPU/GPU的数据传输、OpenCL的运行时开销、APU架构等方面讲解了HSA和OpenCL优化。

2014-05-29

AMD下一代APU——Kaveri

简单介绍AMD下一代APU产品Kaveri 。Kaveri为芯片设计领域带来一次革命性的变革,为APU产品引入了HSA和GCN架构。主要针对上述变革聊聊对软件程序员的影响。

2014-05-29

GPU上数字图像处理并行算法实现

旨在介绍数字图像处理的入门级并行算法,引导编程爱好者们在GPU或者APU上实现图像处理算法的并行程序,主要内容包括实现并行算法的主要步骤和性能的调整及优化,并以图像滤波和插值做为典型例子。

2014-05-29

CPU&GPU的并行编程比较

从软件编码,硬件实现,操作系统支持的角度介绍 OpenCL+GPU 并行编程和 CPU多线程并行编程的不同点, 以加深听众对 OpenCL+GPU 并行编程的理解。

2014-05-29

稀疏矩阵LU分解在GPU上的性能优化

稀疏线性方程组求解Ax=b是很多科学计算与工程应用的核心问题,例如天气预报、流体力学仿真、经济模型模拟、集成电路仿真、电气网络仿真、网络分析、有限元方法等。本报告以集成电路仿真中的极稀疏矩阵LU分解为例,讲述稀疏LU分解在GPU上的并行方法、以及性能优化方法。

2014-05-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除