
OpenCL 通用编程与优化(16)
继上文,本文博客继续介绍了 Adreno GPU中的OpenCL扩展中有关图像相关操作的内容,包括卷积操作与盒式过滤器。
Qualcomm OpenCL时间:2023-03-06 09:52:44

OpenCL 通用编程与优化(14)
本文博客介绍了Adreno GPU中的OpenCL扩展内容中的OS依赖性供应商扩展内容。
Qualcomm OpenCL时间:2023-03-02 09:45:12

OpenCL 通用编程与优化(13)
本文博客介绍了内核性能优化的剩余内容,即通用内存地址空间和已命名地址空间、子组、联合使用、结构的使用等。
Qualcomm OpenCL时间:2023-03-01 09:59:15

OpenCL 通用编程与优化(12)
继上文,本文博客继续介绍更多关于内核优化的细节。如回路展开、避免分支分化、避免使用size_t等。
Qualcomm OpenCL时间:2023-02-28 10:10:02

OpenCL 通用编程与优化(10)
本文博客主要介绍如何提高GPU的L1/L2缓存使用率、CPU缓存操作,以及降低电力/能源消耗的最佳实践。
Qualcomm OpenCL时间:2023-02-27 09:44:27

OpenCL 通用编程与优化(9)
在以前的部分中,我们讨论了有关如何使用其他类型内存的一般指南。在本节中,我们将审查有关memory load/store的性能至关重要的一些关键点。
Qualcomm OpenCL时间:2023-02-23 11:10:35

OpenCL 通用编程与优化(8)
OpenCL支持使用芯片外系统RAM的缓冲区和图像对象。与存储在系统RAM中的简单一维数据数组的缓冲区对象相比,图像对象是一个不透明的内存对象,其中开发人员不知道底层数据是如何存储的。当创建一个图像对象时,软件以特定的方式排列数据,以便GPU有效地访问。使用它们的最佳方法是不同的,并将在下面的章节中进行讨论。
Qualcomm OpenCL时间:2023-02-22 09:39:16

OpenCL 通用编程与优化(7)
本章为Adrenogpu提供了一些顶级的OpenCL优化技巧,更多的细节和其他信息将在下面的章节中描述。本章中的所有建议都应该具有最高的优先级,开发人员在进行内核优化时应该在尝试其他建议之前尝试它们。
Qualcomm OpenCL时间:2023-02-21 10:10:19

OpenCL 通用编程与优化(6)
本章提供了对OpenCL应用程序优化的高级概述。更多细节在下面的几章。本文博客主要介绍对OpenCL应用程序的优化可能具有挑战性。它通常需要比最初的开发更多的努力。
Qualcomm OpenCL时间:2023-02-20 10:11:34
Qualcomm 开发者专区是 Qualcomm 联合CSDN 共同打造的面向中国开发者的技术专区。致力于通过提供全球最新资讯和最多元的技术资源及支持,为开发者们打造全面一流的开发环境。本专区将以嵌入式、物联网、游戏开发、Qualcomm® 骁龙™处理器的软件优化等技术为核心,打造全面的开发者技术服务社区,为下一代高性能体验和设计带来更多的想法和灵感。
加入 Qualcomm 开发者专区


申请成为“Qualcomm荣誉技术大使”
“Qualcomm荣誉技术大使”是Qualcomm开发者社区对开发者用户技术能力与影响力的认证体现,该荣誉代表Qualcomm社区对用户贡献的认可与肯定。
立即申请高通技术公司推出头戴式AR开发套件骁龙Spaces™ XR开发者平台,助力打造无缝融合现实世界和数字世界边界的沉浸式体验。
为开发者提供实现创意的工具,并将变革头戴式AR的可能性,现已面市!
Qualcomm 活动 更多
6月19日
线上