技 术 文 章
头  条  推  荐
  • ·NVIDIA CUDA 编程教程
  • ·CUDA用于大量数据的超级计算(二)
  • ·CUDA用于大量数据的超级运算(一)
  • ·CUDA与OpenCL的差异
  • CUDA用于大量数据的超级运算(一)[04-09] Rob Farber CUDA使您能够在开发GPU上运行的软件时使用熟悉的编程概念。 Rob Farber是西北太平洋国家实验室(Pacific Northwest National Laboratory)的高级科研人员。
    >>查看详情
  • CUDA用于大量数据的超级计算(二) [04-02] 在本系列文章的第一部分,我展示了第一个简单的CUDA(Compute Unified Device Architecture,计算统一设备架构)程序——moveArrays.cu,使您熟悉用于构建和执行程序的CUDA工具。
    >>查看详情
  • NVIDIA CUDA 编程教程 [04-02] 我们都知道,GPU的并行运算性能是极为强悍的,如此丰富的计算资源如果浪费着不用,就用来跑跑游戏是远远不行的。而传统的图形API又单单的只提供了图形操作的功能,没有提供类似于CPU那样通用计算的接口,所以说以往的方法都是很麻烦而且需要相当的经验的
    >>查看详情
  • NVIDIA CUDA实时处理改善视频画质 [04-02] CUDA(Compute Unified Device Architecture)是一个新的基础架构,这个架构可以使用GPU来解决商业、工业以及科学方面的复杂计算问题。它是一个完整的GPGPU解决方案,提供了硬件的直接访问接口,而不必像传统方式一样必须依赖图形API接口来实现GPU的访问
    >>查看详情
  • NVIDIA CUDA实时处理改善视频画质 [03-26] NVIDIA正在不遗余力的推广CUDA扩展技术,除了游戏应用外,CUDA另一个重要功能是视频应用,包括常见的视频加速和少为人知的画质改善。
    >>查看详情
  • CUDA与OpenCL的差异 [03-26] The purpose of this document is to help developers get started writing applications that will use OpenCL even before OpenCL v1.0 conformant implementations are available. This guide will help you to start developing GPU accelerated applications today, using C for CUDA compute kernels and the CUDA Driver API in ways that that will make it easy to transition to OpenCL when you are ready.
    >>查看详情
  • CUDA Voxel Rendering Engine [03-26] 体素引擎跟多边形引擎的年代一样早,但是因为体素引擎是以颜色砖块的形式把图像给垒出来的,因此需要大量内存来保存3D 模型的信息,改Demo使用CUDA协助处理,在8800GTS下大约可以跑20-30
    >>查看详情
  • Raycasting KDTree CUDA演示 [03-26] 一个使用CUDA来计算光线追踪的演示,改实现采用了KDTree算法,在GTX280下可以实现14MRays/second的速度,此Demo包含了源代码 近日Nvidia公司也在I3D 2009上展示了一个名为NVIRT的光线追踪引擎,同样是基于CUDA实现的
    >>查看详情
  • BFS_CUDA [03-12] 这个算法实现了level synchronization, 一个顶点一个线程,算法复杂度是图的直径(就是从源到叶子的最长距离)即O(diameter).
    >>查看详情
  • Houdini Development Kit ( HDK ) VC小记 [03-12] 为了能更好的在VC里面引入CUDA做Houdini API的开发,能便高效率的使用VisualStudio的集成开发环境工具是必须的。默认的Houdini插件与节点的开发都是写完了*.C代码之后,使用命令行下的Hcustom命令完成自定义插件和节点的编译,但这样的流程并不方便,而且对于较大的工程管理也有难度。
    >>查看详情
  • CUDA SDK 例子分析(3):reduction [03-05] 在sdk的这个例子里,我们通过六个不同的归约函数,来说明kernel函数的一些优化原则
    >>查看详情
  • CUDA 矩阵转置[03-05] 在CUDA SDK中有可以找到很多常用的代码, 比如矩阵转置, CUDA的内存显示, 都比较具有代表性
    >>查看详情
  • NVIDIA 解决nVidia驱动无法识别显卡的问题 [02-26] 由于工作需要,经常需要将使用的 CUDA 版本更新到最新版本。目前最新的 CUDA 版本为 2.1beta,支持该版本 CUDA 需要将 nVidia 的显示驱动更新到 180.60 版本。
    >>查看详情
  • NVIDIA Photoshop with CUDA? [02-26] CUDA 是 Compute Unified Device Architecture “统一计算构架” 的简写,很多人都认为Photoshop cs4支持native的cuda 是错误的.
    >>查看详情
  • CUDA shared memory使用------GPU的革命 [02-18] 书接上文《8. CUDA 内存使用 global 二------GPU的革命》讲了global内存访问的时候,需要对齐的问题,只有在对齐的情况下才能保证global内存的高效访问。这一章节准备写一下shared memory的访问的问题,首先是讲一下shared的memory的两种使用方法,然后讲解一下shared memory的bank conflict的问题,这个是shared memory访问能否高效的问题所在;
    >>查看详情
  • CUDA __global__ function 参数分析 [02-18] 在论坛里面讨论到一个问题,__global__函数里面传递的参数,到底是怎么传输到每一个thread的,然后做了以下的一些分析; 这个是问题讨论帖子:http://topic.csdn.net/u/20090210/22/2d9ac353-9606-4fa3-9dee-9d41d7fb2b40.html
    C/C++ code
    __global__ static void HelloCUDA(char* result, int num)
    >>查看详情
  • CUDA sha1 原代码[02-11] 使用CUDA并行运算暴力破解sha1加密的程序,附源代码 CUDA 2.1+vs2005+vista 64下编译成功
    >>查看详情
  • CUDA 结构对齐的C++模拟[02-11] CUDA的nvcc编译器支持数据结构struct的对齐,以此来提高速度。但当我们想从C++里创建数据结构,然后传到GPU里,用GPU处理的时候,我们就必须注意这个对齐了,怎么在C++里模拟CUDA的对齐呢?今天我发现,其实,结构的内存对齐并不是nvcc的魔法,nvcc其实也只是使用了C++的对齐机制。但为什么要多出一个__align__关键字呢?原来,C++的结构对齐并不是一个跨平台的标准,所以nvcc用__align__来统一。
    >>查看详情
  • 第二個 CUDA 程式[02-11] 前面介紹的計算平方和的程式,似乎沒有什麼實用價值。所以我們的第二個 CUDA 程式,要做一個確實有(某些)實用價值的程式,也就是進行矩陣乘法。而且,這次我們會使用浮點數。 雖然矩陣乘法有點老套,不過因為它相當簡單,而且也可以用來介紹一些有關 CUDA 的有趣性質。
    >>查看详情
  • GPU 的硬體架構[02-11] 這裡我們會簡單介紹,NVIDIA 目前支援 CUDA 的 GPU,其在執行 CUDA 程式的部份(基本上就是其 shader 單元)的架構。這裡的資料是綜合 NVIDIA 所公布的資訊,以及 NVIDIA 在各個研討會、學校課程等所提供的資料,因此有可能會有不正確的地方。主要的資料來源包括 NVIDIA 的 CUDA Programming Guide 1.1、NVIDIA 在 Supercomputing '07 介紹 CUDA 的 session,以及 UIUC 的 CUDA 課程。
    >>查看详情
  • CUDA 簡介[01-09] 現代的顯示晶片已經具有高度的可程式化能力,由於顯示晶片通常具有相當高的記憶體頻寬,以及大量的執行單元,因此開始有利用顯示晶片來幫助進行一些計算工作的想法,即 GPGPU。CUDA 即是 NVIDIA 的 GPGPU 模型。
    >>查看详情
  • 安裝 CUDA[01-09] 目前 NVIDIA 提供的 CUDA Toolkit(可從這裡下載)支援 Windows (32 bits 及 64 bits 版本)及許多不同的 Linux 版本。 CUDA Toolkit 需要配合 C/C++ compiler。在 Windows 下,目前只支援 Visual Studio 7.x 及 Visual Studio 8(包括免費的 Visual Studio C++ 2005 Express)。Visual Studio 6 和 gcc 在 Windows 下是不支援的。在 Linux 下則只支援 gcc。
    >>查看详情
  • 第一個 CUDA 程式 [01-09] CUDA 目前有兩種不同的 API:Runtime API 和 Driver API,兩種 API 各有其適用的範圍。由於 runtime API 較容易使用,一開始我們會以 runetime API 為主。
    >>查看详情
  • 改良第一個程式 [01-09] 由于GPU的特点是处理密集型数据和并行数据计算,因此CUDA非常适合需要大规模并行计算的领域。目前CUDA除了可以用C语言开发,也已经提供FORTRAN的应用接口,未来可以预计CUDA会支持C++、Java、Python等各类语言。虽然现在更多的应用在游戏、图形动画、科学计算、地质、生物、物理模拟等领域。
    >>查看详情
  • CUDA vc2005环境配置方法总结 [01-04] 安装CUDA SDK; 安装CUDA toolkit 安装CUDA驱动。 配置相应的环境变量:CUDA_BIN_PATH=C:\CUDA\BIN; CUDA_INC_PATH=C:\CUDA\INCLUDE;
    >>查看详情
  • 使用CUDA判断是否为素数 [01-04] 使用CUDA判断是否为素数程序,每个线程判断一个数是否可以被整除,将每线程判断结果写入shared memory内,然后统计结果,如果全部不能被整除,那就是素数,代码如下
    >>查看详情