Nova CUDA u verziji 4.0 čini paralelno programiranje jednostavnijim

Objedinjeno virtuelno adresiranje, GPU-GPU komunikacija i unapređene C++ biblioteke šablona omogućavaju većem broju programera da iskoriste prednosti GPU računarstva

Santa Klara, Kalifornija— 1. mart, 2011. NVIDIA je danas objavila najnoviju verziju NVIDIA® CUDA® alata za razvoj paralelnih aplikacija koristeći NVIDIA grafičke procesore.

NVIDIA CUDA 4.0 alat je dizajniran da učini paralelno programiranje jednostavnijim i omogući programerima da portuju svoje aplikacije na grafičke procesore. Rezultat toga su sledeće karakteristike:

  • NVIDIA GPUDirect™  2.0 tehnologija – nudi podršku za P2P komunikaciju između grafičkih procesora u okviru jednog servera ili radne stanice. Ovo omogućava jednostavnije i brže programiranje i rad aplikacija koristeći više grafičkih procesora.
  • Unified Virtual Addressing (UVA) – pruža jedinstven adresni prostor koji objedinjuje glavnu sistemsku memoriju i memoriju na grafičkoj karti kako bi se omogućilo brže i lakše paralelno programiranje.
  • Thrust C++ Template Performance Primitives biblioteke – donose kolekciju moćnih C++ paralelnih algoritama otvorenog koda i struktura podataka koje olakšavaju programiranje C++ programerima. Sa Thrust datotekama, rutinske operacije kao što su paralelno sortiranje su 5 do 100 puta brže nego sa Standard Template bibliotekama (STL) i Threading Building blokovima (TBB).

“Unified Virtual adresiranje i brža GPU-GPU komunikacija čine jednostavnijim za programere da iskoriste prednosti paralelnog računarstva sa grafičkim procesorima,” izjavio je Džon Stoun, stariji istraživački programer na Univerzitetu Ilinoj, Urbana-Champaign.

“Imati pristup računarstvu sa grafičkim procesorima kroz interfejs standardnih šablona značajno povećava produktivnost u mnogim poljima poslovanja, od jednostavnog generisanja protoka novca, do kompleksnih računanja Libor tržišnih modela, varijabilnih godišnjih prihoda ili CVA podešavanja,” izjavio je Piter Dekrem, direktor za Risk liniju proizvoda kompanije Quantifi. “Thrust C++ dadoteka je značajno umanjila ulaznu barijeru vođenjem računa o funkcionalnostima niskog nivoa kao što je pristup memoriji i alokacija memorije, dopuštajući tako finansijskom inženjeru da se fokusira na razvoj algoritma u GPU sredini”.

CUDA 4.0 arhitektura sadrži jedan broj drugih ključnih karakteristika i mogućnosti, uključujući:

  • MPI integracija sa CUDA aplikacijama – modifikovane MPI implementacije kao što su OpenMPI automatski pomeraju podatke od i u memoriju grafičkih procesora preko Infiniband veze kada aplikacija šalje i prima MPI poziv.
  • Multi-thread deljenje grafičkih procesora – Veći broj CPU tredova mogu deliti kontekst na jednom GPU procesoru što čini deljenje jednog GPU čipa lakšim kada su u pitanju milti-tredovane aplikacije.
  • Multi-GPU deljenje sa jednim CPU thread-om – Jedan CPU host thread može pristupiti svim GPU-ovima u sistemu. Programeri mogu lako koordinisati rad preko velikog broja GPU-pva kada su u pitanju zadaci kao što je “halo” razmena u aplikacijama.
  • Nova NPP Image i Computer Vision datoteka – bogat set operacija transformacije slika koje omogućavaju brz razvoj imaging and computer vision aplikacija.
  • Nove i poboljšane mogućnosti
    • Automatska analiza performansi u aplikaciji Visual Profiler
    • Nove karakteristike u cuda-gdb i dodata podrška za Mac OS
    • Dodata podrška za C++ kao što su ‘new/delete’ i virtuelne funkcije
    • Novi GPU binarni disassembler

 

CUDA Toolkit 4.0 će biti dostupan, besplatno, 4. marta 2011., ako se prijavite za CUDA Registered Developer Program na: www.nvidia.com/paralleldeveloper. CUDA Registered Developer Program donosi mnoštvo alata, resursa i informacija za programere koji rade na razvoju paralelnih aplikacija kako bi maksimalno iskoristili potencijal koji CUDA tehnologija donosi.

Za više informacija o karakteristikama i mogućnostima CUDA Toolkit paketa i o GPGPU aplikacijama, posetite: www.nvidia.com/cuda