Ядра CUDA – условное обозначение скалярных вычислительных блоков в видео-чипах NVidia, начиная с G80 ( GeForce 8xxx, Tesla C-D-S870, FX4/5600, 360M). Сами чипы являются производными RISC архитектуры. К слову, потому компания NVidia так охотно взялась за разработку собственных ARM процессоров Tegra Series, основанных тоже на RISC архитектуре. Опыт работы с данными архитектурами очень большой.

CUDA ядро содержит в себе один один векторный и один скалярный юнит, которые за один такт выполняют по одной векторной и по одной скалярной операции, передавая вычисления другому мультипроцессору, либо в кэш память для дальнейшей обработки. Массив из сотен и тысяч таких ядер, представляет из себя значительную вычислительную мощность и может выполнять различные задачи в зависимости от требований, при наличии определённого софта поддерживающего язык CUDA. Применение может быть разнообразным: декодирование видеопотока, ускорение 2D/3D графики, облачные вычисления, специализированные математические анализы и т.д.

Довольно часто, объединённые профессиональные карты NVidia Tesla и NVidia Quadro, являются костяком современных суперкомпьютеров.

CUDA — ядра не претерпели каких либо значимых изменений со времён G80, но увеличивается их количество (совместно с другими блоками — ROP, Texture Units & etc) и эффективность параллельных взаимодействий друг с другом (улучшаются модули Giga Thread).

К примеру:

GeForce

GTX 460 — 336 CUDA ядер
GTX 580 — 512 CUDA ядер
8800GTX — 128 CUDA ядер

От количества потоковых процессоров (CUDA), практически пропорционально увеличивается производительность в шейдерных вычислениях (при равномерном увеличении количества и других элементов).

Начиная с чипа GK110 (NVidia GeForce GTX 680) — CUDA ядра теперь не имеют удвоенную частоту, а общую со всеми остальными блоками чипа. Вместо этого было увеличено их количество примерно в три раза в сравнении с предыдущим поколением G110.