برنامه نویسی CUDA بوسیله زبان C++

سرفصل های دوره

یادگیری برنامه نویسی موازی در GPU با CUDA از مفاهیم اساسی برای پیشرفت پیاده سازی الگوریتم.

عنوان اصلی : CUDA programming Masterclass with C++

سرفصل های دوره :

معرفی برنامه نویسی CUDA و مدل برنامه نویسی CUDA :
بیایید پیشینه ای را بررسی کنیم.
نحوه نصب جعبه ابزار CUDA و ابتدا نگاهی به برنامه CUDA
عناصر اساسی برنامه CUDA
سازماندهی رشته ها در یک برنامه CUDA - threadIdx
سازمان thread در یک برنامه CUDA - blockIdx,blockDim,gridDim
تمرین برنامه نویسی 1
محاسبه شاخص منحصر به فرد با استفاده از threadIdx blockId و blockDim
محاسبه شاخص منحصر به فرد برای شبکه دو بعدی 1
محاسبه شاخص منحصر به فرد برای شبکه دو بعدی 2
انتقال حافظه بین میزبان و دستگاه
تمرین برنامه نویسی 2
مثال آرایه جمع با بررسی اعتبار
مثال آرایه جمع با مدیریت خطا
مثال آرایه جمع با زمان بندی
اجرای آرایه sum را برای خلاصه کردن 3 آرایه گسترش دهید
ویژگی های دستگاه
خلاصه
مدل اجرای CUDA :
همه چیز در مورد تارها
واگرایی تار
پارتیشن بندی منابع و پنهان کردن تأخیر 1
پارتیشن بندی منابع و پنهان کردن تأخیر 2
اشغال
بهینه سازی مبتنی بر پروفایل با nvprof
کاهش موازی به عنوان مثال همگام سازی
کاهش موازی به عنوان مثال واگرایی تار
کاهش موازی با باز کردن حلقه
کاهش موازی به عنوان باز شدن پیچ و تاب
کاهش با باز کردن کامل
مقایسه عملکرد هسته های کاهشی
CUDA موازی دینامیکی
کاهش با موازی سازی پویا
خلاصه
مدل حافظه CUDA :
مدل حافظه CUDA
انواع حافظه مختلف در CUDA
مدیریت حافظه و حافظه پین شده
حافظه کپی صفر
حافظه یکپارچه
الگوهای دسترسی به حافظه جهانی
حافظه جهانی می نویسد
AOS در مقابل SOA
انتقال ماتریس
جابجایی ماتریس با باز کردن
انتقال ماتریسی با سیستم مختصات مورب
خلاصه
CUDA حافظه مشترک و حافظه ثابت:
معرفی حافظه مشترک CUDA
حالت‌های دسترسی به حافظه مشترک و بانک‌های حافظه
دسترسی ردیف اصلی و ستون اصلی به حافظه مشترک
حافظه مشترک استاتیک و پویا
حافظه مشترک
کاهش موازی با حافظه مشترک
همگام سازی در CUDA
انتقال ماتریس با حافظه مشترک
حافظه ثابت CUDA
جابجایی ماتریس با بالشتک حافظه مشترک
دستورالعمل‌های CUDA warp shuffle
کاهش موازی با دستورالعمل‌های تار زدن
خلاصه
CUDA Streams:
نحوه استفاده از توابع ناهمزمان CUDA
نحوه استفاده از جریانهای CUDA
همپوشانی انتقال حافظه و اجرای کرنل
همگام سازی جریان و مسدود کردن رفتار جریان NULL
همگام سازی صریح و ضمنی
رویدادهای CUDA و زمان‌بندی با رویدادهای CUDA
ایجاد وابستگی بین جریانی با رویدادها
تنظیم عملکرد با دستورات اولیه CUDA:
عملیات ممیز شناور
توابع استاندارد و دستوری
توابع اتمی
الگوهای موازی و کاربردها:
معرفی الگوریتم اسکن
اسکن موازی ساده
اسکن انحصاری موازی کارآمد را انجام دهید
اسکن فراگیر موازی کارآمد انجام دهید
اسکن موازی برای مجموعه داده های بزرگ
الگوریتم فشرده موازی
پاداش: مقدمه ای بر پردازش تصویر با CUDA:
مقدمه قسمت 1
مقدمه قسمت 2
پردازش تصویر دیجیتال
مجموعه‌های تصویر دیجیتال: ادراک انسان
اصول تصویر دیجیتال: تشکیل تصویر
نصب OpenCV

نمایش سرفصل های انگلیسی

CUDA programming Masterclass with C++

45,900 تومان

خرید اشتراک افزودن به سبد خرید

خرید دانلودی فوری

در این روش نیاز به افزودن محصول به سبد خرید و تکمیل اطلاعات نیست و شما پس از وارد کردن ایمیل خود و طی کردن مراحل پرداخت لینک های دریافت محصولات را در ایمیل خود دریافت خواهید کرد.

تولید کننده: Udemy-Training