در حال حاضر محصولی در سبد خرید شما وجود ندارد.
در این دوره آموزشی قدم به قدم کدنویسی و کار با پروژه های یادگیری ماشینی را بوسیله PyTorch یاد می گیرید.
عنوان اصلی : Hands-on Reinforcement Learning with PyTorch
اولین گام در یادگیری تقویتی Pytorch:
بررسی اجمالی دوره
راه اندازی و نصب PyTorch
PyTorch با GPU در Cloud
مقدمه ای بر PyTorch
آشنایی با عوامل، محیطها، پاداشها، وضعیتها و اقدامات
درک محیط های OpenAI Gym
بررسی فرآیند تصمیم گیری مارکوف با برنامه نویسی پویا:
استفاده از چارچوب MDP با ارزیابی سیاست
استفاده از چارچوب MDP با ارزیابی سیاست
بهبود یک عامل با تکرار خط مشی در تاکسی
بازی تاکسی با تکرار ارزش
متعادل کردن پیش بینی در مقابل کنترل و کاوش در مقابل بهره برداری
استفاده از توابع ارزش و تقریبگرهای تابع
پیاده سازی و آموزش یک عامل با روش متقاطع آنتروپی
به روشهای تفاوت زمانی با شبکههای Q عمیق بروید:
بررسی روشهای TD
تجسم نتیجه SARSA و SARSE
استفاده از یادگیری Q در شبکه های دیپ کیو با پونگ با استفاده از PyTorch
پیاده سازی Deep Q Network با PyTorch
مرور کد: DQN
افزودن بهبودها با Double DQN
اصلاح معماری DQN با Dueling DQN
حفاری عمیق تر با مونت کارلو و روش های گرادیان سیاست:
استفاده از روش های مونت کارلو
خارج از سیاست و خارج از سیاست با نمونه گیری اهمیت
استفاده از روشهای گرادیان خط مشی با REINFORCE
پیاده سازی گرادیان های سیاست در LunarLander با PyTorch
یکسان سازی روش های مونت کارلو و TD
ترکیب توابع ارزش و گرادیان های خط مشی با بازیگر- منتقد
بازی Continuous LunarLander با Actor-Critic در Pytorch
بکارگیری بازیگر- منتقد در معماری های پیشرفته
با شیب های سیاست قطعی عمیق تر پیش می رویم:
اجرای گرادیان های سیاست قطعی عمیق
مرور کد: DDPG
بهبود DDPG با انواع مختلف
کار با Deep Reinforcement Learning
Hands-on Reinforcement Learning with PyTorch
در این روش نیاز به افزودن محصول به سبد خرید و تکمیل اطلاعات نیست و شما پس از وارد کردن ایمیل خود و طی کردن مراحل پرداخت لینک های دریافت محصولات را در ایمیل خود دریافت خواهید کرد.