در حال حاضر محصولی در سبد خرید شما وجود ندارد.

پنل کاربری

رمز خود را فراموش کرده اید؟ اگر اولین بار است از سایت جدید استفاده میکنید باید پسورد خود را ریست نمایید.
دسته بندی
دسته بندی

در حال حاضر محصولی در سبد خرید شما وجود ندارد.

کورس کدنویسی یادگیری ماشینی بوسیله زبان Python

14,900 تومان
بیش از یک محصول به صورت دانلودی میخواهید؟ محصول را به سبد خرید اضافه کنید.
افزودن به سبد خرید
خرید دانلودی فوری

در این روش نیاز به افزودن محصول به سبد خرید و تکمیل اطلاعات نیست و شما پس از وارد کردن ایمیل خود و طی کردن مراحل پرداخت لینک های دریافت محصولات را در ایمیل خود دریافت خواهید کرد.

ویدئو معرفی این محصول

یکی از روشهای موفق یادگیری ماشینی Reinforcement Learning است. در این دوره آموزشی کدنویسی و کار با Reinforcement Learning ر در زبان برنامه نویسی Python به خوبی یاد می گیرید.

عنوان اصلی : Reinforcement Learning with Python Explained for Beginners

سرفصل ها :


معرفی دوره و مدرس:
معرفی دوره و مدرس
یادگیری تقویت انگیزه:
یادگیری تقویتی چیست؟
Reinforcement Learning Hiders and Seekers توسط OpenAI چیست؟
RL در مقابل سایر چارچوب های ML
چرا یادگیری تقویتی
نمونه هایی از یادگیری تقویتی
محدودیت های یادگیری تقویتی
تمرینات
اصطلاحات یادگیری تقویتی:
محیط زیست چیست
Environment_2 چیست
عامل چیست
ایالت چیست
ایالت متعلق به محیط زیست است و نه به عامل
اکشن چیست
پاداش چیست
هدف
خط مشی
خلاصه
مثال GridWorld:
راه اندازی 1
راه اندازی 2
راه اندازی 3
مقایسه سیاست
محیط قطعی
محیط تصادفی
محیط تصادفی 2
محیط تصادفی 3
محیط غیر ساکن
خلاصه GridWorld
فعالیت
پیش نیازهای فرآیند تصمیم گیری مارکوف:
احتمال
احتمال 2
احتمال 3
احتمال شرطی
مثال سرگرمی احتمال شرطی
احتمال مشترک
احتمال مشترک 2
احتمال مشترک 3
ارزش مورد انتظار
انتظار مشروط
مدلسازی عدم قطعیت محیط
مدلسازی عدم قطعیت محیط 2
مدلسازی عدم قطعیت محیط 3
مدلسازی عدم قطعیت سیاست تصادفی محیطی
مدلسازی عدم قطعیت سیاست تصادفی محیطی 2
مدلسازی عدم قطعیت توابع ارزش محیطی
میانگین های در حال اجرا
میانگین های در حال اجرا 2
در حال اجرا میانگین ها به عنوان تفاوت زمانی
فعالیت
عناصر فرآیند تصمیم گیری مارکوف:
دارایی مارکوف
فضای ایالتی
فضای اکشن
احتمالات انتقال
تابع پاداش
عامل تخفیف
خلاصه
فعالیت
اطلاعات بیشتر در مورد پاداش:
آزمون MOR 1
راه حل آزمون MOR 1
مسابقه MOR 2
راه حل آزمون MOR 2
مقیاس بندی پاداش MOR
افق بی نهایت MOR
آزمون MOR 3
راه حل آزمون MOR 3
حل DP مارکوف:
خلاصه MDP
توابع ارزش
تابع ارزش بهینه
سیاست بهینه
معادله بلمن
تکرار ارزش
آزمون تکرار ارزش
آزمون گامای تکرار ارزش وجود ندارد
راه حل تکرار ارزش
مشکلات تکرار ارزش
ارزیابی خط مشی
ارزیابی خط مشی 2
ارزیابی خط مشی 3
ارزیابی خط مشی د فرم راه حل
تکرار خط مشی
ارزش های اقدام دولت
مقایسه V و Q
تقریب ارزش:
ناشناخته بودن MDP به چه معناست
چرا احتمالات انتقال مهم هستند
راه حل های مبتنی بر مدل
راه حل های بدون مدل
آموزش مونت کارلو
مثال یادگیری مونت کارلو
محدودیت های یادگیری مونت کارلو
تفاوت زمانی - یادگیری Q:
میانگین در حال اجرا
میزان یادگیری
معادله یادگیری
الگوریتم TD
اکتشاف در مقابل بهره برداری
سیاست حریص اپسیلون
سارسا
Q-Learning
اجرای Q-Learning برای MAPROVER Clipped
TD Lambda:
N-Step Look a Head
فرمولاسیون
ارزش های
TD Q-Learning TD Lambda
TD Q-Learning TD Lambda TD(Lambda) MAPRover Activity
Project Frozenlake (Open AI Gym):
دریاچه یخ زده 1
پیاده سازی Frozenlake

نمایش سرفصل های انگلیسی

Reinforcement Learning with Python Explained for Beginners