دسته بندی

در حال حاضر محصولی در سبد خرید شما وجود ندارد.

پنل کاربری

رمز خود را فراموش کرده اید؟ اگر اولین بار است از سایت جدید استفاده میکنید باید پسورد خود را ریست نمایید.

آموزش یادگیری ماشینی به شیوه Reinforcement Learning در زبان Python

دانلود Udemy Artificial Intelligence: Reinforcement Learning in Python

10,900 تومان
بیش از یک محصول به صورت دانلودی میخواهید؟ محصول را به سبد خرید اضافه کنید.
افزودن به سبد خرید
خرید دانلودی فوری

در این روش نیاز به افزودن محصول به سبد خرید و تکمیل اطلاعات نیست و شما پس از وارد کردن ایمیل خود و طی کردن مراحل پرداخت لینک های دریافت محصولات را در ایمیل خود دریافت خواهید کرد.

ویدئو معرفی این محصول

با مشاهده این کورس آموزشی از طریق انجام پروژه های واقعی و به زبانی بسیار ساده مطالب فراوانی را در رابطه با هوش مصنوعی و یادگیری ماشینی در زبان پایتون یاد می گیرید.

عنوان اصلی : Artificial Intelligence: Reinforcement Learning in Python

این مجموعه آموزش ویدیویی محصول موسسه آموزشی Udemy است که بر روی 2 حلقه دیسک ارائه شده و به مدت زمان 14 ساعت و 40 دقیقه در اختیار علاقه مندان قرار می گیرد.

در ادامه با برخی از سرفصل های درسی این مجموعه آموزش آشنا می شویم :


Welcome :
Introduction
Course Outline and Big Picture
Where to get the Code
How to Succeed in this Course
Warmup

Return of the Multi-Armed Bandit :
Section Introduction: The Explore-Exploit Dilemma
Applications of the Explore-Exploit Dilemma
Epsilon-Greedy Theory
Calculating a Sample Mean (pt 1)
Epsilon-Greedy Beginner's Exercise Prompt
Designing Your Bandit Program
Epsilon-Greedy in Code
Comparing Different Epsilons
Optimistic Initial Values Theory
Optimistic Initial Values Beginner's Exercise Prompt
Optimistic Initial Values Code
UCB1 Theory
UCB1 Beginner's Exercise Prompt
UCB1 Code
Bayesian Bandits / Thompson Sampling Theory (pt 1)
Bayesian Bandits / Thompson Sampling Theory (pt 2)
Thompson Sampling Beginner's Exercise Prompt
Thompson Sampling Code
Thompson Sampling With Gaussian Reward Theory
Thompson Sampling With Gaussian Reward Code
Why don't we just use a library?
Nonstationary Bandits
Bandit Summary, Real Data, and Online Learning
(Optional) Alternative Bandit Designs
Suggestion Box

High Level Overview of Reinforcement Learning :
What is Reinforcement Learning?
From Bandits to Full Reinforcement Learning

Markov Decision Proccesses :
MDP Section Introduction
Gridworld
Choosing Rewards
The Markov Property
Markov Decision Processes (MDPs)
Future Rewards
Value Functions
The Bellman Equation (pt 1)
The Bellman Equation (pt 2)
The Bellman Equation (pt 3)
Bellman Examples
Optimal Policy and Optimal Value Function (pt 1)
Optimal Policy and Optimal Value Function (pt 2)
MDP Summary

Dynamic Programming :
Dynamic Programming Section Introduction
Iterative Policy Evaluation
Designing Your RL Program
Gridworld in Code
Iterative Policy Evaluation in Code
Windy Gridworld in Code
Iterative Policy Evaluation for Windy Gridworld in Code
Policy Improvement
Policy Iteration
Policy Iteration in Code
Policy Iteration in Windy Gridworld
Value Iteration
Value Iteration in Code
Dynamic Programming Summary

Monte Carlo :
Monte Carlo Intro
Monte Carlo Policy Evaluation
Monte Carlo Policy Evaluation in Code
Monte Carlo Control
Monte Carlo Control in Code
Monte Carlo Control without Exploring Starts
Monte Carlo Control without Exploring Starts in Code
Monte Carlo Summary

Temporal Difference Learning :
Temporal Difference Introduction
TD(0) Prediction
TD(0) Prediction in Code
SARSA
SARSA in Code
Q Learning
Q Learning in Code
TD Learning Section Summary

Approximation Methods :
Approximation Methods Section Introduction
Linear Models for Reinforcement Learning
Feature Engineering
Approximation Methods for Prediction
Approximation Methods for Prediction Code
Approximation Methods for Control
Approximation Methods for Control Code
CartPole
CartPole Code
Approximation Methods Exercise
Approximation Methods Section Summary

Interlude: Common Beginner Questions :
This Course vs. RL Book: What's the Difference?

Stock Trading Project with Reinforcement Learning :
Beginners, halt! Stop here if you skipped ahead
Stock Trading Project Section Introduction
Data and Environment
How to Model Q for Q-Learning
Design of the Program
Code pt 1
Code pt 2
Code pt 3
Code pt 4
Stock Trading Project Discussion

Setting Up Your Environment (FAQ by Student Request) :
Anaconda Environment Setup
How to install Numpy, Scipy, Matplotlib, Pandas, IPython, Theano, and TensorFlow

Extra Help With Python Coding for Beginners (FAQ by Student Request) :
How to Code by Yourself (part 1)
How to Code by Yourself (part 2)
Proof that using Jupyter Notebook is the same as not using it
Python 2 vs Python 3

Effective Learning Strategies for Machine Learning (FAQ by Student Request) :
How to Succeed in this Course (Long Version)
Is this for Beginners or Experts? Academic or Practical? Fast or slow-paced?
Machine Learning and AI Prerequisite Roadmap (pt 1)
Machine Learning and AI Prerequisite Roadmap (pt 2)

Appendix / FAQ Finale :
What is the Appendix?
BONUS: Where to get discount coupons and FREE deep learning material

مشخصات این مجموعه :
زبان آموزش ها انگلیسی روان و ساده
دارای آموزشهای ویدیویی و دسته بندی شده
ارائه شده بر روی 2 حلقه دیسک
مدت زمان آموزش 14 ساعت و 40 دقیقه !
محصول موسسه آموزشی Udemy