در حال حاضر محصولی در سبد خرید شما وجود ندارد.
این دوره به شما آموزش می دهد تا تکنیک های مهم برای تجزیه و تحلیل پیش بینی شده مانند رگرسیون و طبقه بندی را با استفاده از API های Apis Apache Spark Mllib در Databricks آموزش دهید.
چه چیزی شما را یاد می گیرید
موتور تجزیه و تحلیل جرقه یکپارچه یکی از محبوب ترین چارچوب ها برای تجزیه و تحلیل داده های بزرگ و پردازش است. جرقه ارائه می دهد بسیار جامع و آسان برای استفاده از API ها برای یادگیری ماشین که شما می توانید برای ساخت مدل های پیش بینی کننده برای رگرسیون و طبقه بندی و داده های پیش پردازش برای تغذیه به این مدل ها استفاده کنید.
در این دوره، تجزیه و تحلیل پیش بینی شده با استفاده از آپاچی جرقه Mllib در Databricks، شما یاد خواهید گرفت که مدل های یادگیری ماشین را با استفاده از API های Spark ML اجرا کنید. اول، شما کتابخانه های مختلف جرقه ای را برای یادگیری ماشین، کتابخانه مبتنی بر RDD قدیمی و کتابخانه مبتنی بر DataFrame جدیدتر درک خواهید کرد. پس از آن، طیف ترانسفورماتورهای موجود در جرقه برای داده های پیش پردازش برای یادگیری ماشین را کشف خواهید کرد - مانند پوسته پوسته شدن و ترانسفورماتورهای استاندارد سازی برای داده های عددی و رمزگذاری برچسب ها و ترانسفورماتورهای رمزگذاری یک داغ برای داده های طبقه بندی شده.
بعدی، شما خواهید بود استفاده از رگرسیون خطی و مدل های گروهی مانند جنگل های تصادفی جنگل و گرادیان تقویت شده برای ساخت مدل های رگرسیون. شما از این مدل ها برای پیش بینی داده های دسته ای استفاده خواهید کرد. علاوه بر این، شما همچنین می توانید ببینید که چگونه می توانید از خط لوله های Spark ML استفاده کنید تا ترانسفورماتور و برآوردگرهای را برای ساخت یک گردش کار کامل یادگیری ماشین استفاده کنید.
در نهایت، مدل های طبقه بندی را با استفاده از رگرسیون لجستیک و همچنین درختان تصمیم گیری می کنید. شما مدل ML را با استفاده از داده های دسته ای آموزش می دهید، اما پیش بینی ها را در جریان داده ها انجام می دهید.
شما همچنین از تنظیم HyperParameter و Cross-Croscation استفاده خواهید کرد تا بهترین مدل را برای داده های خود پیدا کنید.
زمانی که شما با این کار به پایان رسید البته، شما باید مهارت ها و دانش را برای ایجاد مدل های ML با جرقه Mllib مورد نیاز برای انجام تجزیه و تحلیل پیش بینی با استفاده از ماشین یادگیری داشته باشید.
عنوان اصلی : Predictive Analytics Using Apache Spark MLlib on Databricks
سرفصل های دوره :
بررسی اجمالی دوره
پیش نیازها و رئوس مطالب دوره
آموزش ماشین در آپاچی اسپارک
دمو: پیکربندی فضای کاری و تنظیم یک نوت بوک
نسخه ی نمایشی: کاوش مجموعه داده های دیابت
نسخه ی نمایشی: استانداردسازی و مقیاس بندی
نسخه ی نمایشی: عادی سازی
دمو: تبدیل مقادیر پیوسته به مقادیر طبقهای
دمو: توکن کردن داده های متنی
نسخه ی نمایشی: رمزگذاری برچسب و رمزگذاری تک داغ
نمایش: انتخاب ویژگی
مشاهده اجمالی سریع رگرسیون خطی
Lasso Ridge و رگرسیون خالص الاستیک
نمایش: کاوش مجموعه داده های امید به زندگی
نسخه ی نمایشی: ساخت و ارزیابی یک مدل رگرسیون خطی
دمو: تنظیم فراپارامتر
مشاهده اجمالی سریع آموزش گروه
میانگین گیری و تقویت
خطوط آموزش ماشین
نمایش: کاوش مجموعه داده انتشار CO2
نسخه ی نمایشی: رگرسیون تصادفی جنگل
نسخه ی نمایشی: رگرسیون درختی تقویت شده با گرادیان
مشاهده اجمالی سریع رگرسیون لجستیک
نسخه ی نمایشی: کاوش مجموعه داده های وام
نسخه ی نمایشی: رگرسیون لجستیک
دمو: انجام پیشبینیها در جریان دادهها
مشاهده اجمالی سریع درختان تصمیم
نسخه ی نمایشی: کاوش مجموعه داده های کمپین بازاریابی بانکی
نسخه ی نمایشی: طبقه بندی درخت تصمیم
دمو: تنظیم فراپارامتر با اعتبارسنجی متقاطع
خلاصه و مطالعه بیشتر
Predictive Analytics Using Apache Spark MLlib on Databricks
در این روش نیاز به افزودن محصول به سبد خرید و تکمیل اطلاعات نیست و شما پس از وارد کردن ایمیل خود و طی کردن مراحل پرداخت لینک های دریافت محصولات را در ایمیل خود دریافت خواهید کرد.
Data Labeling for Machine Learning
Building Statistical Summaries with R
آموزش Deploy کردن راهکارهای یادگیری ماشینی
Implementing Bootstrap Methods in R
آموزش تحلیل داده ها با پایتون
Applying Differential Equations and Inverse Models with R
Building Image Processing Applications Using scikit-image
دوره پیشرفته Snowflake
آموزش تفسیر داده ها با استفاده از مدل های آماری بوسیله Python
آموزش ساخت Feature ها از داده های عددی