در حال حاضر محصولی در سبد خرید شما وجود ندارد.
این دوره به شما آموزش می دهد تا تکنیک های مهم برای تجزیه و تحلیل پیش بینی شده مانند رگرسیون و طبقه بندی را با استفاده از API های Apis Apache Spark Mllib در Databricks آموزش دهید.
چه چیزی شما را یاد می گیرید
موتور تجزیه و تحلیل جرقه یکپارچه یکی از محبوب ترین چارچوب ها برای تجزیه و تحلیل داده های بزرگ و پردازش است. جرقه ارائه می دهد بسیار جامع و آسان برای استفاده از API ها برای یادگیری ماشین که شما می توانید برای ساخت مدل های پیش بینی کننده برای رگرسیون و طبقه بندی و داده های پیش پردازش برای تغذیه به این مدل ها استفاده کنید.
در این دوره، تجزیه و تحلیل پیش بینی شده با استفاده از آپاچی جرقه Mllib در Databricks، شما یاد خواهید گرفت که مدل های یادگیری ماشین را با استفاده از API های Spark ML اجرا کنید. اول، شما کتابخانه های مختلف جرقه ای را برای یادگیری ماشین، کتابخانه مبتنی بر RDD قدیمی و کتابخانه مبتنی بر DataFrame جدیدتر درک خواهید کرد. پس از آن، طیف ترانسفورماتورهای موجود در جرقه برای داده های پیش پردازش برای یادگیری ماشین را کشف خواهید کرد - مانند پوسته پوسته شدن و ترانسفورماتورهای استاندارد سازی برای داده های عددی و رمزگذاری برچسب ها و ترانسفورماتورهای رمزگذاری یک داغ برای داده های طبقه بندی شده.
بعدی، شما خواهید بود استفاده از رگرسیون خطی و مدل های گروهی مانند جنگل های تصادفی جنگل و گرادیان تقویت شده برای ساخت مدل های رگرسیون. شما از این مدل ها برای پیش بینی داده های دسته ای استفاده خواهید کرد. علاوه بر این، شما همچنین می توانید ببینید که چگونه می توانید از خط لوله های Spark ML استفاده کنید تا ترانسفورماتور و برآوردگرهای را برای ساخت یک گردش کار کامل یادگیری ماشین استفاده کنید.
در نهایت، مدل های طبقه بندی را با استفاده از رگرسیون لجستیک و همچنین درختان تصمیم گیری می کنید. شما مدل ML را با استفاده از داده های دسته ای آموزش می دهید، اما پیش بینی ها را در جریان داده ها انجام می دهید.
شما همچنین از تنظیم HyperParameter و Cross-Croscation استفاده خواهید کرد تا بهترین مدل را برای داده های خود پیدا کنید.
زمانی که شما با این کار به پایان رسید البته، شما باید مهارت ها و دانش را برای ایجاد مدل های ML با جرقه Mllib مورد نیاز برای انجام تجزیه و تحلیل پیش بینی با استفاده از ماشین یادگیری داشته باشید.
عنوان اصلی : Predictive Analytics Using Apache Spark MLlib on Databricks
سرفصل های دوره :
بررسی اجمالی دوره
پیش نیازها و رئوس مطالب دوره
آموزش ماشین در آپاچی اسپارک
دمو: پیکربندی فضای کاری و تنظیم یک نوت بوک
نسخه ی نمایشی: کاوش مجموعه داده های دیابت
نسخه ی نمایشی: استانداردسازی و مقیاس بندی
نسخه ی نمایشی: عادی سازی
دمو: تبدیل مقادیر پیوسته به مقادیر طبقهای
دمو: توکن کردن داده های متنی
نسخه ی نمایشی: رمزگذاری برچسب و رمزگذاری تک داغ
نمایش: انتخاب ویژگی
مشاهده اجمالی سریع رگرسیون خطی
Lasso Ridge و رگرسیون خالص الاستیک
نمایش: کاوش مجموعه داده های امید به زندگی
نسخه ی نمایشی: ساخت و ارزیابی یک مدل رگرسیون خطی
دمو: تنظیم فراپارامتر
مشاهده اجمالی سریع آموزش گروه
میانگین گیری و تقویت
خطوط آموزش ماشین
نمایش: کاوش مجموعه داده انتشار CO2
نسخه ی نمایشی: رگرسیون تصادفی جنگل
نسخه ی نمایشی: رگرسیون درختی تقویت شده با گرادیان
مشاهده اجمالی سریع رگرسیون لجستیک
نسخه ی نمایشی: کاوش مجموعه داده های وام
نسخه ی نمایشی: رگرسیون لجستیک
دمو: انجام پیشبینیها در جریان دادهها
مشاهده اجمالی سریع درختان تصمیم
نسخه ی نمایشی: کاوش مجموعه داده های کمپین بازاریابی بانکی
نسخه ی نمایشی: طبقه بندی درخت تصمیم
دمو: تنظیم فراپارامتر با اعتبارسنجی متقاطع
خلاصه و مطالعه بیشتر
Predictive Analytics Using Apache Spark MLlib on Databricks
در این روش نیاز به افزودن محصول به سبد خرید و تکمیل اطلاعات نیست و شما پس از وارد کردن ایمیل خود و طی کردن مراحل پرداخت لینک های دریافت محصولات را در ایمیل خود دریافت خواهید کرد.
Streamlining API Management Using Google Apigee
یادگیری ماشینی برای خدمات مالی
کورس یادگیری Kubernetes: GitOps with ArgoCD
آموزش ساخت و کار با مدل های Deep Learning بوسیله Apache MXNet
آموزش مبانی TensorFlow
Style Transfer with PyTorch
فیلم یادگیری Employing Ensemble Methods with scikit-learn
آموزش تفسیر داده ها بوسیله آمار توصیفی در زبان Python
Implementing Machine Learning Workflow with RapidMiner
Building Statistical Summaries with R