وب سایت تخصصی شرکت فرین
دسته بندی دوره ها

Mastering Data Wrangling with PySpark in Databricks

سرفصل های دوره

From Beginner to Pro: Learn Key Data Processing Skills and Machine Learning with PySpark in Databricks


01 - Introduction
  • 001 Course Overview
  • 002 Notebooks.html
  • 002 Notebooks.zip

  • 02 - Getting Started with PySpark and Databricks
  • 001 Introduction to PySpark and Databricks
  • 002 Setting up Your Databricks Environment
  • 003 Inside Databricks
  • 004 Extra-resources5.txt
  • 004 Transformations vs Actions

  • 03 - Basics of PySpark
  • 001 PySpark Data Structures
  • 003 Extra-resources2.txt
  • 003 Schema and data types
  • 004 Creating DataFrames
  • 005 Extra-resources3.txt
  • 005 Importing PySpark Functions in Databricks
  • 007 Loading and Displaying Data in Databricks
  • 008 Infer Schema

  • 04 - Data Wrangling With PySpark
  • 001 Data Manipulation with PySpark
  • 002 Selecting, Adding and Removing Columns
  • 003 Renaming Columns
  • 004 Count, Count Distinct, Sort, Cast
  • 005 Filtering Data
  • 006 Filtering Contains and Like
  • 007 Between and isin
  • 008 Fill and Replace Values, Handling Missing Data
  • 009 Handling Missing Data 2
  • 011 Case When
  • 012 Aggregating Data
  • 012 Aggregation.pdf
  • 013 Pivot Table
  • 014 Dealing with Date and Time
  • 015 Window
  • 017 Joining Datasets
  • 017 Joining-Datasets.pdf
  • 018 Percentile
  • 019 Other Useful Functions
  • 020 Data Caching
  • 020 Extra-resources8.txt
  • 021 Extra-resources9.txt
  • 021 Saving Data to CSV
  • 022 Saving Data to Databricks File System
  • 023 Exercises
  • 024 Exercises Solutions

  • 05 - Query Optimization
  • 001 Extra-resources10.txt
  • 001 Query Optimization
  • 001 Query-Optimization.pdf
  • 002 Cache and Persist
  • 002 Extra-resources11.txt
  • 003 Best practices for handling large datasets
  • 003 Extra-resources12.txt

  • 06 - Databricks SQL
  • 001 DataFrame API vs. SQL API
  • 001 pyspark-vs-sql.zip
  • 002 Working with SQL
  • 003 Basic SQL Queries

  • 07 - Machine Learning with PySpark
  • 001 Extra-resources13.txt
  • 001 Introduction to Machine Learning with Pyspark
  • 002 MLlib Regression Diamonds Prices
  • 003 MLlib Regression Diamonds Prices (2)
  • 004 Extra-resources14.txt
  • 004 MLlib Regression Diamonds Prices (3)
  • 005 Feature engineering.html
  • 006 Building and Training Machine Learning Models.html
  • 007 Model selection and evaluation.html
  • 008 Hyperparameter tuning.html

  • 08 - Conclusion
  • 001 Course Conclusion.html
  • 002 Bloppers
  • 003 Bonus Materials.html
  • 003 Extra-resources.zip
  • 139,000 تومان
    بیش از یک محصول به صورت دانلودی میخواهید؟ محصول را به سبد خرید اضافه کنید.
    خرید دانلودی فوری

    در این روش نیاز به افزودن محصول به سبد خرید و تکمیل اطلاعات نیست و شما پس از وارد کردن ایمیل خود و طی کردن مراحل پرداخت لینک های دریافت محصولات را در ایمیل خود دریافت خواهید کرد.

    ایمیل شما:
    تولید کننده:
    مدرس:
    شناسه: 31941
    حجم: 2257 مگابایت
    مدت زمان: 312 دقیقه
    تاریخ انتشار: 6 فروردین 1403
    دسته بندی محصول
    طراحی سایت و خدمات سئو

    139,000 تومان
    افزودن به سبد خرید