وب سایت تخصصی شرکت فرین
دسته بندی دوره ها

Mastering Data Wrangling with PySpark in Databricks

سرفصل های دوره

From Beginner to Pro: Learn Key Data Processing Skills and Machine Learning with PySpark in Databricks


01 - Introduction
  • 001 Course Overview
  • 002 Notebooks.html
  • 002 Notebooks.zip

  • 02 - Getting Started with PySpark and Databricks
  • 001 Introduction to PySpark and Databricks
  • 002 Setting up Your Databricks Environment
  • 003 Inside Databricks
  • 004 Extra-resources5.txt
  • 004 Transformations vs Actions

  • 03 - Basics of PySpark
  • 001 PySpark Data Structures
  • 003 Extra-resources2.txt
  • 003 Schema and data types
  • 004 Creating DataFrames
  • 005 Extra-resources3.txt
  • 005 Importing PySpark Functions in Databricks
  • 007 Loading and Displaying Data in Databricks
  • 008 Infer Schema

  • 04 - Data Wrangling With PySpark
  • 001 Data Manipulation with PySpark
  • 002 Selecting, Adding and Removing Columns
  • 003 Renaming Columns
  • 004 Count, Count Distinct, Sort, Cast
  • 005 Filtering Data
  • 006 Filtering Contains and Like
  • 007 Between and isin
  • 008 Fill and Replace Values, Handling Missing Data
  • 009 Handling Missing Data 2
  • 011 Case When
  • 012 Aggregating Data
  • 012 Aggregation.pdf
  • 013 Pivot Table
  • 014 Dealing with Date and Time
  • 015 Window
  • 017 Joining Datasets
  • 017 Joining-Datasets.pdf
  • 018 Percentile
  • 019 Other Useful Functions
  • 020 Data Caching
  • 020 Extra-resources8.txt
  • 021 Extra-resources9.txt
  • 021 Saving Data to CSV
  • 022 Saving Data to Databricks File System
  • 023 Exercises
  • 024 Exercises Solutions

  • 05 - Query Optimization
  • 001 Extra-resources10.txt
  • 001 Query Optimization
  • 001 Query-Optimization.pdf
  • 002 Cache and Persist
  • 002 Extra-resources11.txt
  • 003 Best practices for handling large datasets
  • 003 Extra-resources12.txt

  • 06 - Databricks SQL
  • 001 DataFrame API vs. SQL API
  • 001 pyspark-vs-sql.zip
  • 002 Working with SQL
  • 003 Basic SQL Queries

  • 07 - Machine Learning with PySpark
  • 001 Extra-resources13.txt
  • 001 Introduction to Machine Learning with Pyspark
  • 002 MLlib Regression Diamonds Prices
  • 003 MLlib Regression Diamonds Prices (2)
  • 004 Extra-resources14.txt
  • 004 MLlib Regression Diamonds Prices (3)
  • 005 Feature engineering.html
  • 006 Building and Training Machine Learning Models.html
  • 007 Model selection and evaluation.html
  • 008 Hyperparameter tuning.html

  • 08 - Conclusion
  • 001 Course Conclusion.html
  • 002 Bloppers
  • 003 Bonus Materials.html
  • 003 Extra-resources.zip
  • 139,000 تومان
    بیش از یک محصول به صورت دانلودی میخواهید؟ محصول را به سبد خرید اضافه کنید.
    افزودن به سبد خرید
    خرید دانلودی فوری

    در این روش نیاز به افزودن محصول به سبد خرید و تکمیل اطلاعات نیست و شما پس از وارد کردن ایمیل خود و طی کردن مراحل پرداخت لینک های دریافت محصولات را در ایمیل خود دریافت خواهید کرد.

    ایمیل شما:
    تولید کننده:
    مدرس:
    شناسه: 31941
    حجم: 2257 مگابایت
    مدت زمان: 312 دقیقه
    تاریخ انتشار: ۶ فروردین ۱۴۰۳
    دسته بندی محصول
    طراحی سایت و خدمات سئو

    139,000 تومان
    افزودن به سبد خرید