وب سایت تخصصی شرکت فرین
دسته بندی دوره ها

Building Batch Data Pipelines on Google Cloud

سرفصل های دوره

Data pipelines typically fall under one of the Extra-Load, Extract-Load-Transform or Extract-Transform-Load paradigms. This course describes which paradigm should be used and when for batch data.


1. Introduction
  • 1. Course Introduction

  • 2. Introduction to Building Batch Data Pipelines
  • 1. Quality considerations
  • 2. Module introduction
  • 3. How to carry out operations in BigQuery
  • 4. EL, ELT, ETL
  • 5. Shortcomings
  • 6. ETL to solve data quality issues

  • 03. Executing Spark on Dataproc
  • 01. Optimizing Dataproc
  • 02. The Hadoop ecosystem
  • 03. Optimizing Dataproc monitoring
  • 04. Running Hadoop on Dataproc
  • 05. Pluralsight - Getting Started with GCP and Qwiklabs
  • 07. Cloud Storage instead of HDFS
  • 08. Lab Intro - Running Apache Spark jobs on Dataproc
  • 09. Optimizing Dataproc storage
  • 10. Optimizing Dataproc templates and autoscaling
  • 11. Module introduction
  • 12. Summary

  • 04. Serverless Data Processing with Dataflow
  • 01. Creating and re-using pipeline templates
  • 02. Module introduction
  • 03. Aggregate with GroupByKey and Combine
  • 07. Lab Intro - MapReduce in Beam
  • 08. Summary
  • 09. Lab Intro - Building a Simple Dataflow Pipeline
  • 10. Why customers value Dataflow
  • 11. Introduction to Dataflow
  • 12. Side inputs and windows of data
  • 13. Lab Intro - Practicing Pipeline Side Inputs
  • 14. Key considerations with designing pipelines
  • 15. Building Dataflow pipelines in code
  • 16. Transforming data with PTransforms

  • 05. Manage Data Pipelines with Cloud Data Fusion and Cloud Composer
  • 01. Module introduction
  • 02. Orchestrate work between Google Cloud services with Cloud Co
  • 03. Apache Airflow environment
  • 04. Lab Intro - Building and executing a pipeline graph in Cloud
  • 05. Monitoring and Logging
  • 06. DAGs and Operators
  • 07. Cloud Data Fusion UI
  • 08. Explore data using wrangler
  • 09. Lab Intro - An Introduction to Cloud Composer
  • 10. Components of Cloud Data Fusion
  • 11. Introduction to Cloud Data Fusion
  • 14. Build a pipeline
  • 15. Workflow scheduling

  • 6. Course Summary
  • 1. Course Summary
  • 139,000 تومان
    بیش از یک محصول به صورت دانلودی میخواهید؟ محصول را به سبد خرید اضافه کنید.
    خرید دانلودی فوری

    در این روش نیاز به افزودن محصول به سبد خرید و تکمیل اطلاعات نیست و شما پس از وارد کردن ایمیل خود و طی کردن مراحل پرداخت لینک های دریافت محصولات را در ایمیل خود دریافت خواهید کرد.

    ایمیل شما:
    تولید کننده:
    مدرس:
    شناسه: 16999
    حجم: 258 مگابایت
    مدت زمان: 142 دقیقه
    تاریخ انتشار: 8 مرداد 1402
    دسته بندی محصول
    طراحی سایت و خدمات سئو

    139,000 تومان
    افزودن به سبد خرید