وب سایت تخصصی شرکت فرین
دسته بندی دوره ها

Building Batch Data Pipelines on Google Cloud

سرفصل های دوره

Data pipelines typically fall under one of the Extra-Load, Extract-Load-Transform or Extract-Transform-Load paradigms. This course describes which paradigm should be used and when for batch data.


1. Introduction
  • 1. Course Introduction

  • 2. Introduction to Building Batch Data Pipelines
  • 1. Quality considerations
  • 2. Module introduction
  • 3. How to carry out operations in BigQuery
  • 4. EL, ELT, ETL
  • 5. Shortcomings
  • 6. ETL to solve data quality issues

  • 03. Executing Spark on Dataproc
  • 01. Optimizing Dataproc
  • 02. The Hadoop ecosystem
  • 03. Optimizing Dataproc monitoring
  • 04. Running Hadoop on Dataproc
  • 05. Pluralsight - Getting Started with GCP and Qwiklabs
  • 07. Cloud Storage instead of HDFS
  • 08. Lab Intro - Running Apache Spark jobs on Dataproc
  • 09. Optimizing Dataproc storage
  • 10. Optimizing Dataproc templates and autoscaling
  • 11. Module introduction
  • 12. Summary

  • 04. Serverless Data Processing with Dataflow
  • 01. Creating and re-using pipeline templates
  • 02. Module introduction
  • 03. Aggregate with GroupByKey and Combine
  • 07. Lab Intro - MapReduce in Beam
  • 08. Summary
  • 09. Lab Intro - Building a Simple Dataflow Pipeline
  • 10. Why customers value Dataflow
  • 11. Introduction to Dataflow
  • 12. Side inputs and windows of data
  • 13. Lab Intro - Practicing Pipeline Side Inputs
  • 14. Key considerations with designing pipelines
  • 15. Building Dataflow pipelines in code
  • 16. Transforming data with PTransforms

  • 05. Manage Data Pipelines with Cloud Data Fusion and Cloud Composer
  • 01. Module introduction
  • 02. Orchestrate work between Google Cloud services with Cloud Co
  • 03. Apache Airflow environment
  • 04. Lab Intro - Building and executing a pipeline graph in Cloud
  • 05. Monitoring and Logging
  • 06. DAGs and Operators
  • 07. Cloud Data Fusion UI
  • 08. Explore data using wrangler
  • 09. Lab Intro - An Introduction to Cloud Composer
  • 10. Components of Cloud Data Fusion
  • 11. Introduction to Cloud Data Fusion
  • 14. Build a pipeline
  • 15. Workflow scheduling

  • 6. Course Summary
  • 1. Course Summary
  • 139,000 تومان
    بیش از یک محصول به صورت دانلودی میخواهید؟ محصول را به سبد خرید اضافه کنید.
    افزودن به سبد خرید
    خرید دانلودی فوری

    در این روش نیاز به افزودن محصول به سبد خرید و تکمیل اطلاعات نیست و شما پس از وارد کردن ایمیل خود و طی کردن مراحل پرداخت لینک های دریافت محصولات را در ایمیل خود دریافت خواهید کرد.

    ایمیل شما:
    تولید کننده:
    مدرس:
    شناسه: 16999
    حجم: 258 مگابایت
    مدت زمان: 142 دقیقه
    تاریخ انتشار: ۸ مرداد ۱۴۰۲
    دسته بندی محصول
    طراحی سایت و خدمات سئو

    139,000 تومان
    افزودن به سبد خرید