وب سایت تخصصی شرکت فرین
دسته بندی دوره ها

Cleaning Bad Data in R

سرفصل های دوره

Data integrity is the new focal point of the data science revolution. Now that everybody is onboard with the role of data in people's lives and business, it's not an unfair question to ask, "Can you prove that your data is accurate?" In this course, you can learn how to identify and address many of the data integrity issues facing modern data scientists, using R and the tidyverse. Discover how to handle missing values and duplicated data. Find out how to convert data between different units and tackle poorly formatted text. Plus, learn how to detect outliers, address structural issues, and identify red flags that indicate potential data quality issues.

Where possible, instructor Mike Chapple shows how to correct the issues using R, but the same principles can be applied to any statistical programing language.


01 - Introduction
  • 01 - Data is messy
  • 02 - What you need to know

  • 02 - 1. Missing Data
  • 01 - Types of missing data
  • 02 - Missing values
  • 03 - Missing rows
  • 04 - Aggregations and missing values

  • 03 - 2. Duplicated Data
  • 01 - Duplicated rows and values
  • 02 - Aggregations in the data set

  • 04 - 3. Formatting Data
  • 01 - Converting dates
  • 02 - Unit conversions
  • 03 - Numbers stored as text
  • 04 - Text improperly converted to numbers
  • 05 - Inconsistent spellings

  • 05 - 4. Outliers
  • 01 - Screening for outliers
  • 02 - Handling outliers
  • 03 - Outliers use case
  • 04 - Outliers in subgroups
  • 05 - Detecting illogical values

  • 06 - 5. Tidy Data
  • 01 - What is tidy data
  • 02 - Variables, observations, and values
  • 03 - Common data problems
  • 04 - Wide vs. long data sets
  • 05 - Making wide data sets long
  • 06 - Making long data sets wide

  • 07 - 6. Red Flags
  • 01 - Suspicious values
  • 02 - Suspicious multiples

  • 08 - Conclusion
  • 01 - Whats next
  • 45,900 تومان
    بیش از یک محصول به صورت دانلودی میخواهید؟ محصول را به سبد خرید اضافه کنید.
    خرید دانلودی فوری

    در این روش نیاز به افزودن محصول به سبد خرید و تکمیل اطلاعات نیست و شما پس از وارد کردن ایمیل خود و طی کردن مراحل پرداخت لینک های دریافت محصولات را در ایمیل خود دریافت خواهید کرد.

    ایمیل شما:
    تولید کننده:
    مدرس:
    شناسه: 2765
    حجم: 267 مگابایت
    مدت زمان: 116 دقیقه
    تاریخ انتشار: 28 دی 1401
    طراحی سایت و خدمات سئو

    45,900 تومان
    افزودن به سبد خرید