در حال حاضر محصولی در سبد خرید شما وجود ندارد.

پنل کاربری

رمز خود را فراموش کرده اید؟ اگر اولین بار است از سایت جدید استفاده میکنید باید پسورد خود را ریست نمایید.
دسته بندی
دسته بندی

Cleaning Bad Data in R

24,900 تومان
بیش از یک محصول به صورت دانلودی میخواهید؟ محصول را به سبد خرید اضافه کنید.
خرید دانلودی فوری

در این روش نیاز به افزودن محصول به سبد خرید و تکمیل اطلاعات نیست و شما پس از وارد کردن ایمیل خود و طی کردن مراحل پرداخت لینک های دریافت محصولات را در ایمیل خود دریافت خواهید کرد.

ویدئو معرفی این محصول

Data integrity is the new focal point of the data science revolution. Now that everybody is onboard with the role of data in people's lives and business, it's not an unfair question to ask, "Can you prove that your data is accurate?" In this course, you can learn how to identify and address many of the data integrity issues facing modern data scientists, using R and the tidyverse. Discover how to handle missing values and duplicated data. Find out how to convert data between different units and tackle poorly formatted text. Plus, learn how to detect outliers, address structural issues, and identify red flags that indicate potential data quality issues.

Where possible, instructor Mike Chapple shows how to correct the issues using R, but the same principles can be applied to any statistical programing language.


01 - Introduction
  • 01 - Data is messy
  • 02 - What you need to know

  • 02 - 1. Missing Data
  • 01 - Types of missing data
  • 02 - Missing values
  • 03 - Missing rows
  • 04 - Aggregations and missing values

  • 03 - 2. Duplicated Data
  • 01 - Duplicated rows and values
  • 02 - Aggregations in the data set

  • 04 - 3. Formatting Data
  • 01 - Converting dates
  • 02 - Unit conversions
  • 03 - Numbers stored as text
  • 04 - Text improperly converted to numbers
  • 05 - Inconsistent spellings

  • 05 - 4. Outliers
  • 01 - Screening for outliers
  • 02 - Handling outliers
  • 03 - Outliers use case
  • 04 - Outliers in subgroups
  • 05 - Detecting illogical values

  • 06 - 5. Tidy Data
  • 01 - What is tidy data
  • 02 - Variables, observations, and values
  • 03 - Common data problems
  • 04 - Wide vs. long data sets
  • 05 - Making wide data sets long
  • 06 - Making long data sets wide

  • 07 - 6. Red Flags
  • 01 - Suspicious values
  • 02 - Suspicious multiples

  • 08 - Conclusion
  • 01 - Whats next