در حال حاضر محصولی در سبد خرید شما وجود ندارد.
دانشمندان داده مقدار زیادی از وقت خود را برای تمیز کردن مجموعه داده ها می گذرانند تا کار با آنها راحت تر باشد. در حقیقت ، قانون 80/20 می گوید که مراحل اولیه به دست آوردن و تمیز کردن داده ها 80 ٪ از زمان صرف شده برای هر پروژه معین را تشکیل می دهد.
بنابراین ، اگر فقط وارد این زمینه هستید یا قصد قدم گذاشتن را دارید در این زمینه ، این مهم است که بتوانید با داده های کثیف مقابله کنید ، خواه این به معنای از دست رفته ، قالب بندی متناقض ، سوابق ناقص یا خارج از کشور باشد. داده های پاک. برای تمیز کردن ستون ها
- تغییر نام ستون ها به مجموعه ای قابل تشخیص تر از برچسب ها
- پرش از ردیف های غیر ضروری در یک پرونده CSV
برای به دست آوردن بیشترین استفاده از این آموزش ، باید درک اساسی از این آموزش داشته باشید کتابخانه های پاندا و Numpy ، از جمله سری کارگاه های پاندا و اشیاء DataFrame ، روشهای متداول که می توانند برای این اشیاء اعمال شوند و مقادیر نان Numpy.
عنوان اصلی : Data Cleaning With pandas and NumPy
سرفصل های دوره :
01 تنظیم محیط کار خود:
001 تمیز کردن داده ها با پاندا و Numpy (نمای کلی)
002 تنظیم محیط کار خود
02 کاوش در مورد داده های المپیک:
001 کاوش در داده های المپیک
002 تنظیم برای تمیز کردن
003 تغییر نام هدر
004 برش و dicing با .loc []
03 کاوش در مجموعه داده های دانشگاه:
001 کاوش در مجموعه داده های University Towns
002 پردازش داده ها قبل از بارگذاری یک DataFrame
003 تمیز کردن داده های دانشگاه
004 با استفاده از .assign ()
04 کاوش در مجموعه داده ها:
001 کاوش در مجموعه داده های کتاب
002 ستون های رها کردن
003 با استفاده از شاخص ها
004 تمیز کردن ستون تاریخ
005 متن تمیز بر اساس قوانین
006 تمیز کردن داده ها با پاندا و Numpy (خلاصه)
Data Cleaning With pandas and NumPy
در این روش نیاز به افزودن محصول به سبد خرید و تکمیل اطلاعات نیست و شما پس از وارد کردن ایمیل خود و طی کردن مراحل پرداخت لینک های دریافت محصولات را در ایمیل خود دریافت خواهید کرد.