IT 개발자_S

파이썬 데이터 분석 결측치 확인하기 본문

IT/파이썬

파이썬 데이터 분석 결측치 확인하기

Soso12 2020. 10. 31. 10:52
반응형

● 파이썬 데이터 분석 시 데이터의 결측치를 확인할 수 있다.

 

파이썬을 활용한 데이터 분석 단계 중 먼저 선행해야 할 단계가 데이터의 결측치를 확인하는 일이다.

모든 데이터가 원하는 범주안에 정확한 데이터가 있으면 좋겠지만 현실과 이상은 많이 다르다

원하는 형태의 데이터가 아닌 정상적인 데이터의 형태가 아닌 다른 데이터가 인입될 수 있는데

이때 우리가 해야할일은 데이터 분석 전에 데이터의 결측치가 있는지 , 사전에 확인 해야 할 필요가 있다.

데이터의 결측치를 확인하는 방법은 다음과 같다.

# 데이터 이상치 확인하기 
import pandas as pd 
students = pd.read_csv("/content/drive/My Drive/Colab Notebooks/data/students.csv")
students

 

먼저 데이터를 살펴보면 english , math , class 열이 있는데 

class 는 1과 2로 관리해야되는 데이터인데 A 라는 데이터 결측치를 확인할 수 있고

math, english 데이터 값중 평균보다 너무 동 떨어진 데이터인 20을 확인할 수 있다.

이를 확인하는 코드는 다음과 같다.

위와 같이 코드로 확인할 수 있는 방법과 

시각화 하여 볼 수 있는 방법은 아래와 같다.

matplotlib 를 사용하여 확인해보자.

 

# Basic box plot
import matplotlib.pyplot as plt 
%matplotlib inline 


a =plt.boxplot(students['english'])
plt.show()

반응형
Comments