IT 개발자_S

파이썬 Pandas 데이터 분석 기초 csv 본문

IT/파이썬

파이썬 Pandas 데이터 분석 기초 csv

Soso12 2020. 3. 10. 22:11
반응형

## Pandas 의 기본 사용법

#Series 시리즈 인덱스와 값으로 구성 == 객체와 비슷

# name , age 객체


import pandas as pd

array = pd.Series(['사과', '바나나', '당근'], index =['a', 'b', 'c'])
print(array)
print("  ")
print(array['a'])

data = {
    'a' : '사과',
    'b' : '바나나'
    
}

array = pd.Series(data)
print(array['b'])

 

## 데이터 프레임이란 ?
## 다수의 Series를 처리 엑셀과 비슷

import pandas as pd
word_dict ={
    'Apple' : '사과'
}
frequency_dict = {
    'Apple' :3
    
}

word = pd.Series(word_dict)
freq = pd.Series(frequency_dict)

import pandas as pd

data = pd.read_csv("sample.csv", engine='python'  ) ## csv 에 한글 있을경구 engine 으로 처리
data.shape ## 몇행의 데이터 확인
data.columns ## 컬럼 확인
df2 = data[["구매확정일", "반품완료일"]] ## 컬럼 정제
df2
df2.head() ## 앞뒤 5개 씩 볼수 있음
df2.tail()

df2["구매확정일"].unique() ## 데이터가 범주형인지 체크
#df2.dropna(how="any") ## NAN 값 제거

반응형

'IT > 파이썬' 카테고리의 다른 글

파이썬 데이터 타입과 변수란?  (0) 2020.10.17
파이썬 가상환경 만들기  (0) 2020.10.14
파이썬 배열 선언, 오른쪽 정렬  (0) 2020.03.08
백준 1568 파이썬  (0) 2020.03.05
파이썬 전위연산자 후위연산자 ++ --  (0) 2020.03.02
Comments