본문 바로가기
Tech

Ch3. 데이터구조 확인하기

by keneth 2024. 5. 30.
반응형

본 자료는 [시나공 AI능력시험 AICE ASSOCIATE편] 책을 공부하면서 정리하는 내용임

 

# Ch3. 데이터구조 확인하기
# Sec1. 데이터프레임 확인하기

# 데이터프레임은 판다스의 자료구조임
# 1. 데이터 살펴보기

# 넘파이, 판다스 불러오기
import numpy as np
import pandas as pd

# 판다스의 read_csv 함수로 데이터 불러오기
flight = pd.read_csv('./Clean_Dataset.csv', encoding = "cp949")
flight

# head(), tail()에 숫자 없이 쓰면 5개만 보여줌
flight.head()

flight.tail()

 

flight.head(10)

 

# 2.데이터프레임의 기본정보 확인하기(간단한 통계정보)
# flight.0000형태로 사용
# shape : row, column수 
# columns : column명
# info() : 컬럼명, 컬럼별 데이터 타입, 결측치 확인 가능
# describe() : 데이터 타입이 float이나 int인 자료의 통계(갯수, 평균, 표준편차, 최소값, 최대값, 4분위값) 확인 가능
# dtypes : 컬럼별 데이터 타입 확인 가능
# value_counts() : 지정된 컬럼의 값별로 나타나는 횟수를 확인
flight.shape

 

(300153, 12)

 

 

CH3.ipynb
0.03MB

반응형