반응형

본 자료는 [시나공 AI능력시험 AICE ASSOCIATE편] 책을 공부하면서 정리하는 내용임

 

# Ch4. 기초데이터 다루기
# Sec1. 필요데이터 선택하기
# 1. 칼럼명으로 데이터 선택하기 
# 칼럼이 많은 경우 특정 칼럼명으로 데이터 선택 가능

import numpy as np
import pandas as pd
flight = pd.read_csv('./Clean_Dataset.csv')

flight[['departure_time']]

# 여러개의 컬럼명으로도 불러올 수 있음
flight[['airline','departure_time','source_city']]

# 2.행 범위를 지정하여 데이터 선택하기
# [시작:끝] 형태로 사용, 끝 범위는 포함되지 않음
flight[10:21]

 

# 3. 특정 행/열 범위를 지정하여 데이터 선택하기
# loc은 인덱스 기준이고, iloc은 행 기준임
# 실습을 위해 기존 flight 데이터프레임의 인덱스 번호를 변경
flight.index = np.arange(100, 300253)
flight

 

flight.loc[[102, 202, 302]] # loc은 인덱스 번호 기준

 

flight.iloc[[102,202,302]] #iloc은 행 기준

 

# 열 이름으로 선택할수 있음, loc에서만 가능함
flight.loc[[102,202,302],['airline','flight']]

# 컬럼 순서로 선택할 수 있는데, iloc에서만 가능함
flight.iloc[[102,202,302],[1,2]]

 

# 4.조건으로 데이터 선택하기
# 조건:: price가 12000 이상이고, airline이 Air_India인 항목만 추출

flight_extract=flight[(flight['price'] > 12000) & (flight['airline'] == 'Air_India')]
flight_extract.head()

# flight[(flight['price'] > 12000) & (flight['airline'] == 'Air_India')].head()

 

# 조건을 변수로 지정해서도 추출 가능

price_tag = flight['price'] > 12000
airline_tag = flight['airline'] == 'Air_India'

flight_extract2 = flight[price_tag & airline_tag]
flight_extract2.head()

Ch4_Sec1.ipynb
0.05MB

반응형

+ Recent posts