본 자료는 [시나공 AI능력시험 AICE ASSOCIATE편] 책을 공부하면서 정리하는 내용임
# Ch4. 기초데이터 다루기
# Sec1. 필요데이터 선택하기
# 1. 칼럼명으로 데이터 선택하기
# 칼럼이 많은 경우 특정 칼럼명으로 데이터 선택 가능
import numpy as np
import pandas as pd
flight = pd.read_csv('./Clean_Dataset.csv')
flight[['departure_time']]
# 여러개의 컬럼명으로도 불러올 수 있음
flight[['airline','departure_time','source_city']]
# 2.행 범위를 지정하여 데이터 선택하기
# [시작:끝] 형태로 사용, 끝 범위는 포함되지 않음
flight[10:21]
# 3. 특정 행/열 범위를 지정하여 데이터 선택하기
# loc은 인덱스 기준이고, iloc은 행 기준임
# 실습을 위해 기존 flight 데이터프레임의 인덱스 번호를 변경
flight.index = np.arange(100, 300253)
flight
flight.loc[[102, 202, 302]] # loc은 인덱스 번호 기준
flight.iloc[[102,202,302]] #iloc은 행 기준
# 열 이름으로 선택할수 있음, loc에서만 가능함
flight.loc[[102,202,302],['airline','flight']]
# 컬럼 순서로 선택할 수 있는데, iloc에서만 가능함
flight.iloc[[102,202,302],[1,2]]
# 4.조건으로 데이터 선택하기
# 조건:: price가 12000 이상이고, airline이 Air_India인 항목만 추출
flight_extract=flight[(flight['price'] > 12000) & (flight['airline'] == 'Air_India')]
flight_extract.head()
# flight[(flight['price'] > 12000) & (flight['airline'] == 'Air_India')].head()
# 조건을 변수로 지정해서도 추출 가능
price_tag = flight['price'] > 12000
airline_tag = flight['airline'] == 'Air_India'
flight_extract2 = flight[price_tag & airline_tag]
flight_extract2.head()
'Tech' 카테고리의 다른 글
Ch5. 데이터 지표화 및 시각화 (1) | 2024.06.07 |
---|---|
Ch.4 기초데이터 다루기 / Sec2. 필요데이터 변경하기 (0) | 2024.06.01 |
Ch3. 데이터구조 확인하기 (0) | 2024.05.30 |
워드 맞춤법 검사 빨간/파란 밑줄 안보이게 하기 (0) | 2023.09.19 |
내 노트북 세팅 상태 (0) | 2023.02.15 |