반응형

본 자료는 [시나공 AI능력시험 AICE ASSOCIATE편] 책을 공부하면서 정리하는 내용임
 
import numpy as np
import pandas as pd
flight = pd.read_csv('./Clean_Dataset.csv')
# flight


# CH4
# Sec2. 필요데이터 변경하기
# 1. 데이터 추가하기

#새로운 칼럼 만들기
flight['price2'] = flight['price']*2
flight.head()

 
# 연산으로 새로운 칼럼 만들기
flight['price3']=flight['price2']+flight['price']
flight.head()

 
 
# 새로운 칼럼은 마지막 칼럼으로 생성됨
# insert 함수를 사용해 원하는 위치에 생성할 수있음

# df.insert(loc, column_name, value, allow_duplicates=False)
# -loc : 삽입될 열의 위치(10번째 열로 삽입), - column_name : 삽입될 열의 이름, -value : 삽입될 열의 값
# -allow_duplicates = {True or False} 중복열 삽입을 허용(True)할지 안할지(False) 선택, default는 False
 
flight.insert(10, 'duration2', flight['duration']*10)
flight.head()

 https://link.coupang.com/a/bFpppC

COUPANG

쿠팡은 로켓배송

www.coupang.com


# 2.데이터 삭제하기
# axis = 1은 열 삭제, axis = 0는 행 삭제임
# drop 할 때 axis를 지정하지 않으면 오류 발생함

flight.drop('price3', axis = 1).head()

 
# 아래 코드를 실행하면 첫번째 행 데이터가 삭제됨
# 근데, price3는 다시 생겼네...
flight.drop(index = 0, axis = 0).head()

 
# 데이터 삭제 후 새로운 데이터프레임에 저장하기

flight1 = flight.drop('price3', axis = 1)
flight1.head()

 
# 새로운 데이터프레임에 저장하지 않고, 원래 데이터프레임에 반영하려면 inplace = True 속성을 사용하면 됨
flight.head()

 
flight.drop('price3', axis = 1, inplace = True)
flight.head()

 
 
# 3. 컬럼명 변경하기
# rename 메소드 활용
# 단순하고 직관적인 컬럼명 필요

flight = flight.rename(columns = {"airline" : 'airline_name', "source_city" : 'departure_city'})
flight.head()

 
 
 
# 4.데이터프레임 정렬하기
# sort_values 메소드와 ascending 매개변수를 지정하여 데이터프레임 정렬하기
# Unnamed: 0를 내림차순 정렬
# ascending = True로 하면 오름차순으로 정렬됨

flight = flight.sort_values(by = 'Unnamed: 0', ascending=False)
flight.head()

 
 

Ch4_Sec2.ipynb
0.06MB

+ Recent posts