본 자료는 [시나공 AI능력시험 AICE ASSOCIATE편] 책을 공부하면서 정리하는 내용임
import numpy as np
import pandas as pd
flight = pd.read_csv('./Clean_Dataset.csv')
# flight
# CH4
# Sec2. 필요데이터 변경하기
# 1. 데이터 추가하기
#새로운 칼럼 만들기
flight['price2'] = flight['price']*2
flight.head()

# 연산으로 새로운 칼럼 만들기
flight['price3']=flight['price2']+flight['price']
flight.head()

# 새로운 칼럼은 마지막 칼럼으로 생성됨
# insert 함수를 사용해 원하는 위치에 생성할 수있음
# df.insert(loc, column_name, value, allow_duplicates=False)
# -loc : 삽입될 열의 위치(10번째 열로 삽입), - column_name : 삽입될 열의 이름, -value : 삽입될 열의 값
# -allow_duplicates = {True or False} 중복열 삽입을 허용(True)할지 안할지(False) 선택, default는 False
flight.insert(10, 'duration2', flight['duration']*10)
flight.head()

https://link.coupang.com/a/bFpppC
COUPANG
쿠팡은 로켓배송
www.coupang.com
# 2.데이터 삭제하기
# axis = 1은 열 삭제, axis = 0는 행 삭제임
# drop 할 때 axis를 지정하지 않으면 오류 발생함
flight.drop('price3', axis = 1).head()

# 아래 코드를 실행하면 첫번째 행 데이터가 삭제됨
# 근데, price3는 다시 생겼네...
flight.drop(index = 0, axis = 0).head()

# 데이터 삭제 후 새로운 데이터프레임에 저장하기
flight1 = flight.drop('price3', axis = 1)
flight1.head()

# 새로운 데이터프레임에 저장하지 않고, 원래 데이터프레임에 반영하려면 inplace = True 속성을 사용하면 됨
flight.head()

flight.drop('price3', axis = 1, inplace = True)
flight.head()

# 3. 컬럼명 변경하기
# rename 메소드 활용
# 단순하고 직관적인 컬럼명 필요
flight = flight.rename(columns = {"airline" : 'airline_name', "source_city" : 'departure_city'})
flight.head()

# 4.데이터프레임 정렬하기
# sort_values 메소드와 ascending 매개변수를 지정하여 데이터프레임 정렬하기
# Unnamed: 0를 내림차순 정렬
# ascending = True로 하면 오름차순으로 정렬됨
flight = flight.sort_values(by = 'Unnamed: 0', ascending=False)
flight.head()

'Tech' 카테고리의 다른 글
Ch6. 데이터 전처리 - Sec1. 결측치, 이상치, 구간화 (0) | 2024.06.07 |
---|---|
Ch5. 데이터 지표화 및 시각화 (1) | 2024.06.07 |
Ch.4 기초데이터 다루기 / Sec1. 필요 데이터 선택하기 (0) | 2024.05.30 |
Ch3. 데이터구조 확인하기 (0) | 2024.05.30 |
워드 맞춤법 검사 빨간/파란 밑줄 안보이게 하기 (0) | 2023.09.19 |