728x90

05_Pandas 17

07_서울교통공사_에스컬레이터 설치 정보(1~9호선)

서울교통공사 에스컬레이터 설치 정보 전처리 및 csv로 저장(1~8호선 정보 + 9호선 정보) import pandas as pd 01. 1~8호선 정보... # 첫 1행과 마지막 1행을 제외하고 엑셀파일을 읽어들임df = pd.read_excel("./data/서울교통공사_에스컬레이터 설치 정보(1-8호선).xlsx", header = 1, skipfooter = 1) df.head()  df.tail() df.columnsIndex(['연번\n(총괄정렬용)', '연번', '호선', '역명', '호기', '승강기번호', '설치위치', '운행구간(자체조사)', '운행방향'], dtype='object') # 호선 -> 노선명df.columns = ['연번\n(총괄정렬용)', '연번',..

05_Pandas 2025.03.27

06_서울교통공사_역사면적정보

서울교통공사 역사면적정보 전처리 및 csv로 저장 import pandas as pd df = pd.read_csv("./data/서울교통공사_역사면적정보_20250310.csv", encoding="euc-kr")# 위에서부터 10개의 데이터를 확인df.head(10) df.tail(10)  df.info()RangeIndex: 277 entries, 0 to 276Data columns (total 5 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 연번 277 non-null int64 1 호선 277 non-null int64 2 역명 277..

05_Pandas 2025.03.27

05-4_연습문제_Vaccine

import pandas as pd문제1. vaccine.csv 데이터를 데이터프레임으로 읽기 vc = pd.read_csv("./data/vaccine.csv")vc.head()  문제2. 데이터프레임에서 필요 없는 열을 삭제하기삭제할 열 : day1sum, day1rate, day2sum, day2ratevc = vc.drop(["day1sum", "day1rate", "day2sum", "day2rate"], axis = 1)vc.head()  문제3. 데이터프레임의 기초통계량을 확인하기vc.describe() 문제4. day1num과 day2num의 월별 평균을 출력하기vc.dtypesdate objectsubject int64day1num int64day2num ..

05_Pandas 2025.03.07

05-3_연습문제_Fictional_Army

import pandas as pd 문제1. 아래의 raw_data를 데이터프레임으로 변환하기raw_data = {'regiment': ['Nighthawks', 'Nighthawks', 'Nighthawks', 'Nighthawks', 'Dragoons', 'Dragoons', 'Dragoons', 'Dragoons', 'Scouts', 'Scouts', 'Scouts', 'Scouts'],            'company': ['1st', '1st', '2nd', '2nd', '1st', '1st', '2nd', '2nd','1st', '1st', '2nd', '2nd'],            'deaths': [523, 52, 25, 616, 43, 234, 523, 62, 62, 73, 37,..

05_Pandas 2025.03.06

05-1_연습문제_student_alchol_consumption

import pandas as pd문제1. student-mat.csv 데이터 읽어오기sm = pd.read_csv("./data/student-mat.csv")sm.head()   문제2. 데이터프레임의 school열부터 guardian열까지 추출# sm = sm.iloc[0:5, 0:12]# df.loc[행, 열]sm = sm.loc[:, "school":"guardian"]sm.head() sm = sm.iloc[:, :12]sm  문제3. 문자열 데이터를 입력 받고 capitalize() 메소드를 적용하는 capitalizer 함수 정의def capitalizer(chastr):    return chastr.capitalize()  문제4. Mjob과 Fjob열에 capitalizer 함수 적용..

05_Pandas 2025.03.06

05_데이터프레임 응용

데이터프레임 응용  01. 함수 매핑시리즈 또는 데이터프레임의 개별 원소를 특정 함수에 일대일 대응시키는 과정사용자가 직접 만든 함수를 적용할 수 있기 때문에 판다스 기본 함수로 처리하기 어려운 복잡한 연산을 적용하는 것이 가능 개별 원소에 함수 매핑시리즈 원소에 함수 매핑시리즈에 map() 을 적용하면 인자로 전달받는 매핑 함수에 시리즈의 모든 원소를 하나씩 입력하고 리턴값을 받음시리즈 원소의 개수만큼 리턴값을 받아서 같은 크기의 시리즈 객체로 변환 import pandas as pdimport seaborn as snstitanic = sns.load_dataset("titanic")df = titanic.loc[:, ["age", "fare"]]df["ten"] = 10df.head() # 10을 ..

05_Pandas 2025.03.06

04-1_연습문제_iris

import pandas as pdimport numpy as np문제1. 데이터프레임을 iris 변수로 읽기iris = pd.read_csv("./data/iris.csv")iris.head() 아래 코드를 실행해주세요iris.iloc[10:30,2:3] = np.nan #10행~30행, 2열~3열을 결측치로 만듦 문제2. 데이터프레임에 누락값이 있는지 확인iris.isnull().sum()SepalLength 0SepalWidth 0PetalLength 20PetalWidth 0Species 0dtype: int64  문제3. 결측치에 1 채워넣기iris = iris.fillna(1)iris.isna().sum() # 결측치가 사라져있는것을 확인SepalL..

05_Pandas 2025.03.06
728x90