728x90

05_Pandas 20

[Pandas]csv컬럼을 변경해 DB용 csv작성후 import

[Pandas]csv컬럼을 변경해 DB용 csv작성 01. csv파일 컬럼 수정import pandas as pddf = pd.read_csv("수요일_5점만_커버추가.csv")df.head(3) # 특정 컬럼만 추출df = df[["isbn", "title", "writer", "publisher", "genre", "description", "cover_url"]] # 컬럼명을 모델명에 맞게 수정df = df.rename(columns={'writer':'author'})df = df.rename(columns={'description':'book_explanation'})df = df.rename(columns={'cover_url':'cover_image'}) df.head(3) df = ..

05_Pandas 2025.06.12

현금영수증 내역 연도별로 합치기(국세청 홈텍스)

현금영수증 내역 연도별로 합치기(국세청 홈텍스)01. 국세청 홈텍스 페이지에 접속후 「계산서・영수증・카드」>「현금영수증(근로자・소비자)」>「 현금영수증(근로자・소비자)」 > 「 현금영수증 사용내역(소득공제) 조회」클릭https://hometax.go.kr/websquare/websquare.html?w2xPath=/ui/pp/index_pp.xml&menuCd=index4 국세청 홈택스 hometax.go.kr 02. 월별 조회기간을 선택 후 엑셀 내려받기를 클릭 03. 다운로드 후 파일 이름 말미에 아래와 같이 「년도+월」을 기재(결번이 있어도 무방) 04. 「03」파일들이 있는 경로에서 신규 Jupyter Notebook을 Open후 아래 코드를 작성import pandas as pdimpo..

05_Pandas 2025.05.06

07_서울교통공사_에스컬레이터 설치 정보(1~9호선)

서울교통공사 에스컬레이터 설치 정보 전처리 및 csv로 저장(1~8호선 정보 + 9호선 정보) import pandas as pd 01. 1~8호선 정보... # 첫 1행과 마지막 1행을 제외하고 엑셀파일을 읽어들임df = pd.read_excel("./data/서울교통공사_에스컬레이터 설치 정보(1-8호선).xlsx", header = 1, skipfooter = 1) df.head()  df.tail() df.columnsIndex(['연번\n(총괄정렬용)', '연번', '호선', '역명', '호기', '승강기번호', '설치위치', '운행구간(자체조사)', '운행방향'], dtype='object') # 호선 -> 노선명df.columns = ['연번\n(총괄정렬용)', '연번',..

05_Pandas 2025.03.27

06_서울교통공사_역사면적정보

서울교통공사 역사면적정보 전처리 및 csv로 저장 import pandas as pd df = pd.read_csv("./data/서울교통공사_역사면적정보_20250310.csv", encoding="euc-kr")# 위에서부터 10개의 데이터를 확인df.head(10) df.tail(10)  df.info()RangeIndex: 277 entries, 0 to 276Data columns (total 5 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 연번 277 non-null int64 1 호선 277 non-null int64 2 역명 277..

05_Pandas 2025.03.27

05-4_연습문제_Vaccine

import pandas as pd문제1. vaccine.csv 데이터를 데이터프레임으로 읽기 vc = pd.read_csv("./data/vaccine.csv")vc.head()  문제2. 데이터프레임에서 필요 없는 열을 삭제하기삭제할 열 : day1sum, day1rate, day2sum, day2ratevc = vc.drop(["day1sum", "day1rate", "day2sum", "day2rate"], axis = 1)vc.head()  문제3. 데이터프레임의 기초통계량을 확인하기vc.describe() 문제4. day1num과 day2num의 월별 평균을 출력하기vc.dtypesdate objectsubject int64day1num int64day2num ..

05_Pandas 2025.03.07

05-3_연습문제_Fictional_Army

import pandas as pd 문제1. 아래의 raw_data를 데이터프레임으로 변환하기raw_data = {'regiment': ['Nighthawks', 'Nighthawks', 'Nighthawks', 'Nighthawks', 'Dragoons', 'Dragoons', 'Dragoons', 'Dragoons', 'Scouts', 'Scouts', 'Scouts', 'Scouts'],            'company': ['1st', '1st', '2nd', '2nd', '1st', '1st', '2nd', '2nd','1st', '1st', '2nd', '2nd'],            'deaths': [523, 52, 25, 616, 43, 234, 523, 62, 62, 73, 37,..

05_Pandas 2025.03.06
728x90