import pandas as pd # df, test 는 예시 dataframe 이름입니다. 특정 목록만 출력 df.columns # 칼럼명(필드)목록 출력 df.index # 인덱스(레코드)목록 출력 df.dtypes # 칼럼 타입 출력 df.values # 인덱스를 제외한 나머지 칼럼들의 값 df.칼럼명 # 해당 칼럼 출력 df['칼럼명'] # 칼럼을 출력하는 같은 명령어 목록을 리스트타입(list)으로 바꾸기 df.columns.tolist() # 필드명 리스트 df.values.tolist() # 전체 값 리스트(2차원 리스트로 출력) df.칼럼명.tolist() # 특정 칼럼만 리스트로 출력 df.index.tolist() # 인덱스 -> 리스트로 출력 (전체 인덱스)날짜 포맷으로 변환하기 df.index.strftime('%Y-%m-%d').tolist() 날짜 포맷 데이터 pd.datetime(2018,1,6) 날짜 계산하기 pd.datetime(2018,1,6)-pd.DateOffset(90) # 90일전 날짜 계산 (인덱스)특정 연도조건에 해당하는 항목 출력 df[df.index.year >= 2016] df[df.index.year == 2016] (인덱스) 특정 연도 범위주기 test[pd.datetime(2018,1,1):pd.datetime(2018,1,6)] test[test.index <= pd.datetime(2018,1,6)] test.loc[pd.datetime(2018,1,1):pd.datetime(2018,1,6)] null(NaN) 값 처리 df.y.fillna('null') # y 는 필드이름 소수점 반올림 df.yhat.round(2) # yhat은 필드이름
데이터 프레임 합치기 (칼럼 복사하기)
data1 = pd.DataFrame({'ds':forecast.ds, 'yhat':forecast.yhat}) data1 = data1.set_index('ds') # 인덱스 셋팅해주기 다른방법 new_data = data1.join(data2)