반응형

pandas 2

(pandas)판다스 데이터프레임 기본조작(삽입, 삭제, 조회 등)

#python #pandas pandas DataFrame을 활용하다보면 조작을 해줘야 할 상황이 자주 생기는데 관련해서 말씀드리겠습니다. 1. 삽입 - 중간에 데이터프레임을 삽입하려면 concat을 사용하면 편리함 - a DataFrame 선언 - b DataFrame 선언 - a 중간에 b 삽입 - a2와 b2로 .copy() 한 이유는 원본을 건드리지 않기 위함 - ignore_index = True : 삽입하면서 index를 다시 설정하기 위함 2. 삭제(drop) - 열 drop (원본을 변경하려면 옵션에 "inplace=True" 설정 a.drop(['A'], axis=1) - drop할 열의 이름을 list로 저장한 후 삽입해주어도 됨 drop_cols = ['A', 'B', 'C'] a.d..

programming/python 2022.11.17

(pandas)파이썬 시간 데이터 보간(누락 데이터)

#pandas, python 아래와 같이 규칙적으로 데이터가 들어오다가 누락되는 상황이 발생하였을 때 보간처리를 하는 방식에 대해 말씀드리겠습니다. 전체흐름 : 시간의 차이 계산 - 새로운 데이터 프레임 생성 - 합치기 최종 코드는 맨 하단에 정리되어있습니다. 1. 세부사항 dif_time = _df['date'].iloc[_idx] - _df['date'].iloc[_idx - 1] - 이전의 시간과 현재의 시간의 차이를 계산하여 누락이 있는지 확인 if dif_time != pd.Timedelta(minutes=10): dif_count = dif_time / pd.Timedelta(minutes=10) - 1 - 차이가 있다면 얼마나 차이가 있는지 계산 _new_df = pd.DataFrame(co..

programming/python 2022.10.27
반응형