programming/python
(pandas)판다스 데이터프레임 기본조작(삽입, 삭제, 조회 등)
limmmmm
2022. 11. 17. 14:32
반응형
반응형
#python
#pandas
pandas DataFrame을 활용하다보면 조작을 해줘야 할 상황이 자주 생기는데 관련해서 말씀드리겠습니다.
1. 삽입
- 중간에 데이터프레임을 삽입하려면 concat을 사용하면 편리함
- a DataFrame 선언
- b DataFrame 선언
- a 중간에 b 삽입
- a2와 b2로 .copy() 한 이유는 원본을 건드리지 않기 위함
- ignore_index = True : 삽입하면서 index를 다시 설정하기 위함
2. 삭제(drop)
- 열 drop (원본을 변경하려면 옵션에 "inplace=True" 설정
a.drop(['A'], axis=1)
- drop할 열의 이름을 list로 저장한 후 삽입해주어도 됨
drop_cols = ['A', 'B', 'C']
a.drop(drop_cols, axis=1, inplace=True)
- 행 drop
drop_idx = a[a['TEST'>3].index
a.drop(drop_idx, axis=0, inplace=True)
- 조건을 조회한 후 index를 추출 한 뒤 drop 진행
- 다중 조건을 하려면 & 또는 | 연산자를 사용해주면 됨
drop_idx = a[(a['A']>3)&(a['B']<10)]
a.drop(drop_idx, axis=0, inplace=True)
3. 조회
- loc을 사용한 조회
- 만약 인덱스를 통해 조회를 하려면 loc을 사용해야함
show_idx = [1, 3, 4, 7, 11, 13]
a.loc[show_idx]
- 조건을 사용한 조회
- 만약 값을 찾고싶을 때 조회하는 방법은 삭제부분에 설명하긴 했지만 다시
a[(a['A'] < 3) & (a['B'] > 11) | (a['C'] == 0)]
- max값을 갖는 index 조회
- 이런식으로 응용도 가능합니다.
* 조회 또는 조작한 후 사용하시려면 index를 초기화해준 후 사용해주어야 원활하게 사용할 수 있습니다
a.reset_index(drop=True, inplace=True)
감사합니다.
반응형