본문 바로가기
파이썬

파이썬 Python Pandas의 여러 열에서 모든 중복 행 삭제

by º기록 2020. 12. 14.
반응형

pandas drop_duplicates 함수는 데이터 프레임을 "고유 화"하는 데 적합합니다. 그러나 전달할 키워드 인수 중 하나는 take_last = True 또는 take_last = False 이지만 열 하위 집합에서 중복되는 모든 행을 삭제하고 싶습니다. 이게 가능해?

    A   B   C
0   foo 0   A
1   foo 1   A
2   foo 1   B
3   bar 1   A

예를 들어, A C 열에서 일치하는 행을 삭제하고 싶습니다. 따라서 행 0과 1을 삭제해야합니다.

 

해결 방법

 


import pandas as pd
df = pd.DataFrame({"A":["foo", "foo", "foo", "bar"], "B":[0,1,1,1], "C":["A","A","B","A"]})
df.drop_duplicates(subset=['A', 'C'], keep=False)

 

참조 페이지 https://stackoverflow.com/questions/23667369

 

 

반응형

댓글