반응형
pandas
drop_duplicates
함수는 데이터 프레임을 "고유 화"하는 데 적합합니다. 그러나 전달할 키워드 인수 중 하나는 take_last = True
또는 take_last = False
이지만 열 하위 집합에서 중복되는 모든 행을 삭제하고 싶습니다. 이게 가능해?
A B C
0 foo 0 A
1 foo 1 A
2 foo 1 B
3 bar 1 A
예를 들어, A
및 C
열에서 일치하는 행을 삭제하고 싶습니다. 따라서 행 0과 1을 삭제해야합니다.
해결 방법
import pandas as pd
df = pd.DataFrame({"A":["foo", "foo", "foo", "bar"], "B":[0,1,1,1], "C":["A","A","B","A"]})
df.drop_duplicates(subset=['A', 'C'], keep=False)
참조 페이지 https://stackoverflow.com/questions/23667369
반응형
'파이썬' 카테고리의 다른 글
파이썬 CSV 파일의 첫 줄 제거 (0) | 2020.12.14 |
---|---|
파이썬 목록에서 연속 된 정수 감지 (0) | 2020.12.14 |
파이썬 Groupby를 기반으로 Pandas 데이터 프레임 분할 (0) | 2020.12.14 |
파이썬 How to delete all blank lines in the file with the help of python? (0) | 2020.12.14 |
파이썬 분산 데이터 세트를 사용하여 MatPlotLib에서 히트 맵 생성 (0) | 2020.12.14 |
댓글