파이썬 Python Pandas의 여러 열에서 모든 중복 행 삭제

pandas drop_duplicates 함수는 데이터 프레임을 "고유 화"하는 데 적합합니다. 그러나 전달할 키워드 인수 중 하나는 take_last = True 또는 take_last = False 이지만 열 하위 집합에서 중복되는 모든 행을 삭제하고 싶습니다. 이게 가능해?

    A   B   C
0   foo 0   A
1   foo 1   A
2   foo 1   B
3   bar 1   A

예를 들어, A 및 C 열에서 일치하는 행을 삭제하고 싶습니다. 따라서 행 0과 1을 삭제해야합니다.

해결 방법

import pandas as pd
df = pd.DataFrame({"A":["foo", "foo", "foo", "bar"], "B":[0,1,1,1], "C":["A","A","B","A"]})
df.drop_duplicates(subset=['A', 'C'], keep=False)

참조 페이지 https://stackoverflow.com/questions/23667369

'파이썬' 카테고리의 다른 글

파이썬 CSV 파일의 첫 줄 제거 (0)	2020.12.14
파이썬 목록에서 연속 된 정수 감지 (0)	2020.12.14
파이썬 Groupby를 기반으로 Pandas 데이터 프레임 분할 (0)	2020.12.14
파이썬 How to delete all blank lines in the file with the help of python? (0)	2020.12.14
파이썬 분산 데이터 세트를 사용하여 MatPlotLib에서 히트 맵 생성 (0)	2020.12.14

프로그램 샘플 소스

파이썬 Python Pandas의 여러 열에서 모든 중복 행 삭제

해결 방법

'파이썬' 카테고리의 다른 글

댓글

티스토리툴바

파이썬 Python Pandas의 여러 열에서 모든 중복 행 삭제

해결 방법

'파이썬' 카테고리의 다른 글

관련글

댓글

티스토리툴바