반응형
나는 kaggle.com Titanic 데이터 세트 (타이타닉의 모든 사람에 대한 데이터)를 실험하고 있었고 다음과 같은 성별 분류를 생각해 냈습니다.
gender = df.sex.value_counts()
gender
male 577
female 314
타이타닉에서 각 성별의 비율을 알고 싶습니다.
내 접근 방식은 이상적이지 않습니다.
from __future__ import division
pcts = gender / gender.sum()
pcts
male 0.647587
female 0.352413
더 나은 (더 관용적 인) 방법이 있습니까?
감사!
해결 방법
이 함수는 실제로 value_counts ()에서도 pandas에서 구현됩니다. 계산할 필요가 없습니다. :)
그냥 입력 :
df.sex.value_counts(normalize=True)
정확히 원하는 출력을 제공합니다.
value_counts ()는 NA 값을 제외하므로 숫자의 합이 1이되지 않을 수 있습니다.
참조 페이지 https://stackoverflow.com/questions/14281871
반응형
'파이썬' 카테고리의 다른 글
파이썬 Python 캐싱 라이브러리가 있습니까? (0) | 2021.01.27 |
---|---|
파이썬 Python에 비트 필드 유형이 있습니까? (0) | 2021.01.27 |
파이썬 Windows 탐색기에서 Python 스크립트로 끌어서 놓기 (0) | 2021.01.27 |
파이썬에는 '스위치'와 동등한 기능이 있습니까? (0) | 2021.01.27 |
파이썬 문자열을 datetime.time 객체로 변환 (0) | 2021.01.27 |
댓글