본문 바로가기
파이썬

파이썬 값의 빈도를 나타내는 팬더 시리즈가 주어지면 이러한 빈도를 백분율로 어떻게 바꿀 수 있습니까?

by º기록 2021. 1. 27.
반응형

나는 kaggle.com Titanic 데이터 세트 (타이타닉의 모든 사람에 대한 데이터)를 실험하고 있었고 다음과 같은 성별 분류를 생각해 냈습니다.

gender = df.sex.value_counts()
gender

male   577
female 314 

타이타닉에서 각 성별의 비율을 알고 싶습니다.

내 접근 방식은 이상적이지 않습니다.

from __future__ import division
pcts = gender / gender.sum()
pcts

male      0.647587
female    0.352413

더 나은 (더 관용적 인) 방법이 있습니까?

감사!

 

해결 방법

 

이 함수는 실제로 value_counts ()에서도 pandas에서 구현됩니다. 계산할 필요가 없습니다. :)

그냥 입력 :

df.sex.value_counts(normalize=True)

정확히 원하는 출력을 제공합니다.

value_counts ()는 NA 값을 제외하므로 숫자의 합이 1이되지 않을 수 있습니다.


(DataFrame의 열은 시리즈입니다)

 

참조 페이지 https://stackoverflow.com/questions/14281871

 

 

반응형

댓글