본문 바로가기
파이썬

파이썬 주어진 데이터 세트의 각 열에서 누락 된 값의 비율을 확인합니다.

by º기록 2020. 10. 10.
반응형
import pandas as pd
df = pd.read_csv('https://query.data.world/s/Hfu_PsEuD1Z_yJHmGaxWTxvkz7W_b0')
percent= 100*(len(df.loc[:,df.isnull().sum(axis=0)>=1 ].index) / len(df.index))
print(round(percent,2))


출력은

Ord_id                 0.00
Prod_id                0.00
Ship_id                0.00
Cust_id                0.00
Sales                  0.24
Discount               0.65
Order_Quantity         0.65
Profit                 0.65
Shipping_Cost          0.65
Product_Base_Margin    1.30
dtype: float64

 

해결 방법

 

이건 어때요? 예전에 여기에서 비슷한 것을 발견 한 것 같은데 지금은 안보이네요 ...

percent_missing = df.isnull().sum() * 100 / len(df)
missing_value_df = pd.DataFrame({'column_name': df.columns,
                                 'percent_missing': percent_missing})

누락 된 백분율을 정렬하려면 위의 내용을 따르십시오.

missing_value_df.sort_values('percent_missing', inplace=True)

주석에서 언급했듯이 위의 코드에서 첫 번째 줄만 사용할 수도 있습니다.

percent_missing = df.isnull().sum() * 100 / len(df)

 

참조 페이지 https://stackoverflow.com/questions/51070985

 

 

반응형

댓글