반응형
import pandas as pd
df = pd.read_csv('https://query.data.world/s/Hfu_PsEuD1Z_yJHmGaxWTxvkz7W_b0')
percent= 100*(len(df.loc[:,df.isnull().sum(axis=0)>=1 ].index) / len(df.index))
print(round(percent,2))
출력은
Ord_id 0.00
Prod_id 0.00
Ship_id 0.00
Cust_id 0.00
Sales 0.24
Discount 0.65
Order_Quantity 0.65
Profit 0.65
Shipping_Cost 0.65
Product_Base_Margin 1.30
dtype: float64
해결 방법
이건 어때요? 예전에 여기에서 비슷한 것을 발견 한 것 같은데 지금은 안보이네요 ...
percent_missing = df.isnull().sum() * 100 / len(df)
missing_value_df = pd.DataFrame({'column_name': df.columns,
'percent_missing': percent_missing})
누락 된 백분율을 정렬하려면 위의 내용을 따르십시오.
missing_value_df.sort_values('percent_missing', inplace=True)
주석에서 언급했듯이 위의 코드에서 첫 번째 줄만 사용할 수도 있습니다.
percent_missing = df.isnull().sum() * 100 / len(df)
참조 페이지 https://stackoverflow.com/questions/51070985
반응형
'파이썬' 카테고리의 다른 글
파이썬 Python3.6 오류 : ModuleNotFoundError : 'src'라는 모듈이 없습니다. (0) | 2020.10.10 |
---|---|
파이썬에서 dict의 딥 카피 (0) | 2020.10.10 |
파이썬 Python 3.7 용 Windows 10에 pip로 numpy 설치 (0) | 2020.10.10 |
파이썬 인스턴스의 클래스 이름을 얻습니까? (0) | 2020.10.10 |
파이썬 'numpy.ndarray'개체에 'index'속성이 없습니다. (0) | 2020.10.10 |
댓글