본문 바로가기
파이썬

파이썬 scikit-learn의 Imputer 모듈로 결 측값 예측

by º기록 2020. 12. 12.
반응형

scikit-learn의 Imputer 클래스를 사용하여 데이터 세트에서 누락 된 값을 예측하는 매우 기본적인 프로그램을 작성하고 있습니다.

NumPy 배열을 만들고, strategy = 'mean'으로 Imputer 개체를 만들고 NumPy 배열에서 fit_transform ()을 수행했습니다.

fit_transform ()을 수행 한 후 배열을 인쇄하면 'Nan'이 남아 있고 예측을 얻지 못합니다.

내가 여기서 뭘 잘못하고 있니? 누락 된 값을 예측하려면 어떻게해야합니까?

import numpy as np
from sklearn.preprocessing import Imputer

X = np.array([[23.56],[53.45],['NaN'],[44.44],[77.78],['NaN'],[234.44],[11.33],[79.87]])

print X

imp = Imputer(missing_values='NaN', strategy='mean', axis=0)
imp.fit_transform(X)

print X

 

해결 방법

 


X = imp.fit_transform(X)

 

참조 페이지 https://stackoverflow.com/questions/25017626

 

 

반응형

댓글