반응형
scikit-learn의 Imputer 클래스를 사용하여 데이터 세트에서 누락 된 값을 예측하는 매우 기본적인 프로그램을 작성하고 있습니다.
NumPy 배열을 만들고, strategy = 'mean'으로 Imputer 개체를 만들고 NumPy 배열에서 fit_transform ()을 수행했습니다.
fit_transform ()을 수행 한 후 배열을 인쇄하면 'Nan'이 남아 있고 예측을 얻지 못합니다.
내가 여기서 뭘 잘못하고 있니? 누락 된 값을 예측하려면 어떻게해야합니까?
import numpy as np
from sklearn.preprocessing import Imputer
X = np.array([[23.56],[53.45],['NaN'],[44.44],[77.78],['NaN'],[234.44],[11.33],[79.87]])
print X
imp = Imputer(missing_values='NaN', strategy='mean', axis=0)
imp.fit_transform(X)
print X
해결 방법
X = imp.fit_transform(X)
참조 페이지 https://stackoverflow.com/questions/25017626
반응형
'파이썬' 카테고리의 다른 글
파이썬 목록에서 모든 값을 파이썬 적으로 산출하는 방법은 무엇입니까? (0) | 2020.12.12 |
---|---|
파이썬 Python 인터프리터에 코드 복사 및 붙여 넣기 (0) | 2020.12.12 |
파이썬 화면 출력을 텍스트 파일에 저장하는 방법 (0) | 2020.12.12 |
파이썬 Python Regex-일치 항목의 위치와 값을 얻는 방법 (0) | 2020.12.12 |
파이썬 플라스크 값 오류보기 기능이 응답을 반환하지 않았습니다. (0) | 2020.12.12 |
댓글