본문 바로가기
파이썬

파이썬 csv 데이터 파일을 scikit-learn으로 가져 오는 방법은 무엇입니까?

by º기록 2021. 2. 14.
반응형

내 이해에서 scikit-learn은 2D 배열 인 (n-sample, n-feature) 형식의 데이터를받습니다. 형식의 데이터가 있다고 가정하면 ...

Stock prices    indicator1    indicator2
2.0             123           1252
1.0             ..            ..
..              .             . 
.

이것을 어떻게 가져 옵니까?

 

해결 방법

 

이것은 CSV 파일이 아닙니다. 이것은 단지 공백으로 분리 된 파일입니다. 누락 된 값이 없다고 가정하면 다음을 사용하여 data 라는 Numpy 배열에 쉽게로드 할 수 있습니다.

import numpy as np

f = open("filename.txt")
f.readline()  # skip the header
data = np.loadtxt(f)

주가가 예측하려는 값인 경우 (scikit-learn 용어로 y 값) 다음을 사용하여 데이터 를 분할해야합니다.

X = data[:, 1:]  # select columns 1 through end
y = data[:, 0]   # select column 0, the stock price


 

참조 페이지 https://stackoverflow.com/questions/11023411

 

 

반응형

댓글