반응형
내 이해에서 scikit-learn은 2D 배열 인 (n-sample, n-feature) 형식의 데이터를받습니다. 형식의 데이터가 있다고 가정하면 ...
Stock prices indicator1 indicator2
2.0 123 1252
1.0 .. ..
.. . .
.
이것을 어떻게 가져 옵니까?
해결 방법
이것은 CSV 파일이 아닙니다. 이것은 단지 공백으로 분리 된 파일입니다. 누락 된 값이 없다고 가정하면 다음을 사용하여 data code>라는 Numpy 배열에 쉽게로드 할 수 있습니다.
import numpy as np
f = open("filename.txt")
f.readline() # skip the header
data = np.loadtxt(f)
주가가 예측하려는 값인 경우 (scikit-learn 용어로 y
값) 다음을 사용하여 데이터
를 분할해야합니다.
X = data[:, 1:] # select columns 1 through end
y = data[:, 0] # select column 0, the stock price
참조 페이지 https://stackoverflow.com/questions/11023411
반응형
'파이썬' 카테고리의 다른 글
파이썬 How do I check if a string only contains alphanumeric characters and dashes? (0) | 2021.02.14 |
---|---|
파이썬 .so 파일에서 파이썬 모듈을 가져 오는 방법은 무엇입니까? (0) | 2021.02.14 |
파이썬 클래스 변수는 파이썬의 모든 인스턴스에서 공유됩니까? (0) | 2021.02.14 |
파이썬 PIL을 사용하여 픽셀의 RGB 얻기 (0) | 2021.02.14 |
파이썬 Python에서 일련의 숫자 생성 (0) | 2021.02.14 |
댓글