본문 바로가기
파이썬

파이썬 Pandas read_csv에서 구분 기호 사용자 정의

by º기록 2020. 10. 25.
반응형

다양한 pandas 데이터 프레임으로 다양한 데이터 파일을 읽고 있습니다. 이러한 데이터 파일의 열은 공백으로 구분됩니다. 그러나 각 파일에 대해 공간 수가 다릅니다 (일부에는 하나의 공간 만 있고 다른 파일에는 두 개의 공간이있는 등). 따라서 파일을 가져올 때마다 수동으로 해당 파일로 이동하여 사용 된 공간 수를 확인하고 sep 에 많은 수의 공간을 제공해야합니다.

import pandas as pd
df = pd.read_csv('myfile.dat', sep = '    ')

pandas에게 구분자로 "모든 수의 공백"을 가정하도록 지시 할 수있는 방법이 있습니까? 또한 pandas에게 탭 ( \ t ) 또는 공백을 구분 기호로 사용하도록 지시 할 수있는 방법이 있습니까?

 

해결 방법

 

예, sep = '\ s +'와 같은 간단한 정규 표현식을 사용하여 하나 이상의 공백을 나타낼 수 있습니다.

 

참조 페이지 https://stackoverflow.com/questions/41235111

 

 

반응형

댓글