본문 바로가기
파이썬

파이썬 json 파일을 pandas 데이터 프레임으로 읽으시겠습니까?

by º기록 2020. 10. 13.
반응형

python 3.6을 사용하고 있으며 아래 코드를 사용하여 json 파일 (350MB)을 pandas 데이터 프레임으로 다운로드하려고합니다. 그러나 다음과 같은 오류가 발생합니다.

data_json_str = "[" + ",".join(data) + "]
"TypeError: sequence item 0: expected str instance, bytes found

오류를 어떻게 수정할 수 있습니까?

import pandas as pd

# read the entire file into a python array
with open('C:/Users/Alberto/nutrients.json', 'rb') as f:
   data = f.readlines()

# remove the trailing "\n" from each line
data = map(lambda x: x.rstrip(), data)

# each element of 'data' is an individual JSON object.
# i want to convert it into an *array* of JSON objects
# which, in and of itself, is one large JSON object
# basically... add square brackets to the beginning
# and end, and have all the individual business JSON objects
# separated by a comma
data_json_str = "[" + ",".join(data) + "]"

# now, load it into pandas
data_df = pd.read_json(data_json_str)

 

해결 방법

 

바이너리 ( 'rb')로 파일을 열면 바이트를 얻게됩니다. 어때 :

with open('C:/Users/Alberto/nutrients.json', 'rU') as f:


df = pd.read_json('C:/Users/Alberto/nutrients.json', lines=True)

 

참조 페이지 https://stackoverflow.com/questions/48614158

 

 

반응형

댓글