반응형
python 3.6을 사용하고 있으며 아래 코드를 사용하여 json 파일 (350MB)을 pandas 데이터 프레임으로 다운로드하려고합니다. 그러나 다음과 같은 오류가 발생합니다.
data_json_str = "[" + ",".join(data) + "] "TypeError: sequence item 0: expected str instance, bytes found
오류를 어떻게 수정할 수 있습니까?
import pandas as pd
# read the entire file into a python array
with open('C:/Users/Alberto/nutrients.json', 'rb') as f:
data = f.readlines()
# remove the trailing "\n" from each line
data = map(lambda x: x.rstrip(), data)
# each element of 'data' is an individual JSON object.
# i want to convert it into an *array* of JSON objects
# which, in and of itself, is one large JSON object
# basically... add square brackets to the beginning
# and end, and have all the individual business JSON objects
# separated by a comma
data_json_str = "[" + ",".join(data) + "]"
# now, load it into pandas
data_df = pd.read_json(data_json_str)
해결 방법
바이너리 ( 'rb'
)로 파일을 열면 바이트를 얻게됩니다. 어때 :
with open('C:/Users/Alberto/nutrients.json', 'rU') as f:
df = pd.read_json('C:/Users/Alberto/nutrients.json', lines=True)
참조 페이지 https://stackoverflow.com/questions/48614158
반응형
'파이썬' 카테고리의 다른 글
파이썬 Pandas는 열의 가장 빈번한 값을 얻습니다. (0) | 2020.10.13 |
---|---|
파이썬 include ()에서 네임 스페이스를 사용할 때 app_name에 대한 ImproperlyConfiguredError (0) | 2020.10.13 |
파이썬 Windows 7에서 pywin32 모듈을 설치하는 방법 (0) | 2020.10.13 |
파이썬을 사용하여 일곱 번째 줄에서 시작하는 파일을 읽는 방법은 무엇입니까? (0) | 2020.10.13 |
파이썬에서 IOError 잡기 (0) | 2020.10.13 |
댓글