본문 바로가기
파이썬

파이썬 urllib.request.urlopen ()에서 응답 인코딩을 처리하는 방법

by º기록 2020. 10. 11.
반응형

정규 표현식을 사용하여 웹 페이지를 검색하려고하는데 다음과 같은 오류가 발생합니다.

TypeError : 바이트 열류 객체에 문자열 패턴을 사용할 수 없습니다.

urllib.request.urlopen ()이 바이트 스트림을 반환하는 이유를 이해하므로 적어도 사용할 인코딩을 알지 못합니다. 이 상황에서 어떻게해야합니까? urlrequest에서 인코딩 방법을 지정하는 방법이 있습니까? 아니면 문자열을 직접 다시 인코딩해야합니까? 그렇다면 내가 무엇을하려고하는지, 헤더 정보에서 인코딩을 읽거나 html에 지정된 경우 인코딩 유형을 읽은 다음 다시 인코딩해야한다고 가정합니다.

 

해결 방법

 


output = response.decode('utf-8')

 

참조 페이지 https://stackoverflow.com/questions/4981977

 

 

반응형

댓글