본문 바로가기
파이썬

파이썬 URL에서 이스케이프 된 문자 디코딩

by º기록 2020. 9. 25.
반응형

이스케이프 문자가있는 URL이 포함 된 목록이 있습니다. 이러한 문자는 html 페이지를 복구 할 때 urllib2.urlopen 에 의해 설정되었습니다.

http://www.sample1webpage.com/index.php?title=%E9%A6%96%E9%A1%B5&action=edit
http://www.sample1webpage.com/index.php?title=%E9%A6%96%E9%A1%B5&action=history
http://www.sample1webpage.com/index.php?title=%E9%A6%96%E9%A1%B5&variant=zh 

파이썬에서 이스케이프되지 않은 형태로 다시 변환하는 방법이 있습니까?

추신 : URL은 utf-8로 인코딩됩니다.

 

해결 방법

 


urllib.unquote ( 문자열 )

% xx 이스케이프를 해당하는 단일 문자로 바꿉니다.

예 : unquote ( '/ % 7Econnolly /') '/ ~ connolly /'를 생성합니다.

그리고 디코딩 만하면됩니다.

업데이트 : Python 3의 경우 다음을 작성합니다.

urllib.parse.unquote(url)


 

참조 페이지 https://stackoverflow.com/questions/8136788

 

 

반응형

댓글