본문 바로가기
파이썬

파이썬 Python에서 HTML을 이스케이프하는 가장 쉬운 방법은 무엇입니까?

by º기록 2021. 2. 17.
반응형

cgi.escape는 하나의 가능한 선택처럼 보입니다. 잘 작동합니까? 더 나은 것으로 간주되는 것이 있습니까?

 

해결 방법

 


모든 HTML에 충분합니다.

편집 : 비 ASCII 문자가있는 경우 Craig 와 같이 다른 인코딩을 사용하는 다른 인코딩 된 문서에 포함하기 위해 이스케이프하려는 경우 다음을 사용하십시오.

data.encode('ascii', 'xmlcharrefreplace')

먼저 인코딩 된 인코딩을 사용하여 data unicode 로 디코딩하는 것을 잊지 마십시오.

그러나 내 경험상 처음부터 항상 unicode 로 작업하는 경우 이러한 종류의 인코딩은 쓸모가 없습니다. 문서 헤더 (최대 호환성을 위해 utf-8 )에 지정된 인코딩으로 끝 부분을 인코딩하면됩니다.

예:

>>> cgi.escape(u'<a>bá</a>').encode('ascii', 'xmlcharrefreplace')
'&lt;a&gt;b&#225;&lt;/a&gt;

또한 주목할 가치가 있습니다 (Greg에게 감사함). 추가 quote 매개 변수 cgi.escape 가 차지합니다. True 로 설정하면 cgi.escape 는 큰 따옴표 문자 ( ")도 이스케이프하므로 결과 값을 XML / HTML로 사용할 수 있습니다. 속성.


 

참조 페이지 https://stackoverflow.com/questions/1061697

 

 

반응형

댓글