본문 바로가기
파이썬

파이썬 텍스트 인코딩을 결정하는 방법은 무엇입니까?

by º기록 2020. 10. 21.
반응형


 

해결 방법

 

인코딩을 항상 올바르게 감지하는 것은 불가능합니다 .

(chardet FAQ에서 :)

그러나 일부 인코딩은 최적화되어 있습니다. for specific languages, and languages are not random. Some character sequences pop up all the time, while other sequences make no sense. A person fluent in English who opens a newspaper and finds “txzqJv 2!dasd0a QqdKjvz” will instantly recognize that that isn't English (even though it is composed entirely of English letters). By studying lots of “typical” text, a computer algorithm can simulate this kind of fluency and make an educated 텍스트의 언어를 추측합니다.




 

참조 페이지 https://stackoverflow.com/questions/436220

 

 

반응형

댓글