반응형
해결 방법
인코딩을 항상 올바르게 감지하는 것은 불가능합니다 .
(chardet FAQ에서 :)
그러나 일부 인코딩은 최적화되어 있습니다. for specific languages, and languages are not random. Some character sequences pop up all the time, while other sequences make no sense. A person fluent in English who opens a newspaper and finds “txzqJv 2!dasd0a QqdKjvz” will instantly recognize that that isn't English (even though it is composed entirely of English letters). By studying lots of “typical” text, a computer algorithm can simulate this kind of fluency and make an educated 텍스트의 언어를 추측합니다.
참조 페이지 https://stackoverflow.com/questions/436220
반응형
'파이썬' 카테고리의 다른 글
파이썬 Python Pandas는 행을 반복하고 열 이름에 액세스합니다. (0) | 2020.10.21 |
---|---|
파이썬 Ubuntu16.04에 python3.6-dev를 설치할 수없는 이유 (0) | 2020.10.21 |
파이썬 __getitem__ 메서드 이해 (0) | 2020.10.21 |
파이썬 BeautifulSoup : 중첩 된 <ul>을 포함하는 <ul> 목록에서 모든 <li>를 어떻게 추출합니까? (0) | 2020.10.21 |
파이썬 try / catch를 사용하지 않고 int 값이 Python Enum에 있는지 어떻게 테스트합니까? (0) | 2020.10.21 |
댓글