본문 바로가기
파이썬

파이썬 Python을 사용하여 CSV에서 비표준 미국 영어 문자 및 기호 처리

by º기록 2021. 2. 5.
반응형

나는 수천 개의 이름으로 된 상점 이름 목록을 가지고 있는데, 그중 일부는 문제를 일으키는 비표준 미국 영어 문자가 있습니다.

예를 들어, 내 입력 파일은 다음과 같습니다.

store_name
yéché
Ázak
ótndle

출력 파일이 실제로 다음과 같이 보이기를 원합니다 (Googledocs가 이것을 실현했다고 생각합니다, btw).

store_name  new_store_name 
yéché       yéché
Ázak        Ãzak
ótndle      ótndle 

표준이 아닌 미국 영어 문자를이 형식으로 변환하는 규칙은 약 10 개 정도 밖에 없기 때문에이를 수행하기 위해 Excel에서 f를 제어했습니다. 그러나 나는 미래에 이와 같은 것을 계산적으로 할 수 있기를 원하며 파이썬을 사용하여 이것을 빠르게 할 수있는 방법이 있는지 궁금합니다. 명확하게 말하면 내가하고 싶은 것은 다음과 같습니다.

é become é
Á become Ãi

 

해결 방법

 


print a
péché
Álak
óundle

print a.decode('latin9').encode('utf8'),
péché
Ãlak
óundle

나는 반대로해야했다 ...

 

참조 페이지 https://stackoverflow.com/questions/12357261

 

 

반응형

댓글