본문 바로가기
파이썬

파이썬 정규식의 섹션을 반복합니까?

by º기록 2020. 9. 20.
반응형

스프레드 시트의 텍스트 덤프를 구문 분석해야합니다. 데이터의 각 줄을 올바르게 구문 분석하는 정규식이 있지만 다소 깁니다. 기본적으로 특정 패턴과 12 번 또는 13 번 일치합니다.

반복하고 싶은 패턴은

\s+(\w*\.*\w*);

이것은 정규 표현식 (축약)입니다.

^\s+(\w*\.*\w*);\s+(\w*\.*\w*);\s+(\w*\.*\w*);\s+(\w*\.*\w*);\s+(\w*\.*\w*);\s+(\w*\.*\w*);

이렇게 복사 붙여 넣기없이 패턴을 정해진 횟수만큼 일치시키는 방법이 있습니까? 각 섹션은 필요한 데이터 열에 해당합니다. 그런데 저는 파이썬을 사용하고 있습니다. 감사!

 

해결 방법

 

사용 방법 :

(\s+(\w*\.*\w*);)*

findall 메소드를 아직 찾으셨습니까? 아니면 ; 에서 분할을 고려 하시겠습니까?

map(lambda x: x.strip(), s.split(";"))

아마도 정말 원하는 것입니다.

 

참조 페이지 https://stackoverflow.com/questions/8843410

 

 

반응형

댓글