반응형
스프레드 시트의 텍스트 덤프를 구문 분석해야합니다. 데이터의 각 줄을 올바르게 구문 분석하는 정규식이 있지만 다소 깁니다. 기본적으로 특정 패턴과 12 번 또는 13 번 일치합니다.
반복하고 싶은 패턴은
\s+(\w*\.*\w*);
이것은 정규 표현식 (축약)입니다.
^\s+(\w*\.*\w*);\s+(\w*\.*\w*);\s+(\w*\.*\w*);\s+(\w*\.*\w*);\s+(\w*\.*\w*);\s+(\w*\.*\w*);
이렇게 복사 붙여 넣기없이 패턴을 정해진 횟수만큼 일치시키는 방법이 있습니까? 각 섹션은 필요한 데이터 열에 해당합니다. 그런데 저는 파이썬을 사용하고 있습니다. 감사!
해결 방법
사용 방법 :
(\s+(\w*\.*\w*);)*
findall
메소드를 아직 찾으셨습니까? 아니면 ;
에서 분할을 고려 하시겠습니까?
map(lambda x: x.strip(), s.split(";"))
아마도 정말 원하는 것입니다.
참조 페이지 https://stackoverflow.com/questions/8843410
반응형
'파이썬' 카테고리의 다른 글
파이썬 matplotlib의 히스토그램 데이터에서 선 그래프 플로팅 (0) | 2020.09.20 |
---|---|
파이썬 Python Selenium WebDriver 드래그 앤 드롭 (0) | 2020.09.20 |
파이썬 zip 파일에 포함 된 파일 목록 가져 오기 (0) | 2020.09.20 |
파이썬 Error importing a .pyd file (as a python module) from a .pyo file (0) | 2020.09.20 |
파이썬 인덱스로 문자열에서 문자를 얻는 방법? (0) | 2020.09.20 |
댓글