본문 바로가기
파이썬

파이썬 Pandas는 문자열에서 숫자를 추출합니다.

by º기록 2020. 11. 3.
반응형

다음 데이터 프레임이 주어지면 :

import pandas as pd
import numpy as np
df = pd.DataFrame({'A':['1a',np.nan,'10a','100b','0b'],
                   })
df

    A
0   1a
1   NaN
2   10a
3   100b
4   0b

각 셀 (존재하는 곳)에서 숫자를 추출하고 싶습니다. 원하는 결과는 다음과 같습니다.

    A
0   1
1   NaN
2   10
3   100
4   0

str.extract 로 할 수 있다는 것을 알고 있지만 어떻게해야할지 모르겠습니다.

 

해결 방법

 

정규식 캡처 그룹을 지정하십시오.

df.A.str.extract('(\d+)')

제공합니다 :

0      1
1    NaN
2     10
3    100
4      0
Name: A, dtype: object

 

참조 페이지 https://stackoverflow.com/questions/37683558

 

 

반응형

댓글