반응형
다음 데이터 프레임이 주어지면 :
import pandas as pd
import numpy as np
df = pd.DataFrame({'A':['1a',np.nan,'10a','100b','0b'],
})
df
A
0 1a
1 NaN
2 10a
3 100b
4 0b
각 셀 (존재하는 곳)에서 숫자를 추출하고 싶습니다. 원하는 결과는 다음과 같습니다.
A
0 1
1 NaN
2 10
3 100
4 0
str.extract
로 할 수 있다는 것을 알고 있지만 어떻게해야할지 모르겠습니다.
해결 방법
정규식 캡처 그룹을 지정하십시오.
df.A.str.extract('(\d+)')
제공합니다 :
0 1
1 NaN
2 10
3 100
4 0
Name: A, dtype: object
참조 페이지 https://stackoverflow.com/questions/37683558
반응형
'파이썬' 카테고리의 다른 글
파이썬 'double_scalars에서 잘못된 값이 발견되었습니다'경고, 아마도 numpy (0) | 2020.11.03 |
---|---|
파이썬 What is the difference between 'SAME' and 'VALID' padding in tf.nn.max_pool of tensorflow? (0) | 2020.11.03 |
파이썬 TypeError : 'Tensor'개체는 TensorFlow에서 항목 할당을 지원하지 않습니다. (0) | 2020.11.03 |
파이썬 how to indent the code block in Python IDE: Spyder? (0) | 2020.11.02 |
파이썬 장고 셸에서 모듈을 다시로드하는 방법은 무엇입니까? (0) | 2020.11.02 |
댓글