반응형
다음과 같은 팬더 데이터 프레임이 있습니다.
Column1 Column2 Column3 Column4 Column5
0 a 1 2 3 4
1 a 3 4 5
2 b 6 7 8
3 c 7 7
이제 내가 원하는 것은 Column1과 새로운 columnA를 포함하는 새로운 데이터 프레임을 얻는 것입니다. 이 columnA는 다음과 같이 열 2-(to) n의 모든 값을 포함해야합니다 (여기서 n은 Column2에서 행 끝까지의 열 수).
Column1 ColumnA
0 a 1,2,3,4
1 a 3,4,5
2 b 6,7,8
3 c 7,7
이 문제에 어떻게 접근 할 수 있습니까? 어떤 조언이라도 도움이 될 것입니다. 미리 감사드립니다!
해결 방법
apply
pass axis = 1
을 호출하여 행 단위로 apply
한 다음 dtype을 str
및 < code> 가입 :
In [153]:
df['ColumnA'] = df[df.columns[1:]].apply(
lambda x: ','.join(x.dropna().astype(str)),
axis=1
)
df
Out[153]:
Column1 Column2 Column3 Column4 Column5 ColumnA
0 a 1 2 3 4 1,2,3,4
1 a 3 4 5 NaN 3,4,5
2 b 6 7 8 NaN 6,7,8
3 c 7 7 NaN NaN 7,7
여기서는 NaN
을 제거하기 위해 dropna
를 호출합니다. 그러나 int
로 다시 캐스트해야하므로 float로 끝나지 않습니다. str.
참조 페이지 https://stackoverflow.com/questions/33098383
반응형
'파이썬' 카테고리의 다른 글
파이썬 How to quickly parse a list of strings (0) | 2020.11.14 |
---|---|
파이썬 데이터 프레임에서 word_tokenize를 사용하는 방법 (0) | 2020.11.14 |
파이썬에서 현재 날짜 시간의 문자열 형식을 어떻게 얻습니까? (0) | 2020.11.14 |
파이썬 경로가 Python을 사용하여 크로스 플랫폼 방식으로 절대 경로인지 상대 경로인지 확인하는 방법은 무엇입니까? (0) | 2020.11.14 |
파이썬 팬더의 크기와 개수의 차이점은 무엇입니까? (0) | 2020.11.14 |
댓글