본문 바로가기
파이썬

파이썬 Merge multiple column values into one column in python pandas

by º기록 2020. 11. 14.
반응형

다음과 같은 팬더 데이터 프레임이 있습니다.

   Column1  Column2  Column3  Column4  Column5
 0    a        1        2        3        4
 1    a        3        4        5
 2    b        6        7        8
 3    c        7        7        

이제 내가 원하는 것은 Column1과 새로운 columnA를 포함하는 새로운 데이터 프레임을 얻는 것입니다. 이 columnA는 다음과 같이 열 2-(to) n의 모든 값을 포함해야합니다 (여기서 n은 Column2에서 행 끝까지의 열 수).

  Column1  ColumnA
0   a      1,2,3,4
1   a      3,4,5
2   b      6,7,8
3   c      7,7

이 문제에 어떻게 접근 할 수 있습니까? 어떤 조언이라도 도움이 될 것입니다. 미리 감사드립니다!

 

해결 방법

 

apply pass axis = 1 을 호출하여 행 단위로 apply 한 다음 dtype을 str 및 < code> 가입 :

In [153]:
df['ColumnA'] = df[df.columns[1:]].apply(
    lambda x: ','.join(x.dropna().astype(str)),
    axis=1
)
df

Out[153]:
  Column1  Column2  Column3  Column4  Column5  ColumnA
0       a        1        2        3        4  1,2,3,4
1       a        3        4        5      NaN    3,4,5
2       b        6        7        8      NaN    6,7,8
3       c        7        7      NaN      NaN      7,7

여기서는 NaN 을 제거하기 위해 dropna 를 호출합니다. 그러나 int 로 다시 캐스트해야하므로 float로 끝나지 않습니다. str.

 

참조 페이지 https://stackoverflow.com/questions/33098383

 

 

반응형

댓글