본문 바로가기
파이썬

파이썬 한 열의 python pandas pivot_table 카운트 빈도

by º기록 2020. 12. 20.
반응형

저는 여전히 Python pandas의 pivot_table을 처음 사용하며 한 열의 값 빈도를 계산하는 방법을 묻고 싶습니다.이 열은 다른 ID 열에도 연결됩니다. DataFrame은 다음과 같습니다.

import pandas as pd
df = pd.DataFrame({'Account_number':[1,1,2,2,2,3,3],
                   'Product':['A', 'A', 'A', 'B', 'B','A', 'B']
                  })

출력을 위해 다음과 같은 것을 얻고 싶습니다.

                Product
                A      B
Account_number           
      1         2      0
      2         1      2
      3         1      1

지금까지이 코드를 시도했습니다.

df.pivot_table(rows = 'Account_number', cols= 'Product', aggfunc='count')

이 코드는 나에게 동일한 두 가지를 제공합니다. 위 코드의 문제점은 무엇입니까? 이 질문을하는 이유 중 하나는이 DataFrame이 단지 예일뿐입니다. 제가 작업중인 실제 데이터에는 수만 개의 account_numbers가 있습니다. 미리 도와 주셔서 감사합니다!

 

해결 방법

 

aggfunc len 으로 지정해야합니다.

In [11]: df.pivot_table(index='Account_number', columns='Product', 
                        aggfunc=len, fill_value=0)
Out[11]:
Product         A  B
Account_number
1               2  0
2               1  2
3               1  1

카운트처럼 보이며 각 열 ( Account_number Product )의 인스턴스를 세는 것 같습니다. 이것이 버그인지 확실하지 않습니다 ...

 

참조 페이지 https://stackoverflow.com/questions/22412033

 

 

반응형

댓글