파이썬 한 열의 python pandas pivot

저는 여전히 Python pandas의 pivot_table을 처음 사용하며 한 열의 값 빈도를 계산하는 방법을 묻고 싶습니다.이 열은 다른 ID 열에도 연결됩니다. DataFrame은 다음과 같습니다.

import pandas as pd
df = pd.DataFrame({'Account_number':[1,1,2,2,2,3,3],
                   'Product':['A', 'A', 'A', 'B', 'B','A', 'B']
                  })

출력을 위해 다음과 같은 것을 얻고 싶습니다.

                Product
                A      B
Account_number           
      1         2      0
      2         1      2
      3         1      1

지금까지이 코드를 시도했습니다.

df.pivot_table(rows = 'Account_number', cols= 'Product', aggfunc='count')

이 코드는 나에게 동일한 두 가지를 제공합니다. 위 코드의 문제점은 무엇입니까? 이 질문을하는 이유 중 하나는이 DataFrame이 단지 예일뿐입니다. 제가 작업중인 실제 데이터에는 수만 개의 account_numbers가 있습니다. 미리 도와 주셔서 감사합니다!

해결 방법

aggfunc 를 len 으로 지정해야합니다.

In [11]: df.pivot_table(index='Account_number', columns='Product', 
                        aggfunc=len, fill_value=0)
Out[11]:
Product         A  B
Account_number
1               2  0
2               1  2
3               1  1

카운트처럼 보이며 각 열 ( Account_number 및 Product )의 인스턴스를 세는 것 같습니다. 이것이 버그인지 확실하지 않습니다 ...

참조 페이지 https://stackoverflow.com/questions/22412033

'파이썬' 카테고리의 다른 글

파이썬 " 'float'개체를 암시 적으로 str로 변환 할 수 없습니다." (0)	2020.12.20
파이썬 Locate first and last non NaN values in a Pandas DataFrame (0)	2020.12.20
파이썬 Python의 목록에있는 각 튜플의 첫 번째 요소를 가져옵니다. (0)	2020.12.20
파이썬 주어진 인덱스로 파이썬 목록의 하위 목록을 얻습니까? (0)	2020.12.20
파이썬 numpy 배열을 초기화하고 채우는 가장 좋은 방법은 무엇입니까? (0)	2020.12.20

프로그램 샘플 소스

파이썬 한 열의 python pandas pivot_table 카운트 빈도

해결 방법

'파이썬' 카테고리의 다른 글

댓글

티스토리툴바

파이썬 한 열의 python pandas pivot_table 카운트 빈도

해결 방법

'파이썬' 카테고리의 다른 글

관련글

댓글

티스토리툴바