반응형
저는 여전히 Python pandas의 pivot_table을 처음 사용하며 한 열의 값 빈도를 계산하는 방법을 묻고 싶습니다.이 열은 다른 ID 열에도 연결됩니다. DataFrame은 다음과 같습니다.
import pandas as pd
df = pd.DataFrame({'Account_number':[1,1,2,2,2,3,3],
'Product':['A', 'A', 'A', 'B', 'B','A', 'B']
})
출력을 위해 다음과 같은 것을 얻고 싶습니다.
Product
A B
Account_number
1 2 0
2 1 2
3 1 1
지금까지이 코드를 시도했습니다.
df.pivot_table(rows = 'Account_number', cols= 'Product', aggfunc='count')
이 코드는 나에게 동일한 두 가지를 제공합니다. 위 코드의 문제점은 무엇입니까? 이 질문을하는 이유 중 하나는이 DataFrame이 단지 예일뿐입니다. 제가 작업중인 실제 데이터에는 수만 개의 account_numbers가 있습니다. 미리 도와 주셔서 감사합니다!
해결 방법
aggfunc
를 len
으로 지정해야합니다.
In [11]: df.pivot_table(index='Account_number', columns='Product',
aggfunc=len, fill_value=0)
Out[11]:
Product A B
Account_number
1 2 0
2 1 2
3 1 1
카운트처럼 보이며 각 열 ( Account_number
및 Product
)의 인스턴스를 세는 것 같습니다. 이것이 버그인지 확실하지 않습니다 ...
참조 페이지 https://stackoverflow.com/questions/22412033
반응형
'파이썬' 카테고리의 다른 글
파이썬 " 'float'개체를 암시 적으로 str로 변환 할 수 없습니다." (0) | 2020.12.20 |
---|---|
파이썬 Locate first and last non NaN values in a Pandas DataFrame (0) | 2020.12.20 |
파이썬 Python의 목록에있는 각 튜플의 첫 번째 요소를 가져옵니다. (0) | 2020.12.20 |
파이썬 주어진 인덱스로 파이썬 목록의 하위 목록을 얻습니까? (0) | 2020.12.20 |
파이썬 numpy 배열을 초기화하고 채우는 가장 좋은 방법은 무엇입니까? (0) | 2020.12.20 |
댓글