반응형
다음 팬더 데이터 프레임이 있습니다.
dfalph.head()
token year uses books
386 xanthos 1830 3 3
387 xanthos 1840 1 1
388 xanthos 1840 2 2
389 xanthos 1868 2 2
390 xanthos 1875 1 1
중복 된 token
및 years
가있는 행을 다음과 같이 집계합니다.
dfalph = dfalph[['token','year','uses','books']].groupby(['token', 'year']).agg([np.sum])
dfalph.columns = dfalph.columns.droplevel(1)
dfalph.head()
uses books
token year
xanthos 1830 3 3
1840 3 3
1867 2 2
1868 2 2
1875 1 1
인덱스에 'token'및 'year'필드를 포함하는 대신 열로 반환하고 정수 인덱스를 갖고 싶습니다.
해결 방법
>>> g
uses books
sum sum
token year
xanthos 1830 3 3
1840 3 3
1868 2 2
1875 1 1
[4 rows x 2 columns]
>>> g = g.reset_index()
>>> g
token year uses books
sum sum
0 xanthos 1830 3 3
1 xanthos 1840 3 3
2 xanthos 1868 2 2
3 xanthos 1875 1 1
[4 rows x 4 columns]
>>> g = dfalph[['token', 'year', 'uses', 'books']].groupby(['token', 'year'], as_index=False).sum()
>>> g
token year uses books
0 xanthos 1830 3 3
1 xanthos 1840 3 3
2 xanthos 1868 2 2
3 xanthos 1875 1 1
[4 rows x 4 columns]
참조 페이지 https://stackoverflow.com/questions/21767900
반응형
'파이썬' 카테고리의 다른 글
파이썬 TypeError : 인수 값이 여러 개 있습니다. (0) | 2020.12.23 |
---|---|
파이썬 Python 제한 비선형 최적화 (0) | 2020.12.23 |
파이썬 Pandas의 데이터 프레임에서 숫자가 아닌 행을 찾으십니까? (0) | 2020.12.23 |
파이썬 목록을 다시 정렬하려면 어떻게해야합니까? (0) | 2020.12.22 |
파이썬 Python의 numpy ndarray에서 비 NaN 요소 수 계산 (0) | 2020.12.22 |
댓글