반응형
pandas에서 수행하는 방법 :
단일 텍스트 열에 extract_text_features
함수가있어 여러 출력 열을 반환합니다. 특히이 함수는 6 개의 값을 반환합니다.
함수는 작동하지만 출력이 올바르게 할당 될 수있는 적절한 반환 유형 (pandas DataFrame / numpy 배열 / Python 목록)이없는 것 같습니다. df.ix [:, 10 : 16] = df. textcol.map (extract_text_features)
최신 정보:
df.iterrows ()
로 반복하는 것은 적어도 20 배 더 느리므로 항복하고 함수를 6 개의 별개의 .map (lambda ...)
호출로 분할했습니다.
해결 방법
user1827356의 답변을 바탕으로 df.merge
를 사용하여 한 번에 할당 할 수 있습니다.
df.merge(df.textcol.apply(lambda s: pd.Series({'feature1':s+1, 'feature2':s-1})),
left_index=True, right_index=True)
textcol feature1 feature2
0 0.772692 1.772692 -0.227308
1 0.857210 1.857210 -0.142790
2 0.065639 1.065639 -0.934361
3 0.819160 1.819160 -0.180840
4 0.088212 1.088212 -0.911788
수정 :
참조 페이지 https://stackoverflow.com/questions/16236684
반응형
'파이썬' 카테고리의 다른 글
파이썬 문자열에서 쉼표를 제거하는 방법 (0) | 2021.01.18 |
---|---|
파이썬 1D 배열을 numpy 행렬로 변환 (0) | 2021.01.18 |
파이썬 Ubuntu 12.10에서 Python Pip의 시스템 버전을 망쳤습니다. (0) | 2021.01.18 |
파이썬 : __getattr __ ()을 구현하는 방법? (0) | 2021.01.18 |
파이썬 배열에서 낮은 값을 0으로 만드는 가장 빠른 방법은 무엇입니까? (0) | 2021.01.18 |
댓글