파이썬 팬더 그룹 후 적용 병렬화
groupby 이후에 apply 를 병렬화하기 위해 rosetta.parallel.pandas_easy 를 사용했습니다. 예를 들면 다음과 같습니다. from rosetta.parallel.pandas_easy import groupby_to_series_to_frame df = pd.DataFrame({'a': [6, 2, 2], 'b': [4, 5, 6]},index= ['g1', 'g1', 'g2']) groupby_to_series_to_frame(df, np.mean, n_jobs=8, use_apply=True, by=df.index) 그러나 DataFrame을 반환하는 함수를 병렬화하는 방법을 알아 낸 사람이 있습니까? 이 코드는 예상대로 rosetta 에 대해 실패합니다. def tmpFu..
2020. 12. 6.
파이썬 인덱스 배열을 기반으로 배열을 재정렬하는 방법
다음을 수행하는 데 도움이 될 한 줄 솔루션을 찾고 있습니다. 내가 가지고 있다고 가정 array = np.array([10, 20, 30, 40, 50]) 입력 순서에 따라 재정렬하고 싶습니다. arrange 라는 numpy 함수가 있으면 다음을 수행합니다. newarray = np.arrange(array, [1, 0, 3, 4, 2]) print newarray [20, 10, 40, 50, 30] 공식적으로 재정렬 할 배열이 m x n이고 "인덱스"배열이 1 x n 인 경우 순서는 "인덱스"라는 배열에 의해 결정됩니다. numpy에는 이와 같은 기능이 있습니까? 해결 방법 "인덱스"목록을 직접 사용할 수도 있고 인덱스 배열도 사용할 수 있습니다. >>> arr = np.array([10, 20, ..
2020. 12. 6.
파이썬 Python-epoch 시간에서 사람이 읽을 수있는 시간으로 초 변환
원래 날짜를 사람이 읽을 수있는 시간으로 변환하기 위해이 코드를 만들었습니다. a = datetime.datetime.strptime(time, "%Y-%m-%d %H:%M:%S.%f") b = datetime.datetime.now() c = b - a days, hours, minutes, seconds = int(c.days), int(c.seconds // 3600), int(c.seconds % 3600 / 60.0), int(c.seconds % 60.0) return days, hours, minutes, seconds EXAMPLE OUTPUT: 1 days, 4 hours, 24 minutes, 37 seconds 에포크 시간을 사용하여 만들려고 노력하고 있지만 일 시간 등을 계산하도록 ..
2020. 12. 6.