[Pandas] map 이용해서 데이터프레임 그룹 통계 열 추가하기
Pandas map을 이용해서 groupby를 통해 생성한 그룹 통계를 열에 추가하는 방법을 알아봅니다. [ Contents ] 1. mapSeries.map(함수 또는 dict 또는 Series) map은 groupby로 생성한 그룹 통계나 함수 등을 매핑할 때 사용합니다. 단순 설명으로는 이해가 쉽지 않으니, 아래 예제를 통해 알아보겠습니다. 2025.06.07 - [Data Visualization/Python Lib] - [Pandas] 데이터셋 그룹 집계함수 groupby 사용법 (평균, 합계, 개수, 최대, 최소) [Pandas] 데이터셋 그룹 집계함수 groupby 사용법 (평균, 합계, 개수, 최대, 최소)판다스에서 groupby 집계함수를 사용해서 평균, 합계, 개수, 최대, 최소, ..
2025. 6. 17.
[Pandas] pivot table 피벗테이블 활용해서 행열 기준으로 그룹화 및 집계하기
엑셀에서 행, 열, 값으로 데이터를 옮기며 집계표를 작성할 수 있는 피벗테이블이라는 기능이 있습니다. 그 기능과 유사하게 판다스의 pivot_table 함수를 이용해서 데이터프레임을 행열 기준으로 그룹화하여 집계하는 방법을 알아봅니다. [ Contents ] 1. 피벗테이블 (pivot_table)pd.pivot_table( data, # 원본 DataFrame values=None, # 집계할 값 (열 이름) index=None, # 행 기준 그룹화할 열 columns=None, # 열 기준 그룹화할 열 aggfunc='mean', # 집계함수 (mean, sum, count, max, min 등) fill_value=None, # NaN 대체 값 margin..
2025. 6. 8.
[Pandas] 행 인덱스와 열 인덱스 변환하는 unstack, stack 함수
데이터프레임이나 시리즈 데이터의 행과 열 인덱스를 변환하는 unstack, stack 함수에 대해서 알아봅니다. [ Contents ] 1. unstackDataFrame.unstack(level=-1, fill_value=None) level은 열로 옮길 인덱스를 지정하며, 기본값은 가장 안쪽 행 인덱스를 옮깁니다. 옮길 인덱스 행을 넣는 파라미터이기 때문에, 행 인덱스 이름을 그대로 넣어줘도 됩니다. 사실 설명으로는 이해하기 어려운 함수이니, 아래 예제를 통해 알아보겠습니다. 2. 활용 예제import pandas as pddf = pd.DataFrame({ '지역': ['서울', '서울', '부산', '부산'], '연도': [2020, 2021, 2020, 2021], '인구..
2025. 6. 8.
[Pandas] 데이터셋 그룹 집계함수 groupby 사용법 (평균, 합계, 개수, 최대, 최소)
판다스에서 groupby 집계함수를 사용해서 평균, 합계, 개수, 최대, 최소, 표준편차, 중앙값을 구하는 방법을 알아봅니다. [ Contents ] 1. 집계함수 groupbydf.groupby('컬럼명')['대상컬럼'].집계함수() 판다스에서 그룹 통계가 필요할 때 groupby를 사용합니다. 기존 데이터 분석에는 SQL을 사용했으므로 판다스에도 SQL과 유사한 문법들이 많습니다. groupby도 그중 하나죠. 2. 집계함수import pandas as pddf = pd.DataFrame({ 'team': ['A', 'A', 'B', 'B', 'C'], 'score': [10, 20, 30, 40, 50], 'grade': ['high', 'low', 'low', 'high', '..
2025. 6. 7.