본문 바로가기

pandas20

[Pandas] map 이용해서 데이터프레임 그룹 통계 열 추가하기 Pandas map을 이용해서 groupby를 통해 생성한 그룹 통계를 열에 추가하는 방법을 알아봅니다. [ Contents ] 1. mapSeries.map(함수 또는 dict 또는 Series) map은 groupby로 생성한 그룹 통계나 함수 등을 매핑할 때 사용합니다. 단순 설명으로는 이해가 쉽지 않으니, 아래 예제를 통해 알아보겠습니다. 2025.06.07 - [Data Visualization/Python Lib] - [Pandas] 데이터셋 그룹 집계함수 groupby 사용법 (평균, 합계, 개수, 최대, 최소) [Pandas] 데이터셋 그룹 집계함수 groupby 사용법 (평균, 합계, 개수, 최대, 최소)판다스에서 groupby 집계함수를 사용해서 평균, 합계, 개수, 최대, 최소, .. 2025. 6. 17.
[Pandas] transform 이용해서 groupby 집계별 연산결과 덧붙이기 판다스의 transform 함수를 이용해서 groupby로 도출한 집계 결과별 연산 결과를 덧붙이는 방법을 알아봅니다. [ Contents ] 1. transformdf.groupby('기준컬럼')['타겟컬럼'].transform(함수) transfrom은 groupby와 함께 쓰이는 함수입니다. 기존에는 groupby('기준칼럼')['타겟컬럼'].집계함수() 방식으로 집계결과를 따로 도출하곤 했습니다. 하지만 transform은 기존 행에 집계 결과를 덧붙일 수 있습니다. 이는 아래 예시를 통해서 자세히 알아봅니다. 2. 활용 예시import pandas as pddf = pd.DataFrame({ '부서': ['영업', '영업', '인사', '인사', '개발', '개발'], '이름'.. 2025. 6. 17.
[Pandas] 데이터프레임 행 열마다 함수 연산 적용하는 방법 (apply 활용) apply를 이용해서 판다스에서 데이터프레임 또는 시리즈 데이터에 함수를 적용할 수 있습니다. 해당 함수를 사용하는 방법을 예제와 함께 다룹니다. [ Contents ] 1. apply함수DataFrame.apply(func, axis=0) # axis=0이면 열(column) 기준DataFrame.apply(func, axis=1) # axis=1이면 행(row) 기준 apply는 '적용하다'라는 뜻처럼, 데이터에 함수 연산을 적용해서 원하는 값을 도출해낼 수 있습니다. axis 파라미터 생략 시, 기본값을 열 기준(axis=0)으로 세팅됩니다. 보통 통계적 수치는 열 기준으로 잡을 때가 많죠. 2. 활용 예제import pandas as pddf = pd.DataFrame({ '1과목.. 2025. 6. 16.
[빅데이터분석기사 실기 10회] 테스트 체험 환경 제3유형 통계 분석 정답 및 해설 빅데이터분석기사 실기 10회 체험 문제 - 제3유형 통계 분석 문제를 풀어봅니다. [ Contents ] 1. 문제 분석 구름EDU - 모두를 위한 맞춤형 IT교육구름EDU는 모두를 위한 맞춤형 IT교육 플랫폼입니다. 개인/학교/기업 및 기관 별 최적화된 IT교육 솔루션을 경험해보세요. 기초부터 실무 프로그래밍 교육, 전국 초중고/대학교 온라인 강의, 기업/edu.goorm.io 빅데이터분석기사 실기 체험 문제는 위 링크에서 확인하실 수 있습니다. 다만 주기적으로 문제를 교체하기 때문에, 추후에는 변경될 수 있습니다. 제10회 체험문제는 T-검정 문제가 나왔습니다. 제3유형으로 통계 분석 문제가 나온지 얼마되지 않았기 때문에 기출도 적고, 나올 유형도 많습니다. 그래서 기출을 외우기 보다는, 시험에 .. 2025. 6. 14.
[빅데이터분석기사 실기 10회] 테스트 체험 환경 제1유형 데이터 분석 정답 및 해설 빅데이터분석기사 실기는 구름 EDU에서 실시하며, 미리 시험환경을 테스트해볼 수 있습니다. 테스트 문제를 풀어보며 10회 시험 감각을 익혀봅니다. [ Contents ] 1. 문제 분석 구름EDU - 모두를 위한 맞춤형 IT교육구름EDU는 모두를 위한 맞춤형 IT교육 플랫폼입니다. 개인/학교/기업 및 기관 별 최적화된 IT교육 솔루션을 경험해보세요. 기초부터 실무 프로그래밍 교육, 전국 초중고/대학교 온라인 강의, 기업/edu.goorm.io 문제는 위 링크를 통해서 보실 수 있습니다. 체험 문제는 지속적으로 업데이트가 되기 때문에, 추후 달라지기도 합니다. 데이터는 회사 직원 연봉과 근속 연수 등에 대한 자료가 나왔습니다. 결측치 대체 및 제거 과정을 거치고, 4분위수와 그룹 통계를 구하는 문제였어.. 2025. 6. 14.
[Pandas] pivot table 피벗테이블 활용해서 행열 기준으로 그룹화 및 집계하기 엑셀에서 행, 열, 값으로 데이터를 옮기며 집계표를 작성할 수 있는 피벗테이블이라는 기능이 있습니다. 그 기능과 유사하게 판다스의 pivot_table 함수를 이용해서 데이터프레임을 행열 기준으로 그룹화하여 집계하는 방법을 알아봅니다. [ Contents ] 1. 피벗테이블 (pivot_table)pd.pivot_table( data, # 원본 DataFrame values=None, # 집계할 값 (열 이름) index=None, # 행 기준 그룹화할 열 columns=None, # 열 기준 그룹화할 열 aggfunc='mean', # 집계함수 (mean, sum, count, max, min 등) fill_value=None, # NaN 대체 값 margin.. 2025. 6. 8.
[Pandas] 행 인덱스와 열 인덱스 변환하는 unstack, stack 함수 데이터프레임이나 시리즈 데이터의 행과 열 인덱스를 변환하는 unstack, stack 함수에 대해서 알아봅니다. [ Contents ] 1. unstackDataFrame.unstack(level=-1, fill_value=None) level은 열로 옮길 인덱스를 지정하며, 기본값은 가장 안쪽 행 인덱스를 옮깁니다. 옮길 인덱스 행을 넣는 파라미터이기 때문에, 행 인덱스 이름을 그대로 넣어줘도 됩니다. 사실 설명으로는 이해하기 어려운 함수이니, 아래 예제를 통해 알아보겠습니다. 2. 활용 예제import pandas as pddf = pd.DataFrame({ '지역': ['서울', '서울', '부산', '부산'], '연도': [2020, 2021, 2020, 2021], '인구.. 2025. 6. 8.
[Pandas] 데이터셋 그룹 집계함수 groupby 사용법 (평균, 합계, 개수, 최대, 최소) 판다스에서 groupby 집계함수를 사용해서 평균, 합계, 개수, 최대, 최소, 표준편차, 중앙값을 구하는 방법을 알아봅니다. [ Contents ] 1. 집계함수 groupbydf.groupby('컬럼명')['대상컬럼'].집계함수() 판다스에서 그룹 통계가 필요할 때 groupby를 사용합니다. 기존 데이터 분석에는 SQL을 사용했으므로 판다스에도 SQL과 유사한 문법들이 많습니다. groupby도 그중 하나죠. 2. 집계함수import pandas as pddf = pd.DataFrame({ 'team': ['A', 'A', 'B', 'B', 'C'], 'score': [10, 20, 30, 40, 50], 'grade': ['high', 'low', 'low', 'high', '.. 2025. 6. 7.
[Pandas] 날짜 형식 데이터 정제하는 방법, datetime 관련 문법 알아보기 판다스에서 날짜 형식 데이터는 datetime 형을 따릅니다. datetime은 날짜와 시분초로 나타내지는 timestamp형식으로, 이를 다루는 방법을 알아봅니다. [ Contents ] 1. pd.to_datetime()import pandas as pddf = pd.DataFrame({'date': ['2023-01-01', '2023-03-15', '2023-06-01']})df['date'] = pd.to_datetime(df['date']) 날짜형식의 문자열 데이터를 pd.to_datetime()으로 날짜 데이터로 만들 수 있습니다. pd.to_datetime(df['data'], format='%Y-%m-%d')와 같이 형식을 지정해줄 수도 있지만, 자동으로 알맞은 형식을 찾아서 변환해.. 2025. 6. 7.