빅데이터분석기사 실기는 구름 EDU에서 실시하며, 미리 시험환경을 테스트해볼 수 있습니다. 테스트 문제를 풀어보며 10회 시험 감각을 익혀봅니다.
[ Contents ]
1. 문제 분석
구름EDU - 모두를 위한 맞춤형 IT교육
구름EDU는 모두를 위한 맞춤형 IT교육 플랫폼입니다. 개인/학교/기업 및 기관 별 최적화된 IT교육 솔루션을 경험해보세요. 기초부터 실무 프로그래밍 교육, 전국 초중고/대학교 온라인 강의, 기업/
edu.goorm.io
문제는 위 링크를 통해서 보실 수 있습니다. 체험 문제는 지속적으로 업데이트가 되기 때문에, 추후 달라지기도 합니다.
데이터는 회사 직원 연봉과 근속 연수 등에 대한 자료가 나왔습니다. 결측치 대체 및 제거 과정을 거치고, 4분위수와 그룹 통계를 구하는 문제였어요.
2. 데이터 전처리
# 1. 결측치 채우기
df['고객만족도'] = df['고객만족도'].fillna(df['고객만족도'].mean())
지시에 따라 고객만족도의 결측치를 '평균'으로 대체합니다.
# 2. 근속연수가 없는 직원 삭제
df = df.dropna(subset=['근속연수'])
# df = df.dropna().reset_index(drop=True)
근속연수가 없는 직원은 dropna를 이용해서 삭제합니다. 근속연수만 없는 null값인 데이터만 삭제해야 하지만, 해당 데이터셋에서는 근속연수만 결측치가 있었습니다. 그래서 subset 지정 없이 dropna를 해도 됩니다.
print(df.isnull().sum())
결측치 확인은 df.isnull().sum() 를 통해서 확인할 수 있습니다.
[Pandas] 데이터셋의 결측치를 구하고 처리하는 방법 (isnull, dropna, fillna)
판다스에서 데이터셋의 결측치를 구하고 이를 처리하는 방법을 알아봅니다. 또한 결측치란 무엇이고, 이에 대한 처리가 왜 중요한지도 알아봅니다. [ Contents ] 1. 결측치(missing value) 비어있거나
star7sss.tistory.com
3. 데이터 분석
# 3. 직원 고객만족도 중 3분위수
print(df['고객만족도'].quantile(0.75)) # 8
전처리 후 고객만족도의 3분위수를 구합니다.
quantile를 통해서 백분위수를 구할 수 있어요. [8]
2025.06.07 - [Data Visualization/Python Lib] - [Pandas] 데이터의 분위수를 구하는 quantile (4분위수 구하기)
[Pandas] 데이터의 분위수를 구하는 quantile (4분위수 구하기)
데이터를 백분위로 나눈 지점을 뜻하는 분위수를 구하는 판다스 함수 quantile을 알아봅니다. [ Contents ] 1. DataFrame.quantile()DataFrame.quantile(q=0.5, axis=0, numeric_only=False, interpolation='linear') 데이터프레임
star7sss.tistory.com
# 4. 부서별 평균연봉 구하고, 두번째로 평균 연봉이 높은 부서의 평균연봉
filter_df = df.groupby('부서').mean('연봉').sort_values('연봉', ascending=False)
print(filter_df) # Sales 74690
groupby를 이용해서 부서별 평균 연봉을 구합니다.
iloc나 loc를 이용해서 두번째로 평균 연봉이 높은 부서 연봉을 찾아서 출력할 수도 있겠지만, 여기까지만 구해도 출력창에서 쉽게 찾을 수 있습니다.
1유형은 답안으로만 평가하므로, 정답만 잘 찾으면 됩니다. [sales 부서 74690]
[Pandas] 데이터셋 그룹 집계함수 groupby 사용법 (평균, 합계, 개수, 최대, 최소)
판다스에서 groupby 집계함수를 사용해서 평균, 합계, 개수, 최대, 최소, 표준편차, 중앙값을 구하는 방법을 알아봅니다. [ Contents ] 1. 집계함수 groupbydf.groupby('컬럼명')['대상컬럼'].집계함수() 판다
star7sss.tistory.com
4. 전체 코드

전체코드는 이렇습니다.

'Data Engineering' 카테고리의 다른 글
| [빅데이터분석기사 실기 10회] 테스트 체험 환경 제2유형 풀이 (원핫 인코딩 이용) (1) | 2025.06.15 |
|---|---|
| [빅데이터분석기사 실기 10회] 테스트 체험 환경 제2유형 모델 학습 정답 및 해설 (0) | 2025.06.15 |
| [빅데이터분석기사 실기 10회] 테스트 체험 환경 제3유형 통계 분석 정답 및 해설 (0) | 2025.06.14 |
| [데이터] 암묵지와 형식지, 4단계 지식전환단계 (공통화, 표출화, 연결화, 내면화) (0) | 2025.03.27 |
| [데이터] DIKW피라미드의 정의와 구체적인 예시 알아보기 (0) | 2025.03.25 |
댓글