본문 바로가기
Data Engineering

[빅데이터분석기사 실기 10회] 테스트 체험 환경 제1유형 데이터 분석 정답 및 해설

by jangThang 2025. 6. 14.
반응형

 빅데이터분석기사 실기는 구름 EDU에서 실시하며, 미리 시험환경을 테스트해볼 수 있습니다. 테스트 문제를 풀어보며 10회 시험 감각을 익혀봅니다.

 

[ Contents ]

     

     

    1. 문제 분석

     

    구름EDU - 모두를 위한 맞춤형 IT교육

    구름EDU는 모두를 위한 맞춤형 IT교육 플랫폼입니다. 개인/학교/기업 및 기관 별 최적화된 IT교육 솔루션을 경험해보세요. 기초부터 실무 프로그래밍 교육, 전국 초중고/대학교 온라인 강의, 기업/

    edu.goorm.io

     

     문제는 위 링크를 통해서 보실 수 있습니다. 체험 문제는 지속적으로 업데이트가 되기 때문에, 추후 달라지기도 합니다.

     데이터는 회사 직원 연봉과 근속 연수 등에 대한 자료가 나왔습니다. 결측치 대체 및 제거 과정을 거치고, 4분위수와 그룹 통계를 구하는 문제였어요.

     

     

    2. 데이터 전처리

    # 1. 결측치 채우기
    df['고객만족도'] = df['고객만족도'].fillna(df['고객만족도'].mean())

     

     지시에 따라 고객만족도의 결측치를 '평균'으로 대체합니다.

     

    반응형

     

    # 2. 근속연수가 없는 직원 삭제
    df = df.dropna(subset=['근속연수'])
    # df = df.dropna().reset_index(drop=True)

     

     근속연수가 없는 직원은 dropna를 이용해서 삭제합니다. 근속연수만 없는 null값인 데이터만 삭제해야 하지만, 해당 데이터셋에서는 근속연수만 결측치가 있었습니다. 그래서 subset 지정 없이 dropna를 해도 됩니다.

     

    print(df.isnull().sum())

     결측치 확인은 df.isnull().sum() 를 통해서 확인할 수 있습니다.

     

    2023.06.16 - [Data Visualization/Python Lib] - [Pandas] 데이터셋의 결측치를 구하고 처리하는 방법 (isnull, dropna, fillna)

     

    [Pandas] 데이터셋의 결측치를 구하고 처리하는 방법 (isnull, dropna, fillna)

    판다스에서 데이터셋의 결측치를 구하고 이를 처리하는 방법을 알아봅니다. 또한 결측치란 무엇이고, 이에 대한 처리가 왜 중요한지도 알아봅니다. [ Contents ] 1. 결측치(missing value) 비어있거나

    star7sss.tistory.com

     

     

     

    3. 데이터 분석

    # 3. 직원 고객만족도 중 3분위수
    print(df['고객만족도'].quantile(0.75))	# 8

     

     전처리 후 고객만족도의 3분위수를 구합니다.

     quantile를 통해서 백분위수를 구할 수 있어요. [8]

     

    2025.06.07 - [Data Visualization/Python Lib] - [Pandas] 데이터의 분위수를 구하는 quantile (4분위수 구하기)

     

    [Pandas] 데이터의 분위수를 구하는 quantile (4분위수 구하기)

    데이터를 백분위로 나눈 지점을 뜻하는 분위수를 구하는 판다스 함수 quantile을 알아봅니다. [ Contents ] 1. DataFrame.quantile()DataFrame.quantile(q=0.5, axis=0, numeric_only=False, interpolation='linear') 데이터프레임

    star7sss.tistory.com

     

     

    # 4. 부서별 평균연봉 구하고, 두번째로 평균 연봉이 높은 부서의 평균연봉
    filter_df = df.groupby('부서').mean('연봉').sort_values('연봉', ascending=False)
    print(filter_df)	# Sales 74690

     groupby를 이용해서 부서별 평균 연봉을 구합니다.

     iloc나 loc를 이용해서 두번째로 평균 연봉이 높은 부서 연봉을 찾아서 출력할 수도 있겠지만, 여기까지만 구해도 출력창에서 쉽게 찾을 수 있습니다.

     1유형은 답안으로만 평가하므로, 정답만 잘 찾으면 됩니다. [sales 부서 74690]

     

    2025.06.07 - [Data Visualization/Python Lib] - [Pandas] 데이터셋 그룹 집계함수 groupby 사용법 (평균, 합계, 개수, 최대, 최소)

     

    [Pandas] 데이터셋 그룹 집계함수 groupby 사용법 (평균, 합계, 개수, 최대, 최소)

    판다스에서 groupby 집계함수를 사용해서 평균, 합계, 개수, 최대, 최소, 표준편차, 중앙값을 구하는 방법을 알아봅니다. [ Contents ] 1. 집계함수 groupbydf.groupby('컬럼명')['대상컬럼'].집계함수() 판다

    star7sss.tistory.com

     

     

    4. 전체 코드

     전체코드는 이렇습니다.

     

     

    star가 되고나서 Tistory

    반응형

    댓글