본문 바로가기
Data Visualization/Python Lib

[Pandas] 데이터프레임 정보 및 기초통계량 파악: info(), describe()

by jangThang 2023. 6. 16.
반응형

 판다스 데이터셋의 정보 및 기초통계량을 알아보는 함수, info와 describe에 대해서 살펴봅니다.

 

[ Contents ]

     

     

    1. 데이터셋 정보, info

    df.info()

     info함수는 각 칼럼의 데이터 타입과 데이터 수를 반환합니다.

     

     info를 통해 각 칼럼별 데이터 타입을 확인하고, 알맞은 전처리 작업을 수행할 수 있습니다.

     또한 칼럼별 Non-Null Count도 제공하므로, 결측치도 쉽게 찾아낼 수 있습니다. 위 데이터셋에서는 'choice_description' 칼럼에 결측치가 있으며 이에 대해 알맞은 조치를 취해야 합니다.

     

    2023.06.16 - [Data Visualization/Python Lib] - [Pandas] 데이터셋의 결측치를 구하고 처리하는 방법 (isnull, dropna, fillna)

     

    [Pandas] 데이터셋의 결측치를 구하고 처리하는 방법 (isnull, dropna, fillna)

    판다스에서 데이터셋의 결측치를 구하고 이를 처리하는 방법을 알아봅니다. 또한 결측치란 무엇이고, 이에 대한 처리가 왜 중요한지도 알아봅니다. [ Contents ] 1. 결측치(missing value) 비어있거나

    star7sss.tistory.com

     

     

     

    2. 데이터셋 기초통계량, describe

    df.describe()

     describe함수는 데이터셋의 기초통계량을 집계합니다.

     

     각 컬럼별 개수, 평균, 표준편차, 최소/최대, 사분위 수를 구해줍니다.

     위 통계량은 데이터셋의 정량적인 분석(EDA)을 할 때 주로 살펴보는 중요한 특성입니다.

     

     

    star가 되고나서 Tistory

    반응형

    댓글