본문 바로가기
Data Visualization/Python Lib

[Pandas] 데이터셋의 특정 타입 열만 조회하는 select_dtypes

by jangThang 2023. 6. 15.
반응형

 판다스(Pandas)의 데이터프레임에서 Type을 기준으로 열을 조회하는 select_dtypes에 대해 알아보겠습니다.

 

[ Contents ]

     

     

    1. select_dtypes

    DataFrame.select_dtypes(include, exclude)

     

     특정 타입을 가진 열만 조회할 수 있는 함수입니다. dtypes는 data type의 준말로, select_dtypes는 함수 기능 그대로 특정 타입을 조회한다는 뜻입니다.

     

     

     찾고자 하는 데이터타입은 include로, 제외하고자 하는 데이터타입은 exclude로 지정합니다.

     

     

     

    2. 데이터프레임 데이터타입(dtypes)

    1. 숫자형: 'number'
    2. 문자형: 'object'
    3. 날짜/시간: 'datetime'
    4. 범주형: 'category'

     

     판다스의 데이터타입은 크게 4가지 종류가 있습니다. number에는 int, float과 같은 하위 타입도 모두 포함됩니다.

     

     데이터 타입 확인은 주로 데이터분석이나 머신러닝에 앞서, 데이터 전처리할 때 사용합니다. 숫자형과 범주형의 전처리 방식은 각각 다르며 select_dtype으로 각각 추출해서 전처리합니다.

    (이때 범주형은 보통 '문자형'을 포함하거나 지칭합니다. 범주형은 종류별로 분류한 자료형으로, 흔히 문자형으로 되어 있습니다. 예를 들어 동물과 관련된 데이터셋의 경우에는 '포유류', '파충류' 등으로 종류를 나눈 열이 있을 수 있죠.)

     

    star가 되고나서 Tistory

    반응형

    댓글