인공지능 머신러닝 - 샘플 데이터를 이용하여 데이터셋 활용하기(Datasets)

# Datasets

  • sklearn.datasets 안에 있는 샘플 데이터들
  • 주로 인공지능 머신러닝을 할 때 튜토리얼용으로 사용

 

# datasets 호출하기

from sklearn.datasets import 로드할 데이터셋
  • 데이터셋 샘플은 함수 호출시 import 이후에 load를 입력하고 Tab 키를 누르면 목록을 확인할 수 있다.

 

# datasets 목록

  • load_boston : 보스턴 집 값 데이터
  • load_breast_cancer : 유방암 환자 데이터
  • load__diabetes : 당뇨병 환자 데이터
  • load_digits : 손글씨 데이터
  • 등등...

 

# datasets 특징

  • 샘플 데이터로 불러온 데이터는 Bunch 타입을 가짐