개발새발

1.1.1 사이킷런 소개 본문

[부스트코스] 웹프로그래밍/파이썬으로 시작하는 데이터 사이언스

1.1.1 사이킷런 소개

재래김유진 2024. 1. 12. 13:22
728x90
반응형

 

 Supervised learning VS unsupervised learning

머신러닝은 대표적으로 supervised learning과 unsupervised learning로 나뉜다.

 

 

✔️ Supervised learning (지도형 기계 학습)

: 기계 학습 중 컴퓨터가 입력값과 그에 따른 출력값이 있는 데이터를 이용하여 주어진 입력에 맞는 출력을 찾는 학습 방법.

정답이 있는 데이터를 맞힐 때

[ Classification, Regression ]

 

 

✔️ unsupervised learning (비지도형 기계 학습)

: 기계 학습(ML) 중 컴퓨터가 입력값만 있는 훈련 데이터를 이용하여 입력들의 규칙성을 찾는 학습 방법.

정답이 없는 데이터를 맞힐 때

[ Clustering, Dimensionality reduction ]

 

 

 


 

 

 

- 사이킷런이란?

 

사이킷런은 대표적인 파이썬 머신러닝 라이브러리입니다. 

 

https://scikit-learn.org/stable/

 

scikit-learn: machine learning in Python — scikit-learn 1.3.2 documentation

Model selection Comparing, validating and choosing parameters and models. Applications: Improved accuracy via parameter tuning Algorithms: grid search, cross validation, metrics, and more...

scikit-learn.org

 

 

사이킷런으로 할 수 있는 대표적인 예

 

 

 


✔️ Classification - (분류)

물건을 구매할 건지 구매하지 않을건지, 광고를 클릭할 건지 하지 않을 것인지를

무언가 구분할 수 있는 값들을 분류로 예측할 때 사용

 

Classification 시각화

 

Algorithm == 조리도구

조리도구를 사용해서 요리를 만든다.

내부의 조리도구의 메커니즘을 이해하기보다 조리도구로 어떤 레시피를 만들 수 있는지에 초점을 맞추자.

 

Input Data의 3가지 Data set으로 어떤 알고리즘을 쓰냐에 따라 성능이 달라진다.

 

분류는 Classifier로 끝이난다.

 


 

 

 

 ✔️ Regression 회귀 - (수치)

물건을 구매한다고 했을 때 얼마를 구매할 것인지, 광고의 효율을 측정한다면 효율이 어느 정도 나올지

특정 수치로 예측을 할 때 사용.

Regrassion 시각화

 

그래프를 선으로 표시 >> 물건의 가격, 판매량 예측을 예측할 때 사용.

regression을 사용해서 예측을 하게 된다. 분류의 시각화와는 다르게 시각화되어있다.

 

회기는 Regressor로 끝난다.

 

각각의 여러 가지 알고리즘이 어떤 차이가 있는지

이 알고리즘을 사용해서 다양한 레시피를 만들어보는 게 목표다.

 

👉 실습에서는 정답이 있는 데이터를 분류하거나(classification) 회기로 특정 숫자를 예측해 보는(regression) 실습을 해본다.

 

 

 

 

 

 

Model selection 

Preprocessing

 

728x90
반응형
Comments