Hello COCOBALL!

[DL] 회귀(Regression), 분류(Classification) 본문

Deep Learning

[DL] 회귀(Regression), 분류(Classification)

coco_ball 2024. 6. 25. 16:40

회귀(Regression)

회귀는 연속적인 실수 값을 예측하는 문제이고, 예측 결과가 연속성(연속하는 값)을 지닌다. 예를 들어, 주택 및 주식 가격, 온도, 매출량, 거래량 등을 예측할 수 있다.

다시 말하자면, 실수형 변수값을 통해 예측하고, 예측 결과가 연속성을 지니는 경우에는 회귀 문제라고 할 수 있다.

 

분류(Classification)

주어진 데이터를 두 개 이상의 범주 중 하나로 분류하는 문제이다. 예측하고자 하는 타겟값이 범주형 변수인 경우에 해당되며, 회귀와 다르게 예측 결과가 연속성을 지니지 않고 이산적인 특징을 가지고 있다.

 

1. 이진 분류 (Binary Classification)

  • 정의: 데이터를 두 개의 클래스로 분류하는 문제.
  • 예시: 스팸 이메일 분류(스팸/비스팸), 질병 진단(질병 있음/없음).

2. 다중 분류 (Multi-class Classification)

  • 정의: 데이터를 세 개 이상의 클래스로 분류하는 문제.
  • 예시: 손글씨 숫자 인식(0-9), 이미지 분류(개, 고양이, 자동차 등).

3. 판별 함수 (Discriminant Function)

  • 정의: 입력 데이터를 기반으로 해당 데이터가 속한 클래스를 직접 예측하는 함수.
  • 예시: 로지스틱 회귀, 서포트 벡터 머신.

4. 확률 모델 (Probability Model)

  • 정의: 입력 데이터가 각 클래스에 속할 확률을 예측하는 모델.
  • 예시: 나이브 베이즈, 소프트맥스 회귀.