GDSC HUFS 3기/텐서플로우로 시작하는 딥러닝 기초(Part-1)

[5팀] 텐서플로우로 시작하는 딥러닝 기초 | Lec 01

Yoon-Min 2021. 10. 5. 11:00

이 글은 boostcourse를 참고하여 작성하였습니다.

작성자 : 윤승민

 

1. What is ML?

일종의 소프트웨어 → 명시적인 프로그램(explicit program)

<명시적인 프로그래밍이란 무엇인가?>

-개발자의 의도에 맞게 작동하는 것

 

하지만 명시적인 프로그래밍을 하기 어려운 상황이 있다.

 

 1. 스팸 필터 : 많은 규칙들이 필요

 2. 자동화 운전:매우 많은 규칙들이 필요

 

Arthur Samuel (아서 사무엘)

규칙들을 하나 둘 전부 프로그래밍하지 말고 어떤 자료 혹은 현상에서 자동적으로 학습을 하면 해결되지 않을까?라는 생각에서 시작됐다.

 


2. 머신러닝의 학습 방법

Supervised / Unsupervised learning

지도 학습 / 비지도 학습

  • Supervised learning

정해져 있는 데이터(labeled examples)들을 가지고 학습을 하는 것

 

Type of supervised learning

  • regression(회귀) - 공부 시간을 기반으로 최종 시험 점수를 예측한다.
  • binary classification(이진 분류) - 공부 시간을 기반으로 통과 / 불통으로 나눈다.
  • multi-label classification(다중 레이블 분류) - 공부 시간을 기반으로 학점을 준다.

 

  • Unsupervised learning

자신이 직접 grouping을 한다 → 스스로 학습을 한다.


3. 학습 예시

머신러닝이 학습을 하려면 데이터가 필요하다.

  • Training Data Set

1. 트레이닝 데이터 셋을 통해 학습을 한다.

2. 모델을 만든다.

3. 최적의 답을 내놓는다.

 

<Training Data Set의 대표적인 예시는 알파고>

 

알파고는 트레이닝 데이터 셋(사람들의 바둑 데이터 집합)을 통해 바둑에서 나올 수 있는 여러 상황들의 대처 모델을 만들어낸다.

이세돌과의 경기에서 이세돌이 둔 수를 파악해 자신이 만들어낸 모델 중 최적의 답을 내놓는다.


4. 머신러닝의 가장 일반적인 문제 유형

  • image labeling : 태그 된 이미지를 가지고 학습을 한다.
  • Email spam filter : spam or ham이라고 표시가 된 이메일을 가지고 학습을 한다.
  • Predicting exam score : 이전 시험 점수와 공부에 소모했던 시간을 가지고 학습을 한다.