GDSC HUFS 3기/텐서플로우로 시작하는 딥러닝 기초(Part-1)
[5팀] 텐서플로우로 시작하는 딥러닝 기초 | Lec 01
Yoon-Min
2021. 10. 5. 11:00
이 글은 boostcourse를 참고하여 작성하였습니다.
작성자 : 윤승민
1. What is ML?
일종의 소프트웨어 → 명시적인 프로그램(explicit program)
<명시적인 프로그래밍이란 무엇인가?>
-개발자의 의도에 맞게 작동하는 것
하지만 명시적인 프로그래밍을 하기 어려운 상황이 있다.
1. 스팸 필터 : 많은 규칙들이 필요
2. 자동화 운전:매우 많은 규칙들이 필요
Arthur Samuel (아서 사무엘)
규칙들을 하나 둘 전부 프로그래밍하지 말고 어떤 자료 혹은 현상에서 자동적으로 학습을 하면 해결되지 않을까?라는 생각에서 시작됐다.
2. 머신러닝의 학습 방법
Supervised / Unsupervised learning
지도 학습 / 비지도 학습
- Supervised learning
정해져 있는 데이터(labeled examples)들을 가지고 학습을 하는 것
Type of supervised learning
- regression(회귀) - 공부 시간을 기반으로 최종 시험 점수를 예측한다.
- binary classification(이진 분류) - 공부 시간을 기반으로 통과 / 불통으로 나눈다.
- multi-label classification(다중 레이블 분류) - 공부 시간을 기반으로 학점을 준다.
- Unsupervised learning
자신이 직접 grouping을 한다 → 스스로 학습을 한다.
3. 학습 예시
머신러닝이 학습을 하려면 데이터가 필요하다.
- Training Data Set
1. 트레이닝 데이터 셋을 통해 학습을 한다.
2. 모델을 만든다.
3. 최적의 답을 내놓는다.
<Training Data Set의 대표적인 예시는 알파고>
알파고는 트레이닝 데이터 셋(사람들의 바둑 데이터 집합)을 통해 바둑에서 나올 수 있는 여러 상황들의 대처 모델을 만들어낸다.
이세돌과의 경기에서 이세돌이 둔 수를 파악해 자신이 만들어낸 모델 중 최적의 답을 내놓는다.
4. 머신러닝의 가장 일반적인 문제 유형
- image labeling : 태그 된 이미지를 가지고 학습을 한다.
- Email spam filter : spam or ham이라고 표시가 된 이메일을 가지고 학습을 한다.
- Predicting exam score : 이전 시험 점수와 공부에 소모했던 시간을 가지고 학습을 한다.