Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- ResNet
- iTerm2
- version
- Inception V1
- Peephole Connection
- virtualenv
- Skip Connection
- RNN
- Skip Connectioin
- Optimizer
- python
- GCN
- classification
- GoogLeNet
- Vanilla RNN
- Manager
- Generative
- Inception Module
- DCGAN
- vim-plug
- Regression
- Linear
- Bottleneck Layer
- Residual Connection
- jupyter
- sigmoid
- Gated Skip Connection
- AI
- DL
- cnn
Archives
- Today
- Total
IT Repository
(1) What is Loss Function? 본문
Loss Function¶
손실함수는 최적의 $H(x)$를 찾기 위해서, w와 b에 따른 $H(x)$값과 실제 y값과의 차이를 계산합니다.
x와 y는 이미 정해져있고 w와 b의 값에 따라서 손실이 변화하므로 아래와 같이 수식으로 표현할 수 있습니다.
$L(w, b) = H(x) - y$
$H(x)$를 통해 나오는 값은 설정된 w와 b에 따라 모델이 예측하는 예측값입니다.
만약 예측값과 실제값이 비슷하다면 손실함수의 값은 작아지고 차이가 크다면 손실함수의 값이 (절대값이) 커질 것입니다.
실제로는 제곱(MSE)이나 절대값(MAE)을 사용하여 계산합니다.
$L(w, b) = \big( H(x) - y \big)^2$
이와 같이 손실함수를 정의하고, 손실함수에 모든 데이터를 대입하여 모델의 전체 손실을 계산합니다.
모델의 전체 손실은 아래와 같이 표현됩니다. (MSE 기준)
$L(w, b) = \dfrac{1}{m} \displaystyle \sum_{i=1}^{m} \big( H \left( x^i \right) - y^i \big)^2$
참고.
제곱이나 절대값을 사용하지 않음으로써 생기는 문제점은 $\text{loss1} = -5,~\text{loss2}= 5$ 인 경우도 있습니다.
$\text{loss1} + \text{loss2} = 0$ 이므로 좋은 모델로써 잘못 판단할 수 있습니다.
(MSE는 Mean Squared Error, MAE는 Mean Absolute Error입니다.
추후 손실함수에 대한 포스팅에서 다루겠습니다.)
'Basic fundamentals' 카테고리의 다른 글
(5) Model Capacity (0) | 2020.01.13 |
---|---|
(4) What is Backpropagation? (0) | 2020.01.06 |
(3) What is Neural Network? (0) | 2020.01.06 |
(2) What is Gradient Descent? (Optimization) (0) | 2020.01.05 |
(0) Overview of Fundamentals (0) | 2020.01.05 |
Comments