선형회귀의 목적식

입력 데이터 $X = [x_{1}, x_{2}, .., x_{n}]$ 과 가중치 $B = [b_{1}, ..., b_{n}]$ 그리고 출력 데이터 $Y = [y_{1}, ..., y_{n}]$ 가 있을 때, $y_{t} ≃ x_{t} * b_{t}$ 가 되도록 행렬 B를 최적화해보자.

예측값 $r_{t} = x_{t} b_{t}$ 일 때, 실제 값과의 차이는 아래와 같다.

$L = \frac{1}{n} \sum_{t = 1}^{n} ∣∣ y_{t} - r_{t} ∣ ∣_{2}$

$L (B) = L (b_{1}, b_{2}, ..., b_{n}) = \frac{1}{n} \sum_{t = 1}^{n} ∣∣ y_{t} - x_{t} b_{t} ∣ ∣_{2}$

$L = (\frac{1}{n} ((y_{1} - r_{1})^{2} + ... + (y_{n} - r_{n})^{2}))^{0.5}$

L(loss)를 기준으로 얼마나 가중치모델 B를 통해 도출한 예측 값 R이 실제 값 Y에 근접하는지의 척도를 알 수 있다.

L은 R에 대한 함수이므로 위 함수에 B를 대입하면 함수 L에 대한 결과 값도 변화한다.

따라서 L 대하여 편미분 예측 값 R로 편미분을 해서 나온 기울기를 통해 L값이 낮아지는 방향으로 B를 업데이트 할 수 있다.

우선 R로 L을 편미분 해보자.

$\frac{δ L}{δ R} = \frac{1}{2} (\frac{1}{n} ((y_{1} - r_{1})^{2} + ... + (y_{n} - r_{n})^{2}))' (\frac{1}{n} ((y_{1} - r_{1})^{2} + ... + (y_{n} - r_{n})^{2}))^{- 0.5} = \frac{1}{2} \frac{( \frac{1}{n} (( y _{1} - r _{1} ) ^{2} + ... + ( y _{n} - r _{n} ) ^{2} )) '}{( \frac{1}{n} (( y _{1} - r _{1} ) ^{2} + ... + ( y _{n} - r _{n} ) ^{2} ))} = \frac{1}{2 L} (\frac{1}{n} ((y_{1} - r_{1})^{2} + ... + (y_{n} - r_{n})^{2}))' = \frac{1}{2 n L} (- 2 (y_{1} - r_{1}) + ... + - 2 (y_{n} - r_{n})) = - \frac{1}{n L} ((y_{1} - r_{1}) + ... + (y_{n} - r_{n}))$

R로 먼저 편미분을 한 이유는 B는 R의 함수이고 R은 L의 함수이기 때문이다.

$\frac{δ r _{t}}{δ b _{t}} = x_{t}$

$\frac{δ l _{t}}{δ b _{t}} = \frac{δ l _{t}}{δ r _{t}} \frac{δ r _{t}}{δ b _{t}}$

$\frac{δ L}{δ B} = \frac{δ L}{δ R} \frac{δ R}{δ B} = - \frac{1}{n L} ((y_{1} - r_{1}) x_{1} + ... + (y_{n} - r_{n}) x_{n})$

참조

Week 1

HSV

Explorer

선형회귀의 목적식

선형회귀의 목적식

참조

Graph View

Table of Contents