Stack Building
[스크랩] 잔차(residual)와 오차(error) 본문
위의 2개의 그래프에서 왼쪽에 있는 모형은 모집단의 모수식을 표현한 것이다. 즉, 우리가 궁극적으로 알고자 하는 실제의 식인 것이다. 이 경우, 모든 data 들(점)을 하나의 회귀식으로 100% 설명할 수 없다. 그래서 생각해 낸 것이 바로 오차(error) 라고 하는 것으로, 이 값은 회귀식의 값과 실제값과의 차이를 말한다.
여기에서는 어떤 하나의 점과 회귀식과의 차이를 표현한 입실론(epsilon)이 바로 오차이다.
이에 비해서 잔차(resudial)라고 하는 것은 표본의 회귀식에 나온 값이다. 표본에서도 마찬가지로 회귀식을 구할 수 있다. 그러나, 그 회귀식은 모집단의 실제 회귀식과는 차이가 있을 수 있다. 이때에 모집단의 회귀식과 마찬가지로 표본의 회귀식에서도 잔차라는 것을 생각할 수 있으며, 같은 아이디어에 의해 구해지게 된다.
그러나, 오차는 모수의 개념이므로 표본에서는 오차라는 용어대신 통계량의 개념을 갖는 잔차(error)라는 용어로 대신 부르게 된다.
결국, 오차와 잔차는 같은 개념이지만 모집단의 값인가, 표본의 값인가에 따라 서로 달리 부르게 되는 것이다.
'머신러닝' 카테고리의 다른 글
[스크랩] 서포트 벡터 머신 (0) | 2019.09.09 |
---|---|
Bagging, Boosting, Stacking (0) | 2019.09.02 |
[스크랩] 유클리드, 마할라노비스 거리 (0) | 2019.08.04 |
[스크랩] 확률과 가능도(우도) (0) | 2019.08.04 |
클러스터링 (k-means 알고리즘) (0) | 2019.06.11 |
Comments