나도 머신러닝이나 수학/통계 알못이라서 좀 뭐한데, 여튼.
나보다 알못인 사람에게 3줄로 설명할 때는 이렇게 한다.
엑셀 그래프에 추세선 기능이 있는데, 메뉴를 잘 보면 그래프를 대표하는 함수를 추출할 수 있다. 즉 f(x) = 3x^2 + 2x + 1 같은 식이 추출된다. 이때, 3, 2, 1이 상수인데 머신러닝에서는 가중치 벡터라고 하고, 퉁쳐서 모델이라고 부른다. 즉슨 값을 얻어내는 과정이 모델링이다.
이 상수 3, 2, 1은 다음의 방법으로 구할 수 있다.
역행렬을 구해서 행렬 연산으로 정확하게 추정할 수 있을 때 쓴다. 그런데 역행렬의 해가 존재하지 않는 경우도 많고, 수치해석적인 방법을 통해 컴퓨터로 구현하면 결국 미분을 루프로 풀어낸 뺑뺑이가 되기 때문에 컴퓨팅 비용이 과다하게 든다.
오차의 되먹임 뺑뺑이를 통해서 3, 2, 1 상수를 "근사적"으로 찾아낸다.
많은 데이터를 때려넣어 분포를 파악하고, 확률밀도 함수와 시그마 값등을 이용하여 3, 2, 1이 가설검증에 만족하는지 또는 중앙값 3, 2, 1을 찾아낸 후 그 확률이 얼마인지.. (몰라서 중략)
3, 2, 1의 상수의 군을 여러 층, 혹은 한 층에도 여러 군으로 만들고 전처리와 후처리를 넣어서 거대 뺑뺑이를 돌린다. 가중치 벡터를 여기서는 네트워크라고 부른다.
아... 3줄 넘었네.