Microsoft MVP성태의 닷넷 이야기
Math: 55. C# - 다항식을 위한 최소 자승법(Least Squares Method) [링크 복사], [링크+제목 복사]
조회: 1842
글쓴 사람
홈페이지
첨부 파일

C# - 다항식을 위한 최소 자승법(Least Squares Method)

지난 글에서,

C# - 행렬식을 이용한 최소 자승법(LSM: Least Square Method)
; https://www.sysnet.pe.kr/2/0/11918

최소 자승법(최소 제곱법)을 이용해 1차 함수로 근사하는 것을 봤는데요, 이를 2차, 3차,...로 확장하는 것은 다음과 같이 매우 쉽습니다.

θ0 + θ1x1 + θ2x12 = y1
θ0 + θ1x2 + θ2x22 = y2
...
θ0 + θ1xn + θ2xn2 = yn



θ0 + θ1x1 + θ2x12 + θ3x13 = y1
θ0 + θ1x2 + θ2x22 + θ3x13 = y2
...
θ0 + θ1xn + θ2xn2 + θ3x13 = yn



따라서 행렬을 사용하는 경우 그냥 늘어나는 방정식의 계수만큼 행을 추가해 의사역행렬을 구한 후 연산하면 매개변수를 구할 수 있습니다.

private static double[] GetPolynomial(double[] xData, double[] yData, int numberOfEfficient)
{
    Matrix<double> matA = CreateMatrix.DenseOfColumnMajor(xData.Count(), 1, xData);
    Vector<double> add1 = Vector<double>.Build.DenseOfArray(Enumerable.Repeat(1.0, xData.Count()).ToArray());
    matA = matA.InsertColumn(1, add1);

    for (int i = 1; i < numberOfEfficient; i++)
    {
        double[] newColumnData = xData.Select((elem) => Math.Pow(elem, i + 1)).ToArray();
        Vector<double> addX = Vector<double>.Build.DenseOfArray(newColumnData);
        matA = matA.InsertColumn(0, addX);
    }

    Console.WriteLine(matA);
    Matrix<double> matB = CreateMatrix.DenseOfColumnMajor(yData.Count(), 1, yData);

    Matrix<double> pinvMatA = matA.PseudoInverse();
    Console.WriteLine(pinvMatA);

    Matrix<double> matX = pinvMatA * matB;
    return matX.AsColumnMajorArray();
}

[파란색 - 1차 함수, 빨간색 - 2차 함수, 노란색 3차 함수]
lsm_polynomial_1.png

일반적으로 차수가 올라갈수록 (과적합의 문제가 발생할 수 있지만) 오류는 더 적어집니다. 확인을 위해 간단하게 다음과 같이 작성해 보면,

private static void ReportError(double[] xData, double[] yData, Func<double, double> func)
{
    double error = 0.0;

    for (int i = 0; i < xData.Length; i ++)
    {
        double diff = yData[i] - func(xData[i]);
        error += (diff * diff);
    }

    Console.WriteLine("Error: " + error);
}
/*
1차: Error: 19086.9489618992
2차: Error: 6555.72459287144
3차: Error: 5038.32058563331
*/

1차에 비해 2차에서 두드러지게 오류가 낮아지는 것을 볼 수 있습니다. 따라서 이런 경우 효율을 고려한다면 2차 함수를 사용하는 것이 좋은 선택일 수 있습니다.

(첨부 파일은 이 글의 예제 코드를 포함합니다.)




지난 글에서 행렬 라이브러리를 직접 사용하지 않고 1차 근사식에 대한 매개 변수를 구하는 방법을 알아봤는데요,

C# - 최소 자승법의 1차 함수에 대한 매개변수를 단순 for 문으로 구하는 방법
; https://www.sysnet.pe.kr/2/0/11919

말 그대로 연립 방정식이므로 가우스 소거법을 이용해 매개 변수를 구하는 것도 가능합니다. 코드가 눈에 잘 안 들어오지만 어차피 복붙으로 써야 하는 것이라 큰 문제는 안 될 것입니다. ^^

Linear Equation Solver - Gaussian Elimination (C#)
; https://www.codeproject.com/Tips/388179/Linear-Equation-Solver-Gaussian-Elimination-Csharp

Gaussian elimination
; https://rosettacode.org/wiki/Gaussian_elimination#C.23

Solve a system of equations with Gaussian elimination in C#
; http://csharphelper.com/blog/2014/10/solve-a-system-of-equations-with-gaussian-elimination-in-c/

[C#/WINFORM] 다항식 최소 제곱법(Polynomial Least Squares Method) 사용하기
; https://icodebroker.tistory.com/5580




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]





[최초 등록일: ]
[최종 수정일: 5/28/2019 ]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer@outlook.com

비밀번호

댓글 쓴 사람
 




1  2  3  4  5  6  7  8  [9]  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
12064정성태11/25/20191068오류 유형: 580. HTTP Error 500.0/500.33 - ANCM In-Process Handler Load Failure
12063정성태11/21/2019792디버깅 기술: 134. windbg - RtlReportCriticalFailure로부터 parameters 정보 찾는 방법
12062정성태12/20/2019658디버깅 기술: 133. windbg - CoTaskMemFree/FreeCoTaskMem에서 발생한 덤프 분석 사례 - 두 번째 이야기
12061정성태11/20/2019739Windows: 165. CoTaskMemAlloc/CoTaskMemFree과 윈도우 Heap의 관계
12060정성태11/21/2019814디버깅 기술: 132. windbg/Visual Studio - HeapFree x64의 동작 분석
12059정성태11/20/2019755디버깅 기술: 131. windbg/Visual Studio - HeapFree x86의 동작 분석
12058정성태11/19/2019730디버깅 기술: 130. windbg - CoTaskMemFree/FreeCoTaskMem에서 발생한 덤프 분석 사례
12057정성태11/18/2019513오류 유형: 579. Visual Studio - Memory 창에서 유효한 주소 영역임에도 "Unable to evaluate the expression." 오류 출력
12056정성태11/18/2019968개발 환경 구성: 464. "Microsoft Visual Studio Installer Projects" 프로젝트로 EXE 서명 및 MSI 파일 서명 방법파일 다운로드1
12055정성태11/17/2019528개발 환경 구성: 463. Visual Studio의 Ctrl + Alt + M, 1 (Memory 1) 등의 단축키가 동작하지 않는 경우
12054정성태11/15/2019941.NET Framework: 869. C# - 일부러 GC Heap을 깨뜨려 GC 수행 시 비정상 종료시키는 예제
12053정성태11/15/2019586Windows: 164. 윈도우 10 - 명령행 창(cmd.exe) 속성에 (DotumChe, GulimChe, GungsuhChe 등의) 한글 폰트가 없는 경우
12052정성태11/15/2019519오류 유형: 578. Azure - 일정(schedule)에 등록한 runbook이 1년 후 실행이 안 되는 문제(Reason - The key used is expired.)
12051정성태12/2/20191247개발 환경 구성: 462. 시작하자마자 비정상 종료하는 프로세스의 메모리 덤프 - procdump [1]
12050정성태11/14/2019777Windows: 163. AcLayers의 API 후킹과 FaultTolerantHeap
12049정성태11/13/2019573.NET Framework: 868. (닷넷 프로세스를 대상으로) 디버거 방식이 아닌 CLR Profiler를 이용해 procdump.exe 기능 구현
12048정성태11/12/2019802Windows: 163. GUID 이름의 볼륨에 해당하는 파티션을 찾는 방법
12047정성태11/12/20191305Windows: 163. 안전하게 eject시킨 USB 장치를 물리적인 재연결 없이 다시 인식시키는 방법
12046정성태11/9/2019712오류 유형: 577. windbg - The call to LoadLibrary(...\sos.dll) failed, Win32 error 0n193
12045정성태10/27/2019573오류 유형: 576. mstest.exe 실행 시 "Visual Studio Enterprise is required to execute the test." 오류 - 두 번째 이야기
12044정성태10/27/2019724오류 유형: 575. mstest.exe - System.Resources.MissingSatelliteAssemblyException: The satellite assembly named "Microsoft.VisualStudio.ProductKeyDialog.resources.dll, ..."
12043정성태10/27/2019729오류 유형: 574. Windows 10 설치 시 오류 - 0xC1900101 - 0x4001E
12042정성태10/26/2019670오류 유형: 573. OneDrive 하위에 위치한 Documents, Desktop 폴더에 대한 권한 변경 시 "Unable to display current owner"
12041정성태10/23/2019523오류 유형: 572. mstest.exe - The load test results database could not be opened.
12040정성태10/23/2019898오류 유형: 571. Unhandled Exception: System.Net.Mail.SmtpException: Transaction failed. The server response was: 5.2.0 STOREDRV.Submission.Exception:SendAsDeniedException.MapiExceptionSendAsDenied
12039정성태10/22/2019671스크립트: 16. cmd.exe의 for 문에서는 ERRORLEVEL이 설정되지 않는 문제
1  2  3  4  5  6  7  8  [9]  10  11  12  13  14  15  ...