Microsoft MVP성태의 닷넷 이야기
Math: 58. C# - 최소 자승법의 1차, 2차 수렴 그래프 변화 확인 [링크 복사], [링크+제목 복사]
조회: 3239
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일

C# - 최소 자승법의 1차, 2차 수렴 그래프 변화 확인

지난 글에서 최소 자승법(최소 제곱법)을 다뤘고,

C# - 해석학적 방법을 이용한 최소 자승법
; https://www.sysnet.pe.kr/2/0/11924

PLplot을 윈도우 화면으로 출력하는 방법도 배웠으니,

C# - PLplot 출력을 파일이 아닌 Window 화면으로 변경
; https://www.sysnet.pe.kr/2/0/11935

이제 ^^ 최소 자승법이 theta 값을 수정하면서 그래프가 점점 근사해가는 모습을 눈으로 확인할 수 있습니다. ^^

따라서 지난 2개의 글에 실린 예제 코드를 합치면,

private void GraphLSM()
{
    MLContext ctx = new MLContext();

    IDataView data = ctx.Data.LoadFromTextFile<ClickData>("click.csv", separatorChar: ',', hasHeader: true);

    // 표준화
    var xyList = ctx.Data.CreateEnumerable<ClickData>(data, false).NormalizeZscore();

    // 매개변수 초기화
    double theta0 = SystemRandomSource.Default.NextDouble();
    double theta1 = SystemRandomSource.Default.NextDouble();

    // 예측 함수
    Func<double, double> f = (x) => theta0 + theta1 * x;

    // 목적 함수
    Func<double, double, double> errorFunc = (x, y) => Math.Pow((y - f(x)), 2);
    Func<IEnumerable<ClickData>, double> E = (list) => 0.5 * list.ForEach((e) => errorFunc(e.X, e.Y)).Sum();

    // 학습률
    double ETA = 1e-03;

    // 오차의 차분
    double diff = 1.0;

    // 갱신 횟수
    int count = 0;

    // 오차의 차분이 0.01 이하가 될 때까지 매개변수 갱신을 반복
    double error = E(xyList);

    // 그래프를 그리기 위한 데이터 준비
    double[] xData = xyList.Select((elem) => elem.X).ToArray();
    double[] yData = xyList.Select((elem) => elem.Y).ToArray();

    double xMin = xData.Min();
    double xMax = xData.Max();
    double yMin = yData.Min();
    double yMax = yData.Max();
    double[] ptX = Utils.RangeInclusive(xMin, xMax, 0.01).ToArray();
    double[] ptY = ptY = new double[ptX.Length];

    string title = $"{count:#}th: t0 = {theta0:#.00}, t1 = {theta1:#.00}, diff = {diff:#.00}";
    this.DoubleBuffered = true;
    this.BackgroundImage = DrawPlotChart(xMin - 0.1, xMax + 0.1, yMin - 0.1, yMax + 0.1, title, DrawPlot);

    while (diff > 1e-02)
    {
        Thread.Sleep(100);
        // 갱신 결과를 임시 변수에 저장
        double tmp_theta0 = theta0 - ETA * xyList.ForEach((e) => f(e.X) - e.Y).Sum();
        double tmp_theta1 = theta1 - ETA * xyList.ForEach((e) => (f(e.X) - e.Y) * e.X).Sum();

        // 매개변수 갱신
        theta0 = tmp_theta0;
        theta1 = tmp_theta1;

        // 이전 회의 오차와의 차분을 계산
        double currentError = E(xyList);
        diff = error - currentError;
        error = currentError;

        count++;
        title = $"{count:#}th: t0 = {theta0:#.00}, t1 = {theta1:#.00}, diff = {diff:#.00}";
        this.BackgroundImage = DrawPlotChart(xMin - 0.1, xMax + 0.1, yMin - 0.1, yMax + 0.1, title, DrawPlot);
    }

    void DrawPlot(PLStream pl, string text)
    {
        pl.lab("x", "y", text);
        pl.col0(PLplot.Color.Blue);

        for (int i = 0; i < xData.Length; i++)
        {
            pl.poin(xData[i], yData[i], Symbol.Bullet);
        }

        pl.lsty(LineStyle.ShortDashesShortGaps);

        {
            for (int i = 0; i < ptX.Length; i++)
            {
                ptY[i] = f(ptX[i]);
            }

            pl.line(ptX, ptY);
        }
    }
}

실행 시 다음과 같은 애니메이션을 볼 수 있습니다.

lsm_plot_ing_1.gif

해본 김에, 2차 함수 그래프로 근사하는 장면도 볼 수 있고.

lsm_plot_ing_2.gif

(첨부 파일은 이 글의 예제 코드를 포함합니다.)




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]


donaricano-btn



[최초 등록일: ]
[최종 수정일: 6/11/2019]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 쓴 사람
 



2021-08-10 04시11분
[221] PLplot 설치 하는 방법도 있으면 좋겠습니다.
[손님]
2021-08-10 04시57분
그냥 다음의 명령어로 nuget에서 설치하시면 됩니다.

Install-Package PLplot

아래의 글을 참고하세요.

C# - PLplot 사용 예제
; https://www.sysnet.pe.kr/2/0/11909
정성태

[1]  2  3  4  5  6  7  8  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
12850정성태10/27/20219오류 유형: 765. 우분투에서 pip install mysqlclient 실행 시 "OSError: mysql_config not found" 오류
12849정성태10/17/2021219스크립트: 33. JavaScript와 C#의 시간 변환
12848정성태10/17/2021160스크립트: 32. 파이썬 - sqlite3 기본 예제 코드
12847정성태10/14/2021136스크립트: 31. 파이썬 gunicorn - WORKER TIMEOUT 오류 발생
12846정성태10/7/2021283스크립트: 30. 파이썬 __debug__ 플래그 변수에 따른 코드 실행 제어
12845정성태10/6/2021472.NET Framework: 1120. C# - BufferBlock<T> 사용 예제 [4]파일 다운로드1
12844정성태10/3/2021219오류 유형: 764. MSI 설치 시 "... is accessible and not read-only." 오류 메시지
12843정성태10/3/2021234스크립트: 29. 파이썬 - fork 시 기존 클라이언트 소켓 및 스레드의 동작파일 다운로드1
12842정성태10/1/2021228오류 유형: 763. 파이썬 오류 - AttributeError: type object '...' has no attribute '...'
12841정성태10/1/2021304스크립트: 28. 모든 파이썬 프로세스에 올라오는 특별한 파일 - sitecustomize.py
12840정성태9/30/2021329.NET Framework: 1119. Entity Framework의 Join 사용 시 다중 칼럼에 대한 OR 조건 쿼리파일 다운로드1
12839정성태9/15/2021556.NET Framework: 1118. C# 10 - (17) 제네릭 타입의 특성 적용파일 다운로드1
12838정성태9/13/2021524.NET Framework: 1117. C# - Task에 전달한 Action, Func 유형에 따라 달라지는 async/await 비동기 처리 [2]파일 다운로드1
12837정성태9/11/2021309VC++: 151. Golang - fmt.Errorf, errors.Is, errors.As 설명
12836정성태9/10/2021303Linux: 45. 리눅스 - 실행 중인 다른 프로그램의 출력을 확인하는 방법
12835정성태9/7/2021313.NET Framework: 1116. C# 10 - (16) CallerArgumentExpression 특성 추가파일 다운로드1
12834정성태9/7/2021269오류 유형: 762. Visual Studio 2019 Build Tools - 'C:\Program' is not recognized as an internal or external command, operable program or batch file.
12833정성태9/6/2021387VC++: 150. Golang - TCP client/server echo 예제 코드파일 다운로드1
12832정성태9/6/2021273VC++: 149. Golang - 인터페이스 포인터가 의미 있을까요?
12831정성태9/6/2021261VC++: 148. Golang - 채널에 따른 다중 작업 처리파일 다운로드1
12830정성태9/6/2021265오류 유형: 761. Internet Explorer에서 파일 다운로드 시 "Your current security settings do not allow this file to be downloaded." 오류
12829정성태9/5/2021358.NET Framework: 1115. C# 10 - (15) 구조체 타입에 기본 생성자 정의 가능파일 다운로드1
12828정성태9/4/2021317.NET Framework: 1114. C# 10 - (14) 단일 파일 내에 적용되는 namespace 선언파일 다운로드1
12827정성태9/4/2021259스크립트: 27. 파이썬 - 웹 페이지 데이터 수집을 위한 scrapy Crawler 사용법 요약
12826정성태9/3/2021360.NET Framework: 1113. C# 10 - (13) 문자열 보간 성능 개선파일 다운로드1
[1]  2  3  4  5  6  7  8  9  10  11  12  13  14  15  ...