(시리즈 글이 7개 있습니다.)

Math: 15. 그래프 그리기로 알아보는 뉴턴-랩슨(Newton-Raphson's method)법과 제곱근 구하기 - C#
; https://www.sysnet.pe.kr/2/0/10911

Math: 53. C# - 행렬식을 이용한 최소 자승법(LSM: Least Square Method)
; https://www.sysnet.pe.kr/2/0/11918

Math: 54. C# - 최소 자승법의 1차 함수에 대한 매개변수를 단순 for 문으로 구하는 방법
; https://www.sysnet.pe.kr/2/0/11919

Math: 55. C# - 다항식을 위한 최소 자승법(Least Squares Method)
; https://www.sysnet.pe.kr/2/0/11921

Math: 56. C# - 그래프 그리기로 알아보는 경사 하강법의 최소/최댓값 구하기
; https://www.sysnet.pe.kr/2/0/11923

Math: 57. C# - 해석학적 방법을 이용한 최소 자승법
; https://www.sysnet.pe.kr/2/0/11924

Math: 58. C# - 최소 자승법의 1차, 2차 수렴 그래프 변화 확인
; https://www.sysnet.pe.kr/2/0/11936

C# - 행렬식을 이용한 최소 자승법(LSM: Least Square Method)

개인적으로 자주 방문하게 되는 사이트가 있는데, 마침 "기초 수학으로 이해하는 머신러닝 알고리즘" 책과 연관된 내용이 나오는군요. ^^

최소자승법 이해와 다양한 활용예 (Least Square Method)
; https://darkpgmr.tistory.com/56

책에서 최소 자승법(최소 제곱법)을 해석학적 방법으로 접근해 행렬식으로 정리하는데, 위의 글을 보면 행렬로 정리한 내용을 더 쉽게 이해할 수 있습니다. 그럼, 실습을 한번 해볼까요? ^^ 지난 글에서 설명한 click.csv로 다뤄볼 텐데요,

ML.NET의 라이브러리를 이용하면 다음과 같이 로드해,

using Microsoft.ML.Data;

class ClickData
{
    [LoadColumn(0)]
    public int X { get; set; }

    [LoadColumn(1)]
    public int Y { get; set; }
}

class Program
{
    static void Main(string[] args)
    {
        MLContext ctx = new MLContext();

        IDataView data = ctx.Data.LoadFromTextFile<ClickData>("click.csv", separatorChar: ',', hasHeader: true);
    }
}

Plot 데이터를 지난번과 마찬가지로 그릴 수 있습니다.

var xyList = ctx.Data.CreateEnumerable<ClickData>(data, true);
double[] xData = xyList.Select(xy => (double)xy.X).ToArray();
double[] yData = xyList.Select(xy => (double)xy.Y).ToArray();

DrawPlotChart(xData, yData);

private static void DrawPlotChart(double[] xData, double[] yData)
{
    string chartFileName = "click.svg";

    int xMin = 0;
    int yMin = 0;

    int xMax = (int)xData.Max() + 10;
    int yMax = (int)yData.Max() + 10;

    using (var pl = new PLStream())
    {
        pl.sdev("svg");
        pl.sfnam(chartFileName);
        pl.spal0("cmap0_alternate.pal");
        pl.init();

        pl.env(xMin, xMax, yMin, yMax, AxesScale.Independent, AxisBox.BoxTicksLabelsAxes);
        pl.lab("X", "Y", "Click");
        char code = Symbol.Bullet; // == 17;
        pl.col0(2); //Blue

        pl.poin(xData, yData, code);

        pl.eop();
        pl.gver(out var verText);
    }
}

자, 그럼 이제 위의 데이터 분포를 근사시킬 1차 함수를 구해야 하는데요.

θ₀ + θ₁x₁ = y₁
θ₀ + θ₁x₂ = y₂
...
θ₀ + θ₁x_n = y_n

"최소자승법 이해와 다양한 활용예 (Least Square Method)" 글에서 설명한 데로 이것은 행렬식으로 다룰 수 있고,

$\begin{pmatrix}x_1 & 1\\ \vdots & \vdots \\ x_n & 1 \end{pmatrix} \begin{pmatrix} \theta_1 \\ \theta_0 \end{pmatrix} = \begin{pmatrix} y_1 \\ \vdots \\ y_n \end{pmatrix}$

방정식의 θ₁, θ₀ 요소는 결국 A 행렬의 의사 역행렬을 구해 계산하는 것으로 쉽게 처리할 수 있습니다.

AX=B
A^-1AX=A^-1B
X=A^-1B

다행히 일반적인 역행렬과는 달리 의사 역행렬은,

의사역행렬
; https://ko.wikipedia.org/wiki/%EC%9D%98%EC%82%AC%EC%97%AD%ED%96%89%EB%A0%AC

항상 존재하며, 유일하기 때문에 안전하게 언제나 사용할 수 있습니다. 즉, 근사식에 따른 1차 함수를 언제나 구할 수 있다는 의미입니다. 자, 그럼 이걸 코드로 표현해야겠지요. ^^

우선, A 행렬은 Click 데이터의 X 데이터와 함께 두 번째 칼럼의 값이 1로 채워져 있는 것입니다. 이것을 MathNet의 행렬로 다음과 같이 만들어 줄 수 있습니다.

Matrix<double> matA = CreateMatrix.DenseOfColumnMajor(xData.Count(), 1, xData);
Vector<double> add1 = Vector<double>.Build.DenseOfArray(Enumerable.Repeat(1.0, xData.Count()).ToArray());
Matrix<double> matAwith1 = matA.InsertColumn(1, add1);
/* matAwith1 행렬
235   1
216   1
148   1
 35   1
 85   1
204   1
 49   1
 25   1
 ..  ..
159   1
159   1
 59   1
198   1
*/

남은 작업은 의사 역행렬을 구하고 B 행렬과 곱해주면 방정식의 (θ₁, θ₀) 값으로 이뤄진 행렬을 얻게 됩니다.

Matrix<double> matB = CreateMatrix.DenseOfColumnMajor(yData.Count(), 1, yData);

Matrix<double> pinvMatA = matAwith1.PseudoInverse();
Matrix<double> matX = pinvMatA * matB;

double theta1 = mat[1, 1];
double theta0 = mat[1, 0];

/*
matX[0, 0] == θ₁
matX[1, 0] == θ₀
*/

실제로 연산을 해보면 (1.39551018043075, 231.545758451005) 값이 얻어지는데, 따라서 Click 데이터를 근사하는 방정식은 다음과 같이 이뤄집니다.

Console.WriteLine($"y = {theta0} + {theta1} * x");

/* 출력 결과
y = 231.545758451005 + 1.39551018043075 * x
*/

계산 끝났군요. ^^ 이제 이렇게 구한 1차 방정식을 Plot 차트에 추가하면,

Func<double, double> func =
    (x) => theta0 + theta1 * x;

double y1 = func(0);
double y2 = func(300);

DrawPlotChart(xData, yData, new double[] { 0, 300 }, new double[] { y1, y2 });

private static void DrawPlotChart(double[] xData, double[] yData, double [] ptX, double [] ptY)
{
    ...[생략]...

        pl.poin(xData, yData, code);
        pl.line(ptX, ptY);

    ...[생략]...
}

다음과 같이 근사하게, 잘 근사한 직선을 볼 수 있습니다. ^^

(첨부 파일은 이 글의 예제 프로젝트를 포함합니다.)

.NET Core 프로젝트에서 "PLplot" 관련해 다음과 같은 오류가 발생한다면?

Unhandled Exception: System.DllNotFoundException: Unable to load DLL 'plplot' or one of its dependencies: The specified module could not be found. (Exception from HRESULT: 0x8007007E)
   at PLplot.Native.mkstrm(Int32& p_strm)
   at PLplot.PLStream..ctor() in C:\projects\plplotnet\PLplotNet\PLStream.cs:line 23
   at Program.DrawPlotChart(IEnumerable`1 xyList) in F:\ConsoleApp1\ConsoleApp1\Program.cs:line 41
   at Program.Main(String[] args) in F:\ConsoleApp1\ConsoleApp1\Program.cs:line 20

이번엔 지난번 상황과 다소 다릅니다. .NET Core 2.1 프로젝트였는데, 로드된 PLplotNet.dll은 다음의 경로였고,

%USERPROFILE%\.nuget\packages\plplot\5.13.7\lib\netstandard2.0\PLplotNet.dll

plplot의 네이티브 모듈들은 정상적으로 "%USERPROFILE%\.nuget\packages\plplot\5.13.7\runtimes\win-x64\native"에 위치하고 있었습니다. 문제의 원인은, .NET Core 2.1 프로젝트의 "Platform"이 "AnyCPU"였다는 것으로 예전에 설명한 적이 있는,

.NET Core 오류 - 0x80131620 Unable to load DLL 'libuv'
; https://www.sysnet.pe.kr/2/0/11389

상황과 동일한 오류입니다. 따라서, "Platform target"을 "AnyCPU"가 아닌 "x64"로 명시적인 설정을 하면 오류가 발생하지 않습니다.

[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[최초 등록일: 5/25/2019]
[최종 수정일: 9/19/2021]

이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.

by SeongTae Jeong, mailto:techsharer at outlook.com

No	Writer	Date	Cnt.	Title	File(s)
13279	정성태	3/9/2023	4408	오류 유형: 851. 파이썬 ModuleNotFoundError: No module named '_cffi_backend'
13278	정성태	3/8/2023	4489	개발 환경 구성: 669. WSL 2의 (init이 아닌) systemd 지원 [1]
13277	정성태	3/6/2023	5245	개발 환경 구성: 668. 코드 사인용 인증서 신청 및 적용 방법(예: Digicert)
13276	정성태	3/5/2023	4837	.NET Framework: 2102. C# 11 - ref struct/ref field를 위해 새롭게 도입된 scoped 예약어
13275	정성태	3/3/2023	5070	.NET Framework: 2101. C# 11의 ref 필드 설명
13274	정성태	3/2/2023	4624	.NET Framework: 2100. C# - ref 필드로 ref struct 타입을 허용하지 않는 이유
13273	정성태	2/28/2023	4387	.NET Framework: 2099. C# - 관리 포인터로서의 ref 예약어 의미
13272	정성태	2/27/2023	4638	오류 유형: 850. SSMS - mdf 파일을 Attach 시킬 때 Operating system error 5: "5(Access is denied.)" 에러
13271	정성태	2/25/2023	4613	오류 유형: 849. Sql Server Configuration Manager가 시작 메뉴에 없는 경우
13270	정성태	2/24/2023	4137	.NET Framework: 2098. dotnet build에 /p 옵션을 적용 시 유의점
13269	정성태	2/23/2023	4778	스크립트: 46. 파이썬 - uvicorn의 콘솔 출력을 UDP로 전송
13268	정성태	2/22/2023	5297	개발 환경 구성: 667. WSL 2 내부에서 열고 있는 UDP 서버를 호스트 측에서 접속하는 방법
13267	정성태	2/21/2023	5174	.NET Framework: 2097. C# - 비동기 소켓 사용 시 메모리 해제가 finalizer 단계에서 발생하는 사례	1
13266	정성태	2/20/2023	4820	오류 유형: 848. .NET Core/5+ - Process terminated. Couldn't find a valid ICU package installed on the system
13265	정성태	2/18/2023	4685	.NET Framework: 2096. .NET Core/5+ - PublishSingleFile 유형에 대한 runtimeconfig.json 설정
13264	정성태	2/17/2023	6302	스크립트: 45. 파이썬 - uvicorn 사용자 정의 Logger 작성
13263	정성태	2/16/2023	4478	개발 환경 구성: 666. 최신 버전의 ilasm.exe/ildasm.exe 사용하는 방법
13262	정성태	2/15/2023	5538	디버깅 기술: 191. dnSpy를 이용한 (소스 코드가 없는) 닷넷 응용 프로그램 디버깅 방법 [1]
13261	정성태	2/15/2023	4891	Windows: 224. Visual Studio - 영문 폰트가 Fullwidth Latin Character로 바뀌는 문제
13260	정성태	2/14/2023	4646	오류 유형: 847. ilasm.exe 컴파일 오류 - error : syntax error at token '-' in ... -inf
13259	정성태	2/14/2023	4801	.NET Framework: 2095. C# - .NET5부터 도입된 CollectionsMarshal
13258	정성태	2/13/2023	4619	오류 유형: 846. .NET Framework 4.8 Developer Pack 설치 실패 - 0x81f40001
13257	정성태	2/13/2023	4729	.NET Framework: 2094. C# - Job에 Process 포함하는 방법 [1]	1
13256	정성태	2/10/2023	5471	개발 환경 구성: 665. WSL 2의 네트워크 통신 방법 - 두 번째 이야기
13255	정성태	2/10/2023	4883	오류 유형: 845. gihub - windows2022 이미지에서 .NET Framework 4.5.2 미만의 프로젝트에 대한 빌드 오류
13254	정성태	2/10/2023	4792	Windows: 223. (WMI 쿼리를 위한) PowerShell 문자열 escape 처리

AD BLOCK 해제 요청

C# - 행렬식을 이용한 최소 자승법(LSM: Least Square Method)