(시리즈 글이 6개 있습니다.)

Math: 59. C# - 웨이트 벡터 갱신식을 이용한 퍼셉트론 분류
; https://www.sysnet.pe.kr/2/0/11938

Math: 60. C# - 로지스틱 회귀를 이용한 분류
; https://www.sysnet.pe.kr/2/0/11955

Math: 61. C# - 로지스틱 회귀를 이용한 선형분리 불가능 문제의 분류
; https://www.sysnet.pe.kr/2/0/11962

Math: 62. 활성화 함수에 따른 뉴런의 출력을 그리드 맵으로 시각화
; https://www.sysnet.pe.kr/2/0/11966

Math: 63. C# - 3층 구조의 신경망
; https://www.sysnet.pe.kr/2/0/11969

Math: 64. C# - 3층 구조의 신경망(분류)
; https://www.sysnet.pe.kr/2/0/11981

C# - 로지스틱 회귀를 이용한 선형분리 불가능 문제의 분류

지난번의 글에서 다룬 소스 코드가,

C# - 로지스틱 회귀를 이용한 분류
; https://www.sysnet.pe.kr/2/0/11955

"θ^T * x"의 계산식이 단순한 1차 식을 사용했으므로,

θ^T * x = θ₀ * x₀ + θ₁ * x₁ + θ₂ * x₂
       = θ₀ + θ₁ * x₁ + θ₂ * x₂ = 0

선형적인 데이터 분류에만 사용할 수 있었습니다. 하지만, 최소 자승법에 했던 방식과 유사하게,

C# - 다항식을 위한 최소 자승법(Least Squares Method)
; https://www.sysnet.pe.kr/2/0/11921

2차 함수로 확장시켜주면,

θ^T * x = θ₀ * x₀ + θ₁ * x₁ + θ₂ * x₂ + θ₃ * x₁ * x₁
       = θ₀ + θ₁ * x₁ + θ₂ * x₂ + θ₃ * x₁ * x₁ = 0

간단하게 선형 분리 불가능 문제도 해결할 수 있습니다.

코드 변경은 딱 2군데만 해주면 됩니다. 우선 θ 값을 하나 더 늘려주고,

// 매개변수 초기화
Vector<double> theta = Vector<double>.Build.Dense(SystemRandomSource.Default.NextDoubles(4));

데이터의 벡터도 역시 늘려주면 끝입니다.

// ImageRect.cs
public Vector<double> AsVectorX()
{
    return Vector<double>.Build.Dense(new double[] { 1.0, X1, X2, X1 * X1 });
}

이렇게 하고 책에서 나온 data3.csv에 대해 분류를 하면 다음과 같이 출력되는 것을 확인할 수 있습니다.

(확장 함수의 도움을 받아 작성한 ^^) 핵심 소스 코드를,

static void Main(string[] args)
{
    MLContext ctx = new MLContext();

    string inputFileName = "data3.csv";
    IDataView data = ctx.Data.LoadFromTextFile<ImageRect>(inputFileName, separatorChar: ',', hasHeader: true);

    // 매개변수 초기화
    Vector<double> theta = Vector<double>.Build.Dense(SystemRandomSource.Default.NextDoubles(4));

    var dataList = ctx.Data.CreateEnumerable<ImageRect>(data, false);
    var statInfo = dataList.GetStatisticsInfo();

    // 표준화
    var imgList = dataList.NormalizeZscore(statInfo);
    Matrix<double> X = imgList.ToMatrix();
    Vector<double> train_y = imgList.ToVectorY();

    Console.WriteLine(X);

    // 시그모이드 함수
    Func<Matrix<double>, Vector<double>, Vector<double>> f = (x, t) =>
                    1 / (1 + exp(-x * theta));

    // 학습률
    double ETA = 1e-3;

    // 반복 횟수
    int epoch = 5000;

    // 갱신 횟수
    for (int i = 0; i < epoch * 1; i ++)
    {
        theta = theta - ETA * (f(X, theta) - train_y) * X;
        // Console.WriteLine(theta);
    }

    Console.WriteLine($"theta = {theta}");

    OutputChart(imgList, theta);
}

파이썬과 비교해보는 것도 좋겠지요. ^^

wikibook/math-for-ml
; https://github.com/wikibook/math-for-ml/blob/master/classification2_logistic_regression.py

(첨부 파일은 이 글의 소스 코드를 포함합니다.)

[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[다음 글] Linux: 19. C# - .NET Core Unix Domain Socket 사용 예제
[이전 글] Graphics: 37. C# - PLplot - 출력 모음(Family File Output)

[최초 등록일: 6/27/2019]
[최종 수정일: 6/27/2019]

이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.

by SeongTae Jeong, mailto:techsharer at outlook.com

No	Writer	Date	Cnt.	Title	File(s)
13583	정성태	3/25/2024	1489	Windows: 261. CPU Utilization이 100% 넘는 경우를 성능 카운터로 확인하는 방법
13582	정성태	3/19/2024	1575	Windows: 260. CPU 사용률을 나타내는 2가지 수치 - 사용량(Usage)과 활용률(Utilization)	1
13581	정성태	3/18/2024	1754	개발 환경 구성: 707. 빌드한 Unity3D 프로그램을 C++ Windows Application에 통합하는 방법
13580	정성태	3/15/2024	1291	닷넷: 2231. C# - ReceiveTimeout, SendTimeout이 적용되지 않는 Socket await 비동기 호출	1
13579	정성태	3/13/2024	1498	오류 유형: 899. HTTP Error 500.32 - ANCM Failed to Load dll
13578	정성태	3/11/2024	1643	닷넷: 2230. C# - 덮어쓰기 가능한 환형 큐 (Circular queue)	1
13577	정성태	3/9/2024	1907	닷넷: 2229. C# - 닷넷을 위한 난독화 도구 소개 (예: ConfuserEx)
13576	정성태	3/8/2024	1547	닷넷: 2228. .NET Profiler - IMetaDataEmit2::DefineMethodSpec 사용법
13575	정성태	3/7/2024	1695	닷넷: 2227. 최신 C# 문법을 .NET Framework 프로젝트에 쓸 수 있을까요?
13574	정성태	3/6/2024	1566	닷넷: 2226. C# - "Docker Desktop for Windows" Container 환경에서의 IPv6 DualMode 소켓
13573	정성태	3/5/2024	1574	닷넷: 2225. Windbg - dumasync로 분석하는 async/await 호출
13572	정성태	3/4/2024	1660	닷넷: 2224. C# - WPF의 Dispatcher Queue로 알아보는 await 호출의 hang 현상	1
13571	정성태	3/1/2024	1636	닷넷: 2223. C# - await 호출과 WPF의 Dispatcher Queue 동작 확인	1
13570	정성태	2/29/2024	1643	닷넷: 2222. C# - WPF의 Dispatcher Queue 동작 확인	1
13569	정성태	2/28/2024	1550	닷넷: 2221. C# - LoadContext, LoadFromContext 그리고 GAC	1
13568	정성태	2/27/2024	1614	닷넷: 2220. C# - .NET Framework 프로세스의 LoaderOptimization 설정을 확인하는 방법	1
13567	정성태	2/27/2024	1623	오류 유형: 898. .NET Framework 3.5 이하에서 mscoree.tlb 참조 시 System.BadImageFormatException	1
13566	정성태	2/27/2024	1635	오류 유형: 897. Windows 7 SDK 설치 시 ".NET Development" 옵션이 비활성으로 선택이 안 되는 경우
13565	정성태	2/23/2024	1620	닷넷: 2219. .NET CLR2 보안 모델에서의 개별 System.Security.Permissions 제어
13564	정성태	2/22/2024	1905	Windows: 259. Hyper-V Generation 1 유형의 VM을 Generation 2 유형으로 바꾸는 방법
13563	정성태	2/21/2024	1945	디버깅 기술: 196. windbg - async/await 비동기인 경우 메모리 덤프 분석의 어려움
13562	정성태	2/21/2024	1956	오류 유형: 896. ASP.NET - .NET Framework 기본 예제에서 System.Web에 대한 System.IO.FileNotFoundException 예외 발생
13561	정성태	2/20/2024	2028	닷넷: 2218. C# - (예를 들어, Socket) 비동기 I/O에 대한 await 호출 시 CancellationToken을 이용한 취소	1
13560	정성태	2/19/2024	2048	디버깅 기술: 195. windbg 분석 사례 - Semaphore 잠금으로 인한 Hang 현상 (닷넷)
13559	정성태	2/19/2024	2931	오류 유형: 895. ASP.NET - System.Security.SecurityException: 'Requested registry access is not allowed.'
13558	정성태	2/18/2024	2156	닷넷: 2217. C# - 최댓값이 1인 SemaphoreSlim 보다 Mutex 또는 lock(obj)를 선택하는 것이 나은 이유

Writer

Date

Cnt.

Title

File(s)

13583

정성태

3/25/2024

1489

Windows: 261. CPU Utilization이 100% 넘는 경우를 성능 카운터로 확인하는 방법

13582

정성태