Microsoft MVP성태의 닷넷 이야기
Math: 51. MathNET + OxyPlot을 이용한 간단한 통계 정보 처리 - Histogram [링크 복사], [링크+제목 복사],
조회: 20097
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
(연관된 글이 2개 있습니다.)

MathNET + OxyPlot을 이용한 간단한 통계 정보 처리 - Histogram

MathNET Numerics 라이브러리의,

C# - MathNet.Numerics의 Matrix(행렬) 연산
; https://www.sysnet.pe.kr/2/0/11910

통계 관련한 간단한 사용법을 볼까요? ^^ 우선, 다양한 평균에 대한 메서드입니다.

int [] heightInfo = LoadData("data.txt");

double [] dblHeights = (from elem in heightInfo
                    select (double)elem).ToArray();

Console.WriteLine($"Mean: {Statistics.Mean(dblHeights)}"); // 산술평균
Console.WriteLine($"GeometricMean: {Statistics.GeometricMean(dblHeights)}"); // 기하평균
Console.WriteLine($"HarmonicMean: {Statistics.HarmonicMean(dblHeights)}"); // 조화평균
Console.WriteLine($"RootMeanSquare: {Statistics.RootMeanSquare(dblHeights)}"); // 제곱평균

자동 히스토그램은 구간 수만 정해 주면 됩니다.

Histogram hist = new Histogram(dblHeights, 6);

또는, 상/하위 구간을 지정해 줄 수도 있습니다.

Histogram hist = new Histogram(dblHeights, 6, 141, 170);

아니면, 구간 자체를 사용자 정의하는 것도 가능합니다.

Histogram hist = new Histogram();

hist.AddBucket(new Bucket(141, 145));
hist.AddBucket(new Bucket(145, 150));
hist.AddBucket(new Bucket(150, 155));
hist.AddBucket(new Bucket(155, 160));
hist.AddBucket(new Bucket(160, 165));
hist.AddBucket(new Bucket(165, 170));

hist.AddData(dblHeights);

보는 바와 같이 계급 구간을 Bucket 타입으로 지정하는데,

public Bucket(double lowerBound, double upperBound);

상/하한 기준 값이 double이라는 점과 데이터 비교 기준이 다음과 같다는 점을 염두에 두어야 합니다.

(lowerBound, upperBound]

lowerBound < x <= upperBound

따라서 145 값을 주면 0번 Bucket에 계산되지만, 145.1을 주면 1번 Bucket에 계산됩니다.

상/하한 기준 값이 double이라는 점 때문에 계급값을 범용적으로 계산하는 것도 좀 이상해지긴 하지만, 그런 탓인지 Bucket 타입에는 계급값에 대한 속성이 없습니다. 또한, Histogram의 경우 계급값과 상대도수를 이용한 평균을 내주는 기능도 없으므로 이런 부분들은 임의로 여러분들이 다음과 같은 확장 메서드를 만들어 주어야 합니다.

public static class BucketExtension
{
    public static double GetClassMark(this Bucket bucket)
    {
        return Math.Round((bucket.LowerBound + bucket.UpperBound) / 2, MidpointRounding.AwayFromZero);
    }

    public static double GetRelativeFrequency(this Bucket bucket, Histogram histogram)
    {
        return bucket.Count / histogram.DataCount;
    }
}

public static class HistogramExtension
{
    public static void Output(this Histogram histogram)
    {
        for (int i = 0; i < histogram.BucketCount; i++)
        {
            Console.WriteLine($"{histogram[i].GetClassMark()} == {histogram[i].Count}");
        }
    }

    public static double Mean(this Histogram histogram)
    {
        double mean = 0.0;

        for (int i = 0; i < histogram.BucketCount; i++)
        {
            Bucket bucket = histogram[i];

            double classMark = bucket.GetClassMark();
            double relativeFrequency = bucket.GetRelativeFrequency(histogram);

            mean += (classMark * relativeFrequency);
        }

        return mean;
    }
}

그래서 다음과 같은 정도로 사용해 줄 수 있습니다.

Histogram hist = new Histogram();

hist.AddBucket(new Bucket(141, 145));
hist.AddBucket(new Bucket(145, 150));
hist.AddBucket(new Bucket(150, 155));
hist.AddBucket(new Bucket(155, 160));
hist.AddBucket(new Bucket(160, 165));
hist.AddBucket(new Bucket(165, 170));

hist.AddData(dblHeights);
hist.Output();
Console.WriteLine($"Mean of histogram: {hist.GetMean()}");

/*
출력 결과:
143 == 1
148 == 6
153 == 19
158 == 30
163 == 18
168 == 6
Mean of histogram: 157.75
*/




그래도 히스토그램은 역시 그래프로 봐야 제맛이죠? ^^

OxyPlot을 이용해,

C# Plotting 라이브러리 OxyPlot
; https://www.sysnet.pe.kr/2/0/10973

C# - OxyPlot 라이브러리로 복소수 표현
; https://www.sysnet.pe.kr/2/0/10974

Docs / Model / Series
; http://docs.oxyplot.org/en/latest/models/series/index.html

다음과 같은 정도로 그려낼 수 있습니다.

Histogram hist = GetHistogram(dblHeights);
plotView1.Model = GetHistogramModel(hist);

public PlotModel GetHistogramModel(Histogram hist)
{
    PlotModel model = new PlotModel();

    CategoryAxis xaxis = new CategoryAxis();
    xaxis.Position = AxisPosition.Bottom;
    xaxis.MajorGridlineStyle = LineStyle.Solid;
    xaxis.MinorGridlineStyle = LineStyle.Dot;

    for (int i = 0; i < hist.BucketCount; i++)
    {
        xaxis.Labels.Add(hist[i].GetClassMark().ToString());
    }

    LinearAxis yaxis = new LinearAxis();
    yaxis.Position = AxisPosition.Left;
    yaxis.MajorGridlineStyle = LineStyle.Dot;
    xaxis.MinorGridlineStyle = LineStyle.Dot;

    ColumnSeries series = new ColumnSeries();
    series.IsStacked = true;
    series.LabelPlacement = LabelPlacement.Base;
    series.LabelFormatString = "{0}";

    for (int i = 0; i < hist.BucketCount; i++)
    {
        ColumnItem item = new ColumnItem(hist[i].Count);
        series.Items.Add(item);
    }

    model = new PlotModel();
    model.Title = "Histogram";

    model.Axes.Add(xaxis);
    model.Axes.Add(yaxis);
    model.Series.Add(series);

    return model;
}

plotview_1.png

(첨부 파일은 이 글의 소스 코드를 포함합니다.)




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 5/24/2019]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




... 46  [47]  48  49  50  51  52  53  54  55  56  57  58  59  60  ...
NoWriterDateCnt.TitleFile(s)
12766정성태8/9/202113929Java: 32. closing inbound before receiving peer's close_notify
12765정성태8/9/202114322Java: 31. Cannot load JDBC driver class 'org.mysql.jdbc.Driver'
12764정성태8/9/202152537Java: 30. XML document from ServletContext resource [/WEB-INF/applicationContext.xml] is invalid
12763정성태8/9/202116360Java: 29. java.lang.NullPointerException - com.mysql.jdbc.ConnectionImpl.getServerCharset
12762정성태8/8/202119580Java: 28. IntelliJ - Unable to open debugger port 오류
12761정성태8/8/202116231Java: 27. IntelliJ - java: package javax.inject does not exist [2]
12760정성태8/8/202113005개발 환경 구성: 594. 전용 "Command Prompt for ..." 단축 아이콘 만들기
12759정성태8/8/202117678Java: 26. IntelliJ + Spring Framework + 새로운 Controller 추가 [2]파일 다운로드1
12758정성태8/7/202117091오류 유형: 751. Error assembling WAR: webxml attribute is required (or pre-existing WEB-INF/web.xml if executing in update mode)
12757정성태8/7/202117726Java: 25. IntelliJ + Spring Framework 프로젝트 생성
12756정성태8/6/202115922.NET Framework: 1084. C# - .NET Core Web API 단위 테스트 방법 [1]파일 다운로드1
12755정성태8/5/202115999개발 환경 구성: 593. MSTest - 단위 테스트에 static/instance 유형의 private 멤버 접근 방법파일 다운로드1
12754정성태8/5/202116445오류 유형: 750. manage.py - Your project may not work properly until you apply the migrations for app(s): admin, auth, contenttypes, sessions.
12753정성태8/5/202117408오류 유형: 749. PyCharm - Error: Django is not importable in this environment
12752정성태8/4/202114272개발 환경 구성: 592. JetBrains의 IDE(예를 들어, PyCharm)에서 Visual Studio 키보드 매핑 적용
12751정성태8/4/202117070개발 환경 구성: 591. Windows 10 WSL2 환경에서 docker-compose 빌드하는 방법
12750정성태8/3/202114160디버깅 기술: 181. windbg - 콜 스택의 "Call Site" 오프셋 값이 가리키는 위치
12749정성태8/2/202113658개발 환경 구성: 590. Visual Studio 2017부터 단위 테스트에 DataRow 특성 지원
12748정성태8/2/202114673개발 환경 구성: 589. Azure Active Directory - tenant의 관리자(admin) 계정 로그인 방법
12747정성태8/1/202114919오류 유형: 748. 오류 기록 - MICROSOFT GRAPH – HOW TO IMPLEMENT IAUTHENTICATIONPROVIDER파일 다운로드1
12746정성태7/31/202119684개발 환경 구성: 588. 네트워크 장비 환경을 시뮬레이션하는 Packet Tracer 프로그램 소개
12745정성태7/31/202115244개발 환경 구성: 587. Azure Active Directory - tenant의 관리자 계정 로그인 방법
12744정성태7/30/202115522개발 환경 구성: 586. Azure Active Directory에 연결된 App 목록을 확인하는 방법?
12743정성태7/30/202116783.NET Framework: 1083. Azure Active Directory - 외부 Token Cache 저장소를 사용하는 방법파일 다운로드1
12742정성태7/30/202114743개발 환경 구성: 585. Azure AD 인증을 위한 사용자 인증 유형
12741정성태7/29/202116295.NET Framework: 1082. Azure Active Directory - Microsoft Graph API 호출 방법파일 다운로드1
... 46  [47]  48  49  50  51  52  53  54  55  56  57  58  59  60  ...