Microsoft MVP성태의 닷넷 이야기
.NET Framework: 768. BenchmarkDotNet으로 Span<T> 성능 측정 [링크 복사], [링크+제목 복사]
조회: 13386
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 
(연관된 글이 1개 있습니다.)

BenchmarkDotNet으로 Span<T> 성능 측정

BenchmarkDotNet으로,

BenchmarkDotNet 라이브러리 소개
; https://www.sysnet.pe.kr/2/0/11547

(하다 보니 재미있어서) 이번에는 지난 글의 Span 타입의 성능을 다시 측정해 봤습니다. ^^

C# - System.Span<T> 성능
; https://www.sysnet.pe.kr/2/0/11535

Benchmark 소스 코드는 다음과 같은데,

using BenchmarkDotNet.Attributes;
using BenchmarkDotNet.Running;
using System;
using System.Runtime.InteropServices;

namespace spanBenchmark
{
    class Program
    {
        static void Main(string[] args)
        {
            BenchmarkRunner.Run<LoopTest>();
        }
    }

    public class LoopTest
    {
        private byte[] data;

        [Params(1000, 10000)]
        public int N;

        [GlobalSetup]
        public void Setup()
        {
            data = new byte[N];
            new Random(42).NextBytes(data);
        }

        [Benchmark]
        public void ForLoopTest()
        {
            MyLoop.ForLoop(data);
        }

        [Benchmark]
        public void SpanLoopTest()
        {
            MyLoop.SpanLoop(data);
        }

        [Benchmark]
        public void PtrLoopTest()
        {
            MyLoop.PtrLoop(data);
        }
    }


    class MyLoop
    {
        public static int ForLoop(byte[] buffer)
        {
            int sum = 0;

            for (int i = 0; i < buffer.Length; i++)
            {
                sum += buffer[i];
            }

            return sum;
        }

        public static int SpanLoop(byte[] buffer)
        {
            Span<byte> span = buffer;
            int sum = 0;
            for (int i = 0; i < span.Length; i++)
            {
                sum += span[i];
            }
            return sum;
        }

        public static unsafe int PtrLoop(byte[] buffer)
        {
            int sum = 0;

            fixed (byte* ptr = buffer)
            {
                for (int i = 0; i < buffer.Length; i++)
                {
                    sum += *(ptr + i);
                }
            }
            return sum;
        }
    }
}

보는 바와 같이 이번에는 Params와 GlobalSetup 특성도 사용해 봤습니다. ^^ 다음은 그 결과입니다.

// * Summary *

BenchmarkDotNet=v0.10.14, OS=Windows 10.0.17134
Intel Core i5-4670 CPU 3.40GHz (Haswell), 1 CPU, 4 logical and 4 physical cores
.NET Core SDK=2.2.0-preview1-007877
  [Host]     : .NET Core 2.1.0 (CoreCLR 4.6.26515.07, CoreFX 4.6.26515.06), 64bit RyuJIT
  DefaultJob : .NET Core 2.1.0 (CoreCLR 4.6.26515.07, CoreFX 4.6.26515.06), 64bit RyuJIT


       Method |     N |       Mean |     Error |    StdDev |
------------- |------ |-----------:|----------:|----------:|
  ForLoopTest |  1000 |   435.1 ns |  7.530 ns |  8.370 ns |
 SpanLoopTest |  1000 |   447.5 ns |  3.363 ns |  2.808 ns |
  PtrLoopTest |  1000 |   435.2 ns |  3.598 ns |  3.004 ns |
  ForLoopTest | 10000 | 4,300.5 ns | 37.432 ns | 35.013 ns |
 SpanLoopTest | 10000 | 4,416.1 ns | 82.525 ns | 73.156 ns |
  PtrLoopTest | 10000 | 4,296.7 ns | 28.328 ns | 26.498 ns |

Params 특성에 따라 N에 따른 배열의 크기가 1000, 10000인 경우로 나뉘어 측정이 되었습니다. 이번 결과에서도 확인이 되지만 공용 indexer 속성을 통해 제공하는 Span 타입의 액세스가,

Span<byte> span = buffer;
int sum = 0;
for (int i = 0; i < span.Length; i++)
{
    sum += span[i];
}

배열 인스턴스로 다루는 것과 비교해도 밀리지 않는 성능을 보이고 있습니다.




참고로 BenchmarkDotNet은 테스트 이후의 결과물을 \bin\Release\ 폴더 하위에 \BenchmarkDotNet.Artifacts\results 폴더로 csv, html, md 파일 포맷으로 함께 출력해 줍니다.

또한 RPlotExporter 특성을 적용해 주면,

[RPlotExporter]
public class LoopTest
{
    ...[생략]...
}

다양한 그래픽 출력을 해주는 R 스크립트 파일을 \results 폴더에 생성해 줍니다. 이 파일을 실행해 보고 싶다면 다음의 글에 따라 구성을 하면 됩니다.

BenchmarkDotNet에서 생성한 BuildPlots.R 파일을 실행하는 방법
; https://www.sysnet.pe.kr/2/0/11549




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 6/13/2018]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2020-10-07 09시31분
[HelloWorld] 안녕하세요. 글 잘 읽고 갑니다. 해당 내용 기반으로 성능 테스트를 해보니 위와 같은 결과가 나오지 않아서요. 실행환경은 .Net Framework 4.7, WPF Proejct입니다.
저의 경우는 SpanLoopTest의 속도가 2배가까이 느린걸로 나왔네요. 코드는 위와 동일하게 사용했습니다.!

| Method | N | Mean | Error | StdDev |
|------------- |------ |-----------:|---------:|---------:|
| ForLoopTest | 1000 | 311.9 ns | 1.77 ns | 1.66 ns |
| SpanLoopTest | 1000 | 933.4 ns | 4.00 ns | 3.74 ns |
| PtrLoopTest | 1000 | 328.6 ns | 6.33 ns | 7.54 ns |
| ForLoopTest | 10000 | 3,061.8 ns | 15.41 ns | 13.66 ns |
| SpanLoopTest | 10000 | 9,336.1 ns | 72.35 ns | 67.67 ns |
| PtrLoopTest | 10000 | 3,233.0 ns | 41.69 ns | 38.99 ns |
[guest]
2020-10-07 09시56분
(본문에 언급해 두었던) 아래의 글에 이미 설명을 했었습니다.

C# - System.Span<T> 성능
; https://www.sysnet.pe.kr/2/0/11535
정성태

[1]  2  3  4  5  6  7  8  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
13602정성태4/20/2024213닷넷: 2244. C# - PCM 오디오 데이터를 연속(Streaming) 재생 (Windows Multimedia)파일 다운로드1
13601정성태4/19/2024252닷넷: 2243. C# - PCM 사운드 재생(NAudio)파일 다운로드1
13600정성태4/18/2024298닷넷: 2242. C# - 관리 스레드와 비관리 스레드
13599정성태4/17/2024385닷넷: 2241. C# - WAV 파일의 PCM 사운드 재생(Windows Multimedia)파일 다운로드1
13598정성태4/16/2024412닷넷: 2240. C# - WAV 파일 포맷 + LIST 헤더파일 다운로드2
13597정성태4/15/2024478닷넷: 2239. C# - WAV 파일의 PCM 데이터 생성 및 출력파일 다운로드1
13596정성태4/14/2024831닷넷: 2238. C# - WAV 기본 파일 포맷파일 다운로드1
13595정성태4/13/2024963닷넷: 2237. C# - Audio 장치 열기 (Windows Multimedia, NAudio)파일 다운로드1
13594정성태4/12/20241029닷넷: 2236. C# - Audio 장치 열람 (Windows Multimedia, NAudio)파일 다운로드1
13593정성태4/8/20241051닷넷: 2235. MSBuild - AccelerateBuildsInVisualStudio 옵션
13592정성태4/2/20241209C/C++: 165. CLion으로 만든 Rust Win32 DLL을 C#과 연동
13591정성태4/2/20241169닷넷: 2234. C# - WPF 응용 프로그램에 Blazor App 통합파일 다운로드1
13590정성태3/31/20241073Linux: 70. Python - uwsgi 응용 프로그램이 k8s 환경에서 OOM 발생하는 문제
13589정성태3/29/20241143닷넷: 2233. C# - 프로세스 CPU 사용량을 나타내는 성능 카운터와 Win32 API파일 다운로드1
13588정성태3/28/20241197닷넷: 2232. C# - Unity + 닷넷 App(WinForms/WPF) 간의 Named Pipe 통신파일 다운로드1
13587정성태3/27/20241157오류 유형: 900. Windows Update 오류 - 8024402C, 80070643
13586정성태3/27/20241304Windows: 263. Windows - 복구 파티션(Recovery Partition) 용량을 늘리는 방법
13585정성태3/26/20241096Windows: 262. PerformanceCounter의 InstanceName에 pid를 추가한 "Process V2"
13584정성태3/26/20241050개발 환경 구성: 708. Unity3D - C# Windows Forms / WPF Application에 통합하는 방법파일 다운로드1
13583정성태3/25/20241158Windows: 261. CPU Utilization이 100% 넘는 경우를 성능 카운터로 확인하는 방법
13582정성태3/19/20241421Windows: 260. CPU 사용률을 나타내는 2가지 수치 - 사용량(Usage)과 활용률(Utilization)파일 다운로드1
13581정성태3/18/20241589개발 환경 구성: 707. 빌드한 Unity3D 프로그램을 C++ Windows Application에 통합하는 방법
13580정성태3/15/20241138닷넷: 2231. C# - ReceiveTimeout, SendTimeout이 적용되지 않는 Socket await 비동기 호출파일 다운로드1
13579정성태3/13/20241494오류 유형: 899. HTTP Error 500.32 - ANCM Failed to Load dll
13578정성태3/11/20241631닷넷: 2230. C# - 덮어쓰기 가능한 환형 큐 (Circular queue)파일 다운로드1
[1]  2  3  4  5  6  7  8  9  10  11  12  13  14  15  ...