Microsoft MVP성태의 닷넷 이야기
.NET Framework: 759. C# - System.Span<T> 성능 [링크 복사], [링크+제목 복사],
조회: 15079
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 
(연관된 글이 3개 있습니다.)

C# - System.Span<T> 성능

지난 글에서 설명한,

C# 7.2 - Span<T>
; https://www.sysnet.pe.kr/2/0/11534

Span<T>의 재미있는 점이 바로 성능입니다. 비관리 메모리에 대한 뷰를 제공하면서도 성능 손실이 거의 없도록 만들어졌다는 특징이 있는데요, 이에 대해 "C# - All About Span: Exploring a New .NET Mainstay" 글에서 .NET Runtime이 Span을 특별히 대우해 효율적인 기계어 코드를 생성하는 것에 대한 설명이 실려 있습니다.

그럼 테스트를 해볼까요? ^^

.NET Framework 4.7.2 + NuGet System.Memory + Release로 구성한 프로젝트에서 다음의 코드를,

using System;
using System.Diagnostics;

namespace ConsoleApp1
{
    class Program
    {
        static void Main(string[] args)
        {
            Action<int, string, Action<byte[]>, byte[]> action = (loopCount, title, work, arg) =>
            {
                Stopwatch st = new Stopwatch();
                st.Start();

                Random rand = new Random(Environment.TickCount);

                for (int i = 0; i < loopCount; i++)
                {
                    work(arg);
                }

                st.Stop();

                Console.WriteLine(title + " : " + st.ElapsedMilliseconds);
            };

            byte[] buf = new byte[1];

            action(1, "touch-JIT", ForLoop, buf);
            action(1, "touch-JIT", SpanLoop, buf);
            action(1, "touch-JIT", PtrLoop, buf);

            Console.WriteLine();

            buf = new byte[10000];
            action(100000, "ForLoop", ForLoop, buf);
            action(100000, "SpanLoop", SpanLoop, buf);
            action(100000, "PtrLoop", PtrLoop, buf);
        }

        static void ForLoop(byte[] buffer)
        {
            int sum = 0;

            for (int i = 0; i < buffer.Length; i++)
            {
                sum += buffer[i];
            }
        }

        static void SpanLoop(byte[] buffer)
        {
            Span<byte> span = buffer;
            int sum = 0;
            for (int i = 0; i < span.Length; i++)
            {
                sum += span[i];
            }
        }

        static unsafe void PtrLoop(byte[] buffer)
        {
            int sum = 0;
            fixed (byte* ptr = buffer)
            {
                for (int i = 0; i < buffer.Length; i++)
                {
                    sum += *(ptr + i);
                }
            }
        }
    }
}

3회 수행하면 결과가 대략 이렇게 나옵니다.

[.NET Framework 4.7.2 + NuGet System.Memory - Release]

ForLoop : 439
SpanLoop : 1311
PtrLoop : 408

ForLoop : 420
SpanLoop : 1237
PtrLoop : 398

ForLoop : 428
SpanLoop : 1253
PtrLoop : 424

아니, 빠르다면서요? 이게 어떻게 된 일입니까? 왜냐하면 아직 .NET Framework 4.7.2의 Runtime에는 Span 타입을 위한 최적화 코드가 들어가 있지 않기 때문입니다. 그냥 기존 런타임에 Span 타입을 담은 어셈블리로 테스트한 것에 불과하고 indexer 프로퍼티로 접근하는 부가 동작 때문에 더 느리게 됩니다.




반면 동일한 코드를 .NET Core 2.1 런타임에서 수행하면,

Announcing .NET Core 2.1
; https://devblogs.microsoft.com/dotnet/announcing-net-core-2-1/

결과가 달라집니다. (현재 15.7.3 기준으로) Visual Studio 2017에서 실습하려면 .NET Core 2.1 SDK를 다운로드해야 합니다.

.NET Core 2.1 SDK - x64/x86
; https://www.microsoft.com/net/download/windows

설치 후 .NET Core 프로젝트의 설정 창에서 다음과 같이 2.1로 변경하고,

span_core_1.png

위에서 테스트한 Span 코드를 동일하게 수행하면 3회 수행 시 다음과 같습니다.

[.NET Core 2.1 - Release]

ForLoop : 463
SpanLoop : 439
PtrLoop : 594

ForLoop : 456
SpanLoop : 440
PtrLoop : 593

ForLoop : 479
SpanLoop : 440
PtrLoop : 593

미세하지만 빠르기까지 한데요, 어쨌든 "뷰"를 제공함에도 불구하고 성능 손실이 없어졌습니다. 따라서 이런 성능과 함께 관리 힙 메모리 할당을 줄이는 코드를 점차 적용한다면 기존 응용 프로그램의 성능을 좀 더 높일 수 있게 될 것입니다.

실제로 .NET Core 2.1의 BCL에는 Span 등의 사용을 통해 성능 개선을 했다는 내용을 다음의 글에서 소개하고 있습니다.

Performance Improvements in .NET Core 2.1
; https://devblogs.microsoft.com/dotnet/performance-improvements-in-net-core-2-1/




참고로, .NET Core 2.0 응용 프로그램을 빌드/배포하는 경우 생성되는 System.Private.CoreLib.dll을 보면 Span 타입이 public으로 구현되어 있지만 mscorlib.dll에서 [assembly: TypeForwardedTo(typeof(...))]로 노출되어 있지 않기 때문에 사용할 수가 없습니다.

대신, Reflection을 이용하면 System.Span을 구할 수는 있습니다.

using System;
using System.Reflection;

class Program
{
    static void Main(string[] args)
    {
        Assembly asm = Assembly.GetAssembly(typeof(Activator));
        Console.WriteLine(asm.FullName);

        foreach (Type type in asm.GetTypes())
        {
            if (type.FullName == "System.Span`1")
            {
                Console.WriteLine("System.Span<T>: Found");
                return;
            }
        }

        {
            // CS0246 The type or namespace name 'Span<>' could not be found (are you missing a using directive or an assembly reference?)
            // Span<byte> t;
        }
    }
}

또한 .NET Framework + NuGet System.Memory 4.0.1.0으로 테스트한 결과가 느린 것에는 Span 타입의 구현이 코드 호환을 위해 구색만 맞춘 탓도 있습니다.

[StructLayout(LayoutKind.Sequential), IsByRefLike, Obsolete("Types with embedded references are not supported in this version of your compiler.", true), IsReadOnly, DebuggerTypeProxy((Type) typeof(SpanDebugView<>)), DebuggerDisplay("{ToString(),raw}"), DebuggerTypeProxy((Type) typeof(SpanDebugView<>)), DebuggerDisplay("{ToString(),raw}")]
public struct Span<T>
{
    private readonly Pinnable<T> _pinnable;
    private readonly IntPtr _byteOffset;
    private readonly int _length;
    public int Length { get; }

    ...[생략]... 
}

반면, ".NET Core 2.1의 "System.Private.CoreLib.dll"에는 "C# - All About Span: Exploring a New .NET Mainstay" 글에서 소개한 대로 정확하게 "제네릭 인자의 참조" 타입으로 구현하고 있습니다.

[StructLayout(LayoutKind.Sequential), IsByRefLike, NonVersionable, DebuggerDisplay("{ToString(),raw}"), DebuggerTypeProxy(typeof(SpanDebugView<>)), Obsolete("Types with embedded references are not supported in this version of your compiler.", true), DebuggerTypeProxy(typeof(SpanDebugView<>)), IsReadOnly, DebuggerDisplay("{ToString(),raw}")]
public struct Span<T>
{
    internal readonly ByReference<T> _pointer;
    private readonly int _length;
    public int Length { [NonVersionable] get; }

    ...[생략]... 
}
 

[StructLayout(LayoutKind.Sequential), IsByRefLike, NonVersionable, Obsolete("Types with embedded references are not supported in this version of your compiler.", true)]
internal struct ByReference<T>
{
    private IntPtr _value;
    public ByReference(ref T value);
    public ref T Value { get; }
}




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 7/13/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2018-06-13 02시38분
BenchmarkDotNet으로 Span<T> 성능 측정
; http://www.sysnet.pe.kr/2/0/11550
정성태

... 46  47  48  49  50  51  52  53  54  55  56  57  58  59  [60]  ...
NoWriterDateCnt.TitleFile(s)
12133정성태2/5/202010686디버깅 기술: 161. Windbg 환경에서 확인해 본 .NET 메서드 JIT 컴파일 전과 후 - 두 번째 이야기
12132정성태1/28/202012252.NET Framework: 883. C#으로 구현하는 Win32 API 후킹(예: Sleep 호출 가로채기)파일 다운로드1
12131정성태1/27/202012319개발 환경 구성: 467. LocaleEmulator를 이용해 유니코드를 지원하지 않는(한글이 깨지는) 프로그램을 실행하는 방법 [1]
12130정성태1/26/20209795VS.NET IDE: 142. Visual Studio에서 windbg의 "Open Executable..."처럼 EXE를 직접 열어 디버깅을 시작하는 방법
12129정성태1/26/202015333.NET Framework: 882. C# - 키움 Open API+ 사용 시 Registry 등록 없이 KHOpenAPI.ocx 사용하는 방법 [3]
12128정성태1/26/202010130오류 유형: 591. The code execution cannot proceed because mfc100.dll was not found. Reinstalling the program may fix this problem.
12127정성태1/25/202010019.NET Framework: 881. C# DLL에서 제공하는 Win32 export 함수의 내부 동작 방식(VT Fix up Table)파일 다운로드1
12126정성태1/25/202010826.NET Framework: 880. C# - PE 파일로부터 IMAGE_COR20_HEADER 및 VTableFixups 테이블 분석파일 다운로드1
12125정성태1/24/20208698VS.NET IDE: 141. IDE0019 - Use pattern matching
12124정성태1/23/202010530VS.NET IDE: 140. IDE1006 - Naming rule violation: These words must begin with upper case characters: ...
12123정성태1/23/202011997웹: 39. Google Analytics - gtag 함수를 이용해 페이지 URL 수정 및 별도의 이벤트 생성 방법 [2]
12122정성태1/20/20208987.NET Framework: 879. C/C++의 UNREFERENCED_PARAMETER 매크로를 C#에서 우회하는 방법(IDE0060 - Remove unused parameter '...')파일 다운로드1
12121정성태1/20/20209578VS.NET IDE: 139. Visual Studio - Error List: "Could not find schema information for the ..."파일 다운로드1
12120정성태1/19/202011011.NET Framework: 878. C# DLL에서 Win32 C/C++처럼 dllexport 함수를 제공하는 방법 - 네 번째 이야기(IL 코드로 직접 구현)파일 다운로드1
12119정성태1/17/202011019디버깅 기술: 160. Windbg 확장 DLL 만들기 (3) - C#으로 만드는 방법
12118정성태1/17/202011671개발 환경 구성: 466. C# DLL에서 Win32 C/C++처럼 dllexport 함수를 제공하는 방법 - 세 번째 이야기 [1]
12117정성태1/15/202010652디버깅 기술: 159. C# - 디버깅 중인 프로세스를 강제로 다른 디버거에서 연결하는 방법파일 다운로드1
12116정성태1/15/202011133디버깅 기술: 158. Visual Studio로 디버깅 시 sos.dll 확장 명령어를 (비롯한 windbg의 다양한 기능을) 수행하는 방법
12115정성태1/14/202010894디버깅 기술: 157. C# - PEB.ProcessHeap을 이용해 디버깅 중인지 확인하는 방법파일 다운로드1
12114정성태1/13/202012768디버깅 기술: 156. C# - PDB 파일로부터 심벌(Symbol) 및 타입(Type) 정보 열거 [1]파일 다운로드3
12113정성태1/12/202013380오류 유형: 590. Visual C++ 빌드 오류 - fatal error LNK1104: cannot open file 'atls.lib' [1]
12112정성태1/12/20209980오류 유형: 589. PowerShell - 원격 Invoke-Command 실행 시 "WinRM cannot complete the operation" 오류 발생
12111정성태1/12/202013226디버깅 기술: 155. C# - KernelMemoryIO 드라이버를 이용해 실행 프로그램을 숨기는 방법(DKOM: Direct Kernel Object Modification) [16]파일 다운로드1
12110정성태1/11/202011820디버깅 기술: 154. Patch Guard로 인해 블루 스크린(BSOD)가 발생하는 사례 [5]파일 다운로드1
12109정성태1/10/20209737오류 유형: 588. Driver 프로젝트 빌드 오류 - Inf2Cat error -2: "Inf2Cat, signability test failed."
12108정성태1/10/20209749오류 유형: 587. Kernel Driver 시작 시 127(The specified procedure could not be found.) 오류 메시지 발생
... 46  47  48  49  50  51  52  53  54  55  56  57  58  59  [60]  ...