Microsoft MVP성태의 닷넷 이야기
.NET Framework: 995. C# - Span<T>와 Memory<T> [링크 복사], [링크+제목 복사],
조회: 26817
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
(연관된 글이 3개 있습니다.)
(시리즈 글이 5개 있습니다.)
.NET Framework: 759. C# - System.Span<T> 성능
; https://www.sysnet.pe.kr/2/0/11535

.NET Framework: 768. BenchmarkDotNet으로 Span<T> 성능 측정
; https://www.sysnet.pe.kr/2/0/11550

.NET Framework: 995. C# - Span<T>와 Memory<T>
; https://www.sysnet.pe.kr/2/0/12475

.NET Framework: 1002. C# - ReadOnlySequence<T> 소개
; https://www.sysnet.pe.kr/2/0/12484

.NET Framework: 1112. C# - .NET 6부터 공개된 ISpanFormattable 사용법
; https://www.sysnet.pe.kr/2/0/12821




C# - Span<T>와 Memory<T>

Span<T>에 대해서는 전에,

C# 7.2 - Span<T>
; https://www.sysnet.pe.kr/2/0/11534

C# - System.Span<T> 성능
; https://www.sysnet.pe.kr/2/0/11535

소개한 적이 있으니, 이번엔 Memory<T>를

Memory<T> Struct
; https://learn.microsoft.com/en-us/dotnet/api/system.memory-1

추가해 설명하겠습니다. 우선 성능을 볼 텐데, (최소 지원 버전인) .NET Framework 4.5 + Nuget System.Memory 4.5.2로 구성해,

using System;
using System.Diagnostics;

namespace ConsoleApp1
{
    class Program
    {
        static void Main(string[] args)
        {
            Action<int, string, Action<byte[]>, byte[]> action = (loopCount, title, work, arg) =>
            {
                Stopwatch st = new Stopwatch();
                st.Start();

                Random rand = new Random(Environment.TickCount);

                for (int i = 0; i < loopCount; i++)
                {
                    work(arg);
                }

                st.Stop();

                Console.WriteLine(title + " : " + st.ElapsedMilliseconds);
            };

            byte[] buf = new byte[1];

            action(1, "touch-JIT", ForLoop, buf);
            action(1, "touch-JIT", MemoryLoop, buf);
            action(1, "touch-JIT", PtrLoop, buf);

            Console.WriteLine();

            buf = new byte[10000];
            action(100000, "ForLoop", ForLoop, buf);
            action(100000, "MemoryLoop", MemoryLoop, buf);
            action(100000, "PtrLoop", PtrLoop, buf);
        }

        static void ForLoop(byte[] buffer)
        {
            int sum = 0;

            for (int i = 0; i < buffer.Length; i++)
            {
                sum += buffer[i];
            }
        }

        static void MemoryLoop(byte[] buffer)
        {
            Memory<byte> memory = buffer;
            int sum = 0;
            for (int i = 0; i < memory.Length; i++)
            {
                sum += memory.Span[i];
            }
        }

        static unsafe void PtrLoop(byte[] buffer)
        {
            int sum = 0;
            fixed (byte* ptr = buffer)
            {
                for (int i = 0; i < buffer.Length; i++)
                {
                    sum += *(ptr + i);
                }
            }
        }
    }
}

실행하면 이런 결과를 얻습니다.

// .NET 4.5 + Release

ForLoop : 708
MemoryLoop : 6822
PtrLoop : 569

// .NET Core 2.1 + Release

ForLoop : 597
MemoryLoop : 6044
PtrLoop : 466

보다시피 Memory<T>의 성능은 일반적인 배열과 비교해 약 10배 정도 느립니다.




하지만, 그렇다고 해서 Memory<T>에 대해 크게 실망할 필요는 없습니다. 왜냐하면, 사실 Memory<T>.Span 속성은 Span<T> 타입인데 이를 가볍게 캐시만 해서 사용하는 코드로 바꾸면,

static int MemorySpanLoop(byte[] buffer)
{
    Memory<byte> memory = buffer;

    Span<byte> span = memory.Span;
    int sum = 0;
    for (int i = 0; i < span.Length; i++)
    {
        sum += span[i];
    }

    return sum;
}

이번엔 다음과 같은 결과를 확인할 수 있습니다.

// .NET 4.5 + Release

ForLoop : 623
MemoryLoop : 6095
MemorySpanLoop : 907
PtrLoop : 434

// .NET Core 2.1 + Release

ForLoop : 540
MemoryLoop : 10770
MemorySpanLoop : 440
PtrLoop : 428

거의 Span<T>와 다름없는 속도입니다.

(결과에서 유추해 보면, 관리 포인터로 인한 혜택은 (907 - 440) 정도의 속도 차이만 나고, 그 외의 성능 손실은 Memory<T>.Span 속성이 단순히 내부의 변수 하나를 반환하는 것이 아닌, 복잡한 코드를 포함하고 있기 때문에 그것 자체의 메서드 처리가 문제였을 것입니다.)




그나저나, Memory<T> 타입과 Span<T> 타입의 차이점이 뭘까요? "C# 7.2 - Span<T>" 글에서 Span은 "ref struct"이기 때문에 스택에만 생성할 수 있다고 했습니다. 즉, 다른 타입의 필드로 Span<T>를 정의할 수 없습니다. 반면, Memory<T>는 그냥 struct이기 때문에 관리 힙에도 위치할 수 있으므로 Span<T>와 같은 제약이 없습니다.

class MyType
{
    // 컴파일 오류
    // Error CS8345 Field or auto-implemented property cannot be of type 'Span<byte>' unless it is an instance member of a ref struct
    public Span<byte> ByteBuffer;

    // 사용 가능
    public Memory<byte> MemoryBuffer;
}

따라서, 사용 원칙은 간단합니다. 1) 평소에는 성능을 위해 Span<T>를 사용하고, 2) 간혹 해당 버퍼를 다른 타입의 필드로 들고 있어야 할 때 Memory<T>를 사용하다가, 3) 다시 그것을 접근해야 할 때는 Span<T>로 캐시해 사용하는 것입니다.

{
    byte[] buffer = new byte[1000];

    MyType type = new MyType();
    type.MemoryBuffer = buffer; // 필드에 들고 있어야 할 때는 Memory<T>로.

    // 그 필드를 다시 사용해야 할 때는 Span<T>로.
    Span<byte> fastBuf = type.MemoryBuffer.Span;

    for (int i = 0; i < fastBuf.Length; i ++)
    {
        // ... 
    }
}

(첨부 파일은 이 글의 예제 코드를 포함합니다.)




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 2/17/2024]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2021-01-05 08시56분
정성태

... 106  107  108  109  110  111  112  113  114  [115]  116  117  118  119  120  ...
NoWriterDateCnt.TitleFile(s)
11139정성태1/22/201726649.NET Framework: 637. C# 개발자를 위한 Win32 DLL export 함수의 호출 규약 (3) - x64 환경의 __fastcall과 Name mangling [1]파일 다운로드1
11138정성태1/20/201725256VS.NET IDE: 113. 프로젝트 생성 시부터 "Enable the Visual Studio hosting process" 옵션을 끄는 방법 - 두 번째 이야기 [3]
11137정성태1/20/201722400Windows: 135. AD에 참여한 컴퓨터로 RDP 연결 시 배경 화면을 못 바꾸는 정책
11136정성태1/20/201722617오류 유형: 375. Hyper-V 내에 구성한 Active Directory 환경의 시간 구성 방법 - 두 번째 이야기
11135정성태1/20/201723153Windows: 134. Windows Server 2016의 작업 표시줄에 있는 시계가 사라졌다면? [1]
11134정성태1/20/201731588.NET Framework: 636. System.Threading.Timer를 이용해 타이머 작업을 할 때 유의할 점 [5]파일 다운로드1
11133정성태1/20/201727452.NET Framework: 635. C# 개발자를 위한 Win32 DLL export 함수의 호출 규약 (2) - x86 환경의 __fastcall [1]파일 다운로드1
11132정성태1/19/201739560.NET Framework: 634. C# 개발자를 위한 Win32 DLL export 함수의 호출 규약 (1) - x86 환경에서의 __cdecl, __stdcall에 대한 Name mangling [1]파일 다운로드1
11131정성태1/13/201728087.NET Framework: 633. C# - IL 코드 분석을 위한 팁 [2]
11130정성태1/11/201729044.NET Framework: 632. x86 실행 환경에서 SECURITY_ATTRIBUTES 구조체를 CreateEvent에 전달할 때 예외 발생파일 다운로드1
11129정성태1/11/201732898.NET Framework: 631. async/await에 대한 "There Is No Thread" 글의 부가 설명 [9]파일 다운로드1
11128정성태1/9/201725646.NET Framework: 630. C# - Interlocked.CompareExchange 사용 예제 [3]파일 다운로드1
11127정성태1/8/201727552기타: 63. (개발자를 위한) Visual Studio의 "with MSDN" 라이선스 설명
11126정성태1/7/201732428기타: 62. Edge 웹 브라우저의 즐겨찾기(Favorites)를 편집/백업/복원하는 방법 [1]파일 다운로드1
11125정성태1/7/201729103개발 환경 구성: 310. IIS - appcmd.exe를 이용해 특정 페이지에 클라이언트 측 인증서를 제출하도록 설정하는 방법
11124정성태1/4/201732379개발 환경 구성: 309. 3년짜리 유효 기간을 제공하는 StartSSL [2]
11123정성태1/3/201727801.NET Framework: 629. .NET Core의 dotnet.exe CLI 명령어 확장 방법 [1]
11122정성태1/3/201725409.NET Framework: 628. TransactionScope에 사용자 정의 트랜잭션을 참여시키는 방법 [2]파일 다운로드1
11121정성태1/1/201723216개발 환경 구성: 308. "ASP.NET Core Web Application (.NET Core)"와 "ASP.NET Core Web Application (.NET Framework)" 차이점
11120정성태12/25/201631338개발 환경 구성: 307. ASP.NET Core Web Application을 IIS에서 호스팅하는 방법
11119정성태12/23/201651516개발 환경 구성: 306. Visual Studio Code에서 Python 개발 환경 구성 [2]
11118정성태12/22/201641408오류 유형: 374. Python 64비트 설치 시 0x80070659 오류 발생 [3]
11117정성태12/21/201626427웹: 35. nopCommerce 예제 사이트 구성 방법
11116정성태12/21/201628715디버깅 기술: 84. NopCommerce의 Autofac 부하(CPU, Memory) [2]
11115정성태12/21/201631625Windows: 133. 윈도우 서버 2016에서 플래시가 동작하지 않는 경우 [2]
11114정성태12/19/201644054Windows: 132. 역슬래시(backslash) 문자가 왜 통화 표기 문자(한글인 경우 "\")로 보일까요? [2]
... 106  107  108  109  110  111  112  113  114  [115]  116  117  118  119  120  ...