Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
(연관된 글이 3개 있습니다.)

C# - 고성능이 필요한 환경에서 GC가 발생하지 않는 네이티브 힙 사용

지난 발표에서,

.NET Conf 2019 Korea - "닷넷 17년의 변화 정리 및 닷넷 코어 3.0" 발표 자료
; https://www.sysnet.pe.kr/2/0/12030

Span을 설명하며 GC를 유발하지 않는 Native Heap 사용법을 소개했습니다.

public unsafe ref struct NativeMemory<T> where T : unmanaged
{
    int _size;
    IntPtr _ptr;

    public NativeMemory(int size)
    {
        _size = size;

        long lSize = _size;
        lSize *= sizeof(T);
                
        IntPtr bufSize = new IntPtr(lSize);
        _ptr = Marshal.AllocHGlobal(bufSize);
    }

    public Span<T> GetView()
    {
        return new Span<T>(_ptr.ToPointer(), _size);
    }

    // C# 8.0에서만 using과 함께 사용 가능
    public void Dispose()
    {
        if (_ptr == IntPtr.Zero)
        {
            return;
        }

        Marshal.FreeHGlobal(_ptr);
        _ptr = IntPtr.Zero;
    }
}

그런데... 정작 PPT에는 설명이 없어 이렇게 글로 남깁니다. ^^




저렇게 Native Heap에 만들어 사용했을 때의 장점이 뭘까요? 우선, 당연한 이야기지만 GC로부터 힙을 할당받지 않았기 때문에 GC의 관리 밖에 있으므로 가비지 컬렉션 동작 시에 아무런 부하를 주지 않는다는 것을 들 수 있습니다.

이런 결과를 비교한 것이 DotNetHistory17.zip에 포함된 예제 코드의 내용인데요, 간단하게 다음과 같이 GC 횟수를 출력하는 스레드를 실행해 두고,

static unsafe void Main(string[] args)
{
    Thread t = new Thread(checkGCFunc);
    t.IsBackground = true;
    t.Start();

    // ...[생략]...
}

private static void checkGCFunc(object obj)
{
    int old = 0;
    int checkCount = 0;

    // 5초마다 화면에 GC 횟수 출력
    while (true)
    {
        int count = 0;

        for (int i = 0; i < GC.MaxGeneration; i++)
        {
            count += GC.CollectionCount(i);
        }

        Console.WriteLine($"{checkCount++} : {(count - old)}");
        old = count;

        Thread.Sleep(5000);
    }
}


GC Heap으로부터 할당받는 다음의 무한 루프 예제를 실행하면,

static unsafe void Main(string[] args)
{
    Thread t = new Thread(checkGCFunc);
    t.IsBackground = true;
    t.Start();

    // 무한 루프를 돌며,
    while (true)
    {
        // GC Heap, 즉 관리 힙으로부터 배열 메모리를 할당
        int[] buf = new int[1024];
        {
            for (int i = 0; i < buf.Length; i++)
            {
                buf[i] = i;
            }
        }
    }
}

화면에는 5초마다 다음과 같은 식으로 GC 횟수가 평균 초당 2,000번 이상 실행되는 것을 확인할 수 있습니다.

0 : 0
1 : 2226
2 : 2149
3 : 2308
4 : 2279
5 : 2289
...

반면, Native Heap으로부터 할당받는 NativeMemory 타입을 활용하면,

// 무한 루프를 돌며,
while (true)
{
    // Native Heap, 즉 비-관리 힙으로부터 배열 메모리 할당
    using (NativeMemory<int> buf = new NativeMemory<int>(1024))
    {
        Span<int> viewBuf = buf.GetView();
        for (int i = 0; i < viewBuf.Length; i++)
        {
            viewBuf[i] = i;
        }
    }
}

5초마다 찍히는 출력에는 GC가 단 한 번도 발생하지 않는 것을 볼 수 있습니다.

0 : 0
1 : 0
2 : 0
3 : 0
...




그런데, 사실 이런 식의 비-관리 메모리를 할당하는 것은 C# 초기 버전에서도 가능했습니다. 어차피 unsafe 문맥에서 포인터 구문이 가능했기 때문인데, 이에 대해서는 예전 글을 통해 설명한 적이 있습니다.

int len = Int32.MaxValue;
IntPtr pBuf = Marshal.AllocCoTaskMem(len); // 비-관리 힙을 할당받아,

byte* ptr = (byte*)pBuf.ToPointer();

int i = 0;
for (i = 0; i < len; i++)
{
    *(ptr + i) = 10; // 배열처럼 접근
}

Console.WriteLine(*(ptr + len - 1));
Console.WriteLine();

Marshal.FreeCoTaskMem(pBuf);

그런데, 위와 같은 식으로 직접 Pointer 연산을 통해 접근하는 것은 자칫 인덱스 접근을 잘못하게 되는 경우 AV(Access Violation) 예외가 발생해 프로세스(EXE)의 비정상 종료 문제를 야기할 수 있습니다.

가령, AllocCoTaskMem으로 1,000 바이트를 할당받았는데 byte * 포인터의 "*ptr + 1001" 연산을 하면 확률(운)에 따라 AV 예외를 접하게 됩니다. 이로 인해 비-관리 메모리는 사실상 "관리 프로세스"의 안전함에 반하므로 가능한 쓰지 않는 것이 일반적이었는데, 이런 문제를 해결한 것이 바로 C# 7.2에 추가된 Span 타입입니다.

C# 7.2 - Span<T>
; https://www.sysnet.pe.kr/2/0/11534

Span 타입은 비-관리 메모리에 대해 관리 포인터를 이용한 안정성을 제공하기 때문에 할당받은 Native Heap의 크기를 벗어나는 연산을 해도,

IntPtr ptr = Marshal.AllocCoTaskMem(1000); // native heap으로부터 메모리를 할당받아,

try
{
    // Span 타입의 도움을 받으면,
    Span<byte> bytes = new Span<byte>(ptr.ToPointer(), size);
    bytes[1000 + 1] = 6; // 할당받은 native heap의 범위를 벗어나 지정해도,
}
catch (System.IndexOutOfRangeException ex) // 안전하게 예외 처리
{
    // "1000 + 1" 접근 시 예외 발생
}
finally
{
    Marshal.FreeCoTaskMem(ptr);
}

안전하게 예외 처리가 됩니다. 따라서 Span 타입의 도입으로 비-관리 메모리를 안전한 영역으로 끌어냈기 때문에 C# 7.2부터는 관리 메모리와 별다른 차이 없이 - 개발자가 원한다면 얼마든지 사용해도 좋은 자원이 된 것입니다.




그나저나, GC Heap을 사용하지 않으니 혹시 gcAllowVeryLargeObjects를 사용하지 않아도,

<gcAllowVeryLargeObjects> Element
; https://learn.microsoft.com/ko-kr/dotnet/framework/configure-apps/file-schema/runtime/gcallowverylargeobjects-element

NativeMemory와 같은 타입이라면 자유로운 배열 크기를 생성할 수 있지 않을까요? 일단 이전 글에서 설명한 것처럼,

닷넷 - 배열 크기의 한계
; https://www.sysnet.pe.kr/2/0/11142

재현 코드)
int arrCount = 0X7FEFFFFF + 1;
int[] intarr1 = new int[arrCount]; // System.OutOfMemoryException: 'Array dimensions exceeded supported range.'

닷넷의 경우 배열 (크기가 아닌) 요소의 한계가 2,146,435,071 (0X7FEFFFFF)로 정해져 있습니다. 아쉽게도 이 한계는 NativeMemory 같은 식의 타입을 사용해 우회해도 극복할 수 없습니다. 왜냐하면 Span의 indexer 코드 자체가 이미 int 값을 인자로 받기 때문에,

public readonly ref struct Span<T>
{
    // ...[생략]...

    public ref T this[int index]
    {
        get
        {
            throw null;
        }
    }

    // ...[생략]...
}

Int32.MaxValue 범위 밖의 요소를 지정할 수 없습니다. 그래도 그나마 위로할 수 있는 것은 0X7FEFFFFF이 아닌 Int32.MaxValue 범위까지 쪼끔 확장되었다는 정도가 되겠습니다.




그런데, 이걸 사용하면 정말 빠를까요? 실제로 간단하게 테스트를 해보면,

class Program
{
    static unsafe void Main(string[] args)
    {
        int bufSize = 1024;

        Action<int> a1 = (count) =>
        {
            while (count-- > 0)
            {
                int[] buf = new int[bufSize];
                buf[0] = 0;
                buf[bufSize - 1] = 0;
            }
        };

        Action<int> a2 = (count) =>
        {
            while (count-- > 0)
            {
                using (NativeMemory<int> buf = new NativeMemory<int>(bufSize))
                {
                    Span<int> viewBuf = buf.GetView();
                    viewBuf[0] = 0;
                    viewBuf[bufSize - 1] = 0;
                }
            }
        };

        Action<int, Action<int>> perfTest = (count, action) =>
        {
            Stopwatch st = new Stopwatch();
            st.Start();
            action(count);
            st.Stop();

            Console.WriteLine(st.ElapsedMilliseconds);
        };

        perfTest(1, a1);
        perfTest(1, a2);

        perfTest(1000000, a1);
        perfTest(1000000, a2);
    }
}

의외로 그냥 GC가 발생하도록 했을 때와 그다지 큰 차이는 없습니다.

[x64 + Release]

관리 힙 = 483
NativeHeap = 102

왜냐하면, 이것은 해당 예제 코드가 그다지 복잡한 상황이 아니어서 2세대 GC까지 수행되지 않으므로 그런 것입니다. 2세대 GC가 발생하도록 위의 예제 코드에서 bufSize = 40960으로 바꾸면 다음과 같은 결과를 얻을 수 있습니다.

[x64 + Release]

관리 힙 = 8848
NativeHeap = 275

관리 힙의 경우 2세대 GC 처리를 동반하면서 9초 가까운 실행 시간이 걸린 반면 비-관리 힙을 사용한 경우 275ms 내에 처리를 끝내고 있습니다. 이 정도면, Game Loop 등과 같은 고속 처리를 요구하는 환경 등에서 써먹으면 꽤나 성능 향상을 기대할 수 있을 것입니다.

(첨부 파일은 이 글의 예제 코드를 포함합니다.)




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 7/7/2023]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




... 31  32  33  34  35  36  37  38  39  40  [41]  42  43  44  45  ...
NoWriterDateCnt.TitleFile(s)
12605정성태4/18/20218734.NET Framework: 1041. C# - AssemblyID, ModuleID를 관리 코드에서 구하는 방법파일 다운로드1
12604정성태4/18/20217431VS.NET IDE: 163. 비주얼 스튜디오 속성 창의 "Build(빌드)" / "Configuration(구성)"에서의 "활성" 의미
12603정성태4/16/20218319VS.NET IDE: 162. 비주얼 스튜디오 - 상속받은 컨트롤이 디자인 창에서 지원되지 않는 문제
12602정성태4/16/20219527VS.NET IDE: 161. x64 DLL 프로젝트의 컨트롤이 Visual Studio의 Designer에서 보이지 않는 문제 [1]
12601정성태4/15/20218611.NET Framework: 1040. C# - REST API 대신 github 클라이언트 라이브러리를 통해 프로그래밍으로 접근
12600정성태4/15/20218800.NET Framework: 1039. C# - Kubeconfig의 token 설정 및 인증서 구성을 자동화하는 프로그램
12599정성태4/14/20219514.NET Framework: 1038. C# - 인증서 및 키 파일로부터 pfx/p12 파일을 생성하는 방법파일 다운로드1
12598정성태4/14/20219616.NET Framework: 1037. openssl의 PEM 개인키 파일을 .NET RSACryptoServiceProvider에서 사용하는 방법 (2)파일 다운로드1
12597정성태4/13/20219706개발 환경 구성: 569. csproj의 내용을 공통 설정할 수 있는 Directory.Build.targets / Directory.Build.props 파일
12596정성태4/12/20219422개발 환경 구성: 568. Windows의 80 포트 점유를 해제하는 방법
12595정성태4/12/20218863.NET Framework: 1036. SQL 서버 - varbinary 타입에 대한 문자열의 CAST, CONVERT 변환을 C# 코드로 구현
12594정성태4/11/20218302.NET Framework: 1035. C# - kubectl 명령어 또는 REST API 대신 Kubernetes 클라이언트 라이브러리를 통해 프로그래밍으로 접근 [1]파일 다운로드1
12593정성태4/10/20219478개발 환경 구성: 567. Docker Desktop for Windows - kubectl proxy 없이 k8s 대시보드 접근 방법
12592정성태4/10/20219285개발 환경 구성: 566. Docker Desktop for Windows - k8s dashboard의 Kubeconfig 로그인 및 Skip 방법
12591정성태4/9/202112538.NET Framework: 1034. C# - byte 배열을 Hex(16진수) 문자열로 고속 변환하는 방법 [2]파일 다운로드1
12590정성태4/9/20219032.NET Framework: 1033. C# - .NET 4.0 이하에서 Console.IsInputRedirected 구현 [1]
12589정성태4/8/202110363.NET Framework: 1032. C# - Environment.OSVersion의 문제점 및 윈도우 운영체제의 버전을 구하는 다양한 방법 [1]
12588정성태4/7/202110952개발 환경 구성: 565. PowerShell - New-SelfSignedCertificate를 사용해 CA 인증서 생성 및 인증서 서명 방법
12587정성태4/6/202111742개발 환경 구성: 564. Windows 10 - ClickOnce 배포처럼 사용할 수 있는 MSIX 설치 파일 [1]
12586정성태4/5/20219429오류 유형: 710. Windows - Restart-Computer / shutdown 명령어 수행 시 Access is denied(E_ACCESSDENIED)
12585정성태4/5/20219207개발 환경 구성: 563. 기본 생성된 kubeconfig 파일의 내용을 새롭게 생성한 인증서로 구성하는 방법
12584정성태4/1/20219888개발 환경 구성: 562. kubeconfig 파일 없이 kubectl 옵션만으로 실행하는 방법
12583정성태3/29/202111408개발 환경 구성: 561. kubectl 수행 시 다른 k8s 클러스터로 접속하는 방법
12582정성태3/29/202110083오류 유형: 709. Visual C++ - 컴파일 에러 error C2059: syntax error: '__stdcall'
12581정성태3/28/202110008.NET Framework: 1031. WinForm/WPF에서 Console 창을 띄워 출력하는 방법 (2) - Output 디버깅 출력을 AllocConsole로 우회 [2]
12580정성태3/28/20218766오류 유형: 708. SQL Server Management Studio - Execution Timeout Expired.
... 31  32  33  34  35  36  37  38  39  40  [41]  42  43  44  45  ...