Microsoft MVP성태의 닷넷 이야기
.NET Framework: 997. C# - ArrayPool<T> 소개 [링크 복사], [링크+제목 복사],
조회: 11450
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
(연관된 글이 1개 있습니다.)
(시리즈 글이 4개 있습니다.)
.NET Framework: 997. C# - ArrayPool<T> 소개
; https://www.sysnet.pe.kr/2/0/12478

.NET Framework: 999. C# - ArrayPool<T>와 MemoryPool<T> 소개
; https://www.sysnet.pe.kr/2/0/12480

.NET Framework: 1124. C# - .NET Platform Extension의 ObjectPool<T> 사용법 소개
; https://www.sysnet.pe.kr/2/0/12893

.NET Framework: 1125. C# - DefaultObjectPool<T>의 IDisposable 개체에 대한 풀링 문제
; https://www.sysnet.pe.kr/2/0/12894




C# - ArrayPool<T> 소개

이미 ArrayPool<T>에 대해 다음과 같은 훌륭한 글이 있지만, ^^

Pooling large arrays with ArrayPool
; https://adamsitnik.com/Array-Pool/

그래도 대충 정리를 해보겠습니다.




우선 기본적인 사용법은 Pool에서 배열을 받아오고/반환하는 절차로 이뤄집니다.

// .NET Core

byte[] buffer = ArrayPool<byte>.Shared.Rent(1024);
Console.WriteLine($"buffer[0] == {buffer[0]}"); // buffer[0] == 0
ArrayPool<byte>.Shared.Return(buffer);

주의해야 할 점은, 기본적으로는 반환한 버퍼가 그대로 재사용되므로,

byte[] buffer = ArrayPool<byte>.Shared.Rent(1024);
Console.WriteLine($"buffer[0] == {buffer[0]}"); // buffer[0] == 0
buffer[0] = 5;
ArrayPool<byte>.Shared.Return(buffer);

buffer = ArrayPool<byte>.Shared.Rent(1024);
Console.WriteLine($"buffer[0] == {buffer[0]}"); // buffer[0] == 5

이전 데이터가 남아 있어 일반적인 new 할당과는 달리 0 초기화를 기대해서는 안 됩니다. 아니면, 반환할 때 명시적으로 초기화를 시키는 옵션을 줘야 합니다.

byte[] buffer = ArrayPool<byte>.Shared.Rent(1024);
Console.WriteLine($"buffer[0] == {buffer[0]}"); // buffer[0] == 0
buffer[0] = 5;
ArrayPool<byte>.Shared.Return(buffer, /* clearArray: */ true);

buffer = ArrayPool<byte>.Shared.Rent(1024);
Console.WriteLine($"buffer[0] == {buffer[0]}"); // buffer[0] == 0

위의 상황을 좀 더 확대 해석해 보면, Rent로 얻은 버퍼를 Return 후에 사용하지 않도록 주의해야 합니다. Pool이라는 성격상 참조 그대로 살아 있고 재사용하는 유형이기 때문에 그런 실수를 하게 된다면,

byte[] buffer = ArrayPool<byte>.Shared.Rent(1024);
Console.WriteLine($"buffer[0] == {buffer[0]}"); // buffer[0] == 0
ArrayPool<byte>.Shared.Return(buffer, /* clearArray: */ true);

buffer[0] = 5; /* 혹은 buffer를 향후 지속되는 개체에 전달했다거나 */

buffer = ArrayPool<byte>.Shared.Rent(1024);
Console.WriteLine($"buffer[0] == {buffer[0]}"); // buffer[0] == 5

런타임 시에 원인을 추적하기 힘든 오류로 발전할 여지가 있습니다.




요구 크기에 대한 구획을 나누기 때문에,

// System.Buffers.Utilities.SelectBucketIndex

internal static int SelectBucketIndex(int bufferSize)
{
    uint value = (uint)(bufferSize - 1) >> 4;
    return 32 - BitOperations.LeadingZeroCount(value);
}

(내부 구현이므로 향후 바뀔 수 있지만) 512 바이트 구간에 대해서는 같은 버퍼를 반환하므로,

byte[] buffer = ArrayPool<byte>.Shared.Rent(1000);
Console.WriteLine(buffer.Length); // 출력 결과 1024

buffer = ArrayPool<byte>.Shared.Rent(513);
Console.WriteLine(buffer.Length); // 출력 결과 1024

buffer = ArrayPool<byte>.Shared.Rent(512);
Console.WriteLine(buffer.Length); // 출력 결과 512

Rent 메서드로 요청한 크기에 정확히 일치하는 버퍼가 반환된다고 가정해서는 안 됩니다.




기본 CLR 스레드 풀을 사용하지 않고 별도로 정의할 수 있는 요구가 있는 것처럼,

분리된 ThreadPool 사용 - Smart Thread Pool
; https://www.sysnet.pe.kr/2/0/986

ArrayPool도 그럴 수 있는데요, 다행히 이것은 해당 타입 내에서 기능을 제공하고 있습니다.

// Shared가 아닌, 새로운 ArrayPool을 생성
ArrayPool<byte> newPool = ArrayPool<byte>.Create();

byte [] buffer = newPool.Rent(1000);
newPool.Return(buffer);

재미있는 점은, Shared의 Pool 관리를 담당하는 타입과 Create의 Pool 관리를 담당하는 타입이 다르다는 점입니다.

static ArrayPool()
{
    ArrayPool<T>.s_shared = new TlsOverPerCoreLockedStacksArrayPool<T>();
}

public static ArrayPool<T> Create()
{
    return new ConfigurableArrayPool<T>();
}

이름에서 유추할 수 있지만 Shared의 경우 TLS 성격을 갖기 때문에 Shared로 접근하는 스레드 별로 관리 개체가 생성되므로 Rent/Return 호출 시에 별도의 lock이 필요 없습니다. 반면 ConfigurableArrayPool의 경우 단독 개체가 생성되는 것이고 thread-safe을 보장하기 위해 Rent/Return 내부에서 lock이 사용되므로 약간의 성능 손실이 발생합니다.




"Pooling large arrays with ArrayPool" 글에 보면, 마지막 즈음에 Pool 관련한 ETW Event Provider를 소개하고 있습니다. 그렇다면, 지난 글의 in-proc 모니터링을,

C# - (.NET Core 2.2부터 가능한) 프로세스 내부에서 CLR ETW 이벤트 수신
; https://www.sysnet.pe.kr/2/0/12474

다음과 같이 간단하게 접목해 볼 수 있습니다. ^^

// .NET Core 2.2

using System;
using System.Buffers;
using System.Diagnostics.Tracing;
using System.Threading;

namespace ConsoleApp2
{
    class Program
    {
        static MyEventListener listener = new MyEventListener();

        static void Main(string[] args)
        {
            Console.WriteLine($"{Thread.CurrentThread.ManagedThreadId}");
            byte[] buffer = ArrayPool<byte>.Shared.Rent(1024);
        }
    }
}

internal class MyEventListener : EventListener
{
    protected override void OnEventSourceCreated(EventSource eventSource)
    {
        base.OnEventSourceCreated(eventSource);

        if (eventSource.Name == "System.Buffers.ArrayPoolEventSource")
        {
            EnableEvents(eventSource, EventLevel.Informational);
        }
    }

    protected override void OnEventWritten(EventWrittenEventArgs eventData)
    {
        int tid = Thread.CurrentThread.ManagedThreadId;

        if (eventData.EventName == "BufferAllocated")
        {
            Console.WriteLine($"{tid} {eventData.EventName}");
        }
    }
}

/* 출력 결과
1
1 BufferAllocated
*/

(결과를 보면, Main 메서드를 실행하는 스레드와 OnEventWritten 메서드를 실행되는 스레드가 동일하다는 것에서 실시간 호출임을 짐작게 합니다.)




그런데, Rent 후 Return을 하지 않으면 어떻게 될까요?

ArrayPool의 내부 구현이 WeakReference 같은 타입을 사용한 Cache 형식이 아닌, 단순히 일정 수의 버퍼를 할당해 보관해 놓는 것이므로 Return을 하지 않으면 쌓이게 되어 있습니다.

따라서, 기본 구현에 따라,

public override T[] Rent(int minimumLength)
{
    // ...[생략]...
    int num = Utilities.SelectBucketIndex(minimumLength);
    T[] array;
    if (num < this._buckets.Length)
    {
        int num2 = num;
        while (true)
        {
            array = this._buckets[num2].Rent();
            if (array != null)
            {
                break;
            }
            if (++num2 >= this._buckets.Length || num2 == num + 2)
            {
                goto IL_86;
            }
        }
        // ...[생략]...
        return array;
        IL_86:
        array = new T[this._buckets[num]._bufferLength];
    }
    else
    {
        array = new T[minimumLength];
    }

    // ...[생략]...
    return array;
}

Rent를 원하는 크기의 Bucket에 여유가 없으면 한 단계 큰 Bucket에서 다시 여유가 있는지 확인하고, 그래도 없으면 Pool이 관리하지 않는 새로운 버퍼를 할당해 반환해 버립니다. 따라서 일반적으로 우리가 알고 있는 DB 연결 풀이나 스레드 풀처럼 Free 자원이 고갈되었을 때 대기를 하는 것과는 달리 (어느 정도 Pool의 bucket 크기에 따라 leak이 발생하지만) 전체적으로 동작하는 데에는 영향을 주지 않습니다.

실제로 ETW 이벤트를 활용해 이런 상황을 테스트해 볼까요? ^^

using System;
using System.Buffers;
using System.Diagnostics.Tracing;
using System.Threading;

namespace ConsoleApp2
{
    class Program
    {
        static MyEventListener listener = new MyEventListener();

        static ArrayPool<byte> _q = ArrayPool<byte>.Create(8192 * 4, 5); // 구간 별 최대 크기 5

        static void Main(string[] args)
        {
            Console.WriteLine($"Main TID: {Thread.CurrentThread.ManagedThreadId}");

            for (int i = 0; i < 12; i++)
            {
                byte[] buffer = _q.Rent(4000);
                Console.WriteLine($", BufferLen: {buffer.Length}");
            }
        }
    }
}

internal class MyEventListener : EventListener
{
    protected override void OnEventSourceCreated(EventSource eventSource)
    {
        Console.WriteLine(eventSource);
        base.OnEventSourceCreated(eventSource);

        if (eventSource.Name == "System.Buffers.ArrayPoolEventSource")
        {
            EnableEvents(eventSource, EventLevel.Informational);
        }
    }

    protected override void OnEventWritten(EventWrittenEventArgs eventData)
    {
        int tid = Thread.CurrentThread.ManagedThreadId;

        if (eventData.EventName == "BufferAllocated")
        {
            if (eventData.PayloadNames.Contains("reason") == true)
            {
                BufferAllocatedReason reason = (BufferAllocatedReason)eventData.Payload[4];
                Console.Write($"OnEventWritten TID: {tid}, {eventData.EventName}, {reason}");
            }
        }
    }

    internal enum BufferAllocatedReason
    {
        Pooled,
        OverMaximumSize,
        PoolExhausted
    }
}

(쉬운 테스트를 위해) 크기 별 최대 보관 수가 5인 ArrayPool을 만들었고, 4000 바이트의 버퍼를 12번 요구한 출력 결과는 다음과 같습니다.

OnEventWritten TID: 1, BufferAllocated, Pooled, BufferLen: 4096
OnEventWritten TID: 1, BufferAllocated, Pooled, BufferLen: 4096
OnEventWritten TID: 1, BufferAllocated, Pooled, BufferLen: 4096
OnEventWritten TID: 1, BufferAllocated, Pooled, BufferLen: 4096
OnEventWritten TID: 1, BufferAllocated, Pooled, BufferLen: 4096
OnEventWritten TID: 1, BufferAllocated, Pooled, BufferLen: 8192
OnEventWritten TID: 1, BufferAllocated, Pooled, BufferLen: 8192
OnEventWritten TID: 1, BufferAllocated, Pooled, BufferLen: 8192
OnEventWritten TID: 1, BufferAllocated, Pooled, BufferLen: 8192
OnEventWritten TID: 1, BufferAllocated, Pooled, BufferLen: 8192
OnEventWritten TID: 1, BufferAllocated, PoolExhausted, BufferLen: 4096
OnEventWritten TID: 1, BufferAllocated, PoolExhausted, BufferLen: 4096

보다시피, 4096 바이트로 5번, 8192 바이트로 5번을 반환받은 후부터는 PoolExhausted로 나오고 있습니다. (세부적인 규칙은 바뀔 수 있으므로 이에 가정한 코딩을 해서는 안 됩니다.)

(PoolExhausted 상태에서도 4000 바이트 요구에 대해 굳이 Pool의 규격에 맞게 4096 바이트를 할당해 반환한다는 점도 재미있습니다. ^^)




.NET Framework의 경우 ArrayPool 타입이 기본 BCL에 없으므로,

ArrayPool Class
; https://learn.microsoft.com/en-us/dotnet/api/system.buffers.arraypool-1

최소 요구 사항: .NET 5.0, .NET Core 1.0, .NET Standard 2.1

Nuget에서 제공하는 별도 라이브러리를 참조해야 합니다.

System.Buffers
; https://www.nuget.org/packages/System.Buffers/
(.NET Framework 4.5부터 참조 가능합니다.)
Install-Package System.Buffers

이하 사용법은 .NET Core의 것과 동일합니다.




(첨부 파일은 이 글의 예제 코드를 포함합니다.)




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 12/9/2023]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




... 31  32  [33]  34  35  36  37  38  39  40  41  42  43  44  45  ...
NoWriterDateCnt.TitleFile(s)
12813정성태8/29/20218997.NET Framework: 1109. C# 10 - (11) Lambda 개선파일 다운로드1
12812정성태8/28/20218624.NET Framework: 1108. C# 10 - (10) 개선된 #line 지시자
12811정성태8/27/20218861Linux: 44. 윈도우 개발자를 위한 리눅스 fork 동작 방식 설명 (파이썬 코드)
12810정성태8/27/20217651.NET Framework: 1107. .NET Core/5+에서 동적 컴파일한 C# 코드를 (Breakpoint도 활용하며) 디버깅하는 방법 - #line 지시자파일 다운로드1
12809정성태8/26/20218321.NET Framework: 1106. .NET Core/5+에서 C# 코드를 동적으로 컴파일/사용하는 방법 [1]파일 다운로드1
12808정성태8/25/20219527오류 유형: 758. go: ...: missing go.sum entry; to add it: go mod download ...
12807정성태8/25/20219507.NET Framework: 1105. C# 10 - (9) 비동기 메서드가 사용할 AsyncMethodBuilder 선택 가능파일 다운로드1
12806정성태8/24/20217120개발 환경 구성: 601. PyCharm - 다중 프로세스 디버깅 방법
12805정성태8/24/20218376.NET Framework: 1104. C# 10 - (8) 분해 구문에서 기존 변수의 재사용 가능파일 다운로드1
12804정성태8/24/20219114.NET Framework: 1103. C# 10 - (7) Source Generator V2 APIs
12803정성태8/23/20218820개발 환경 구성: 600. pip cache 디렉터리 옮기는 방법
12802정성태8/23/20219047.NET Framework: 1102. .NET Conf Mini 21.08 - WinUI 3 따라해 보기 [1]
12801정성태8/23/20218588.NET Framework: 1101. C# 10 - (6) record class 타입의 ToString 메서드를 sealed 처리 허용파일 다운로드1
12800정성태8/22/20218769개발 환경 구성: 599. PyCharm - (반대로) 원격 프로세스가 PyCharm에 디버그 연결하는 방법
12799정성태8/22/20218802.NET Framework: 1100. C# 10 - (5) 속성 패턴의 개선파일 다운로드1
12798정성태8/21/202110174개발 환경 구성: 598. PyCharm - 원격 프로세스를 디버그하는 방법
12797정성태8/21/20217894Windows: 197. TCP의 MSS(Maximum Segment Size) 크기는 고정된 것일까요?
12796정성태8/21/20218560.NET Framework: 1099. C# 10 - (4) 상수 문자열에 포맷 식 사용 가능파일 다운로드1
12795정성태8/20/20219199.NET Framework: 1098. .NET 6에 포함된 신규 BCL API - 스레드 관련
12794정성태8/20/20218650스크립트: 23. 파이썬 - WSGI를 만족하는 최소한의 구현 코드 및 PyCharm에서의 디버깅 방법 [1]
12793정성태8/20/20219321.NET Framework: 1097. C# 10 - (3) 개선된 변수 초기화 판정파일 다운로드1
12792정성태8/19/20219795.NET Framework: 1096. C# 10 - (2) 전역 네임스페이스 선언파일 다운로드1
12791정성태8/19/20218106.NET Framework: 1095. C# COM 개체를 C++에서 사용하는 예제 [3]파일 다운로드1
12790정성태8/18/202110293.NET Framework: 1094. C# 10 - (1) 구조체를 생성하는 record struct파일 다운로드1
12789정성태8/18/20219383개발 환경 구성: 597. PyCharm - 윈도우 환경에서 WSL을 이용해 파이썬 앱 개발/디버깅하는 방법
12788정성태8/17/20217908.NET Framework: 1093. C# - 인터페이스의 메서드가 다형성을 제공할까요? (virtual일까요?)파일 다운로드1
... 31  32  [33]  34  35  36  37  38  39  40  41  42  43  44  45  ...