Microsoft MVP성태의 닷넷 이야기
.NET Framework: 2095. C# - .NET5부터 도입된 CollectionsMarshal [링크 복사], [링크+제목 복사],
조회: 12157
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 

C# - .NET5부터 도입된 CollectionsMarshal

좋은 글이 있어서 소개합니다. ^^

[C#]CollectionsMarshal の解説
; https://zenn.dev/naminodarie/articles/a950920fe7d1a5

[번역글] CollectionsMarshal 해설
; https://docs.google.com/document/u/1/d/e/2PACX-1vSFmjP4qYtzJi01fpXjuaQpKTo8MWx6_ghCDrLH8TLIibqJ8Xf3p73MgB92GJmWlbVIMHnfwtquGI3_/pub

.NET 5부터 제공하는 CollectionsMarshal 클래스의 사용법과 주의 사항을 잘 설명하고 있습니다. 해당 클래스에는 AsSapn(.NET 5+ 지원)과 GetValueRefOrAddDefault(.NET 6+ 지원) 딱 2개의 메서드가 있는데요, 사실상 C# 7.0부터 추가한 ref 구문을 활용해 성능을 높이려는 마이크로소프트의 노력이 기존 컬렉션 구현에도 적용되기 시작한 경우라고 볼 수 있겠습니다. ^^




굳이 첨언하자면, 해당 예제들이 잘 제어된 코드 내에서 재현이 가능하다는 것을 알고 넘어가는 것도 좋겠습니다.

우선, List의 경우 다음과 같은 예제를 들고 있는데요,

using System.Runtime.InteropServices;

var list = Enumerable.Range(0, 10).ToList();
var span = CollectionsMarshal.AsSpan(list);
span[^1] = -1;
Console.WriteLine(string.Join(", ", list));
// 0, 1, 2, 3, 4, 5, 6, 7, 8, -1

list.Add(100); // 내부 배열이 재확보된다
span[0] = -2;  // 이 span은 list의 내부 배열 참조는 아니다
Console.WriteLine(string.Join(", ", list));
// 0, 1, 2, 3, 4, 5, 6, 7, 8, -1, 100

사실, 위에서 첫 번째 라인을 다음과 같이만 고쳐도,

// var list = Enumerable.Range(0, 10).ToList();

List<int> list = new List<int>() { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 };

/* 또는 이렇게,
List<int> list = new List<int>();
for (int i = 0; i < 10; i++)
{
    list.Add(i);
}
*/

출력 결과는 본문과는 다르게 나옵니다.

0, 1, 2, 3, 4, 5, 6, 7, 8, -1
-2, 1, 2, 3, 4, 5, 6, 7, 8, -1, 100

왜냐하면, List<T> 타입의 버퍼 운영이 2배수로 늘어나는 방식이기 때문입니다.

// List<T>.EnsureCapacity 메서드 코드 (.NET 버전 따라 바뀔 수 있음)

private void EnsureCapacity(int min)
{
    if (_items.Length < min)
    {
        int newCapacity = _items.Length == 0 ? DefaultCapacity : _items.Length * 2;

        if ((uint)newCapacity > Array.MaxArrayLength) newCapacity = Array.MaxArrayLength;
        if (newCapacity < min) newCapacity = min;
        Capacity = newCapacity;
    }
}

위의 코드에서 재미있는 것은 DefaultCapacity == 4라는 점입니다. 그래서 요소가 하나라도 있다면 List의 경우 기본으로 4개의 요소를 담을 수 있는 공간을 확보합니다. 이후로는 2배수로 진행하기 때문에 Add에 의한 용량 증가가 4, 8, 16, 32...로 늘어나 갈수록 확률이 낮아집니다.

또한, 원본 글의 예제 코드가 정확하게 문제를 재현할 수 있었던 것은, Enumerable.Range에 이은 ToList의 구현이 정확하게 Capacity를 지정해서 생성하기 때문입니다.

// System.Linq.Enumerable.RangeIterator 소스 코드

public List<int> ToList()
{
    List<int> list = new List<int>(_end - _start);
    for (int cur = _start; cur != _end; cur++)
    {
        list.Add(cur);
    }

    return list;
}

그래서 "list.Add(100)" 단 하나의 추가 코드로 인해 내부 배열을 (기존 10개에서) 20개로 새로 할당하는 과정을 거치게 된 것입니다.




위에서, 제가 List<T>의 경우 기본 크기가 4, 이후 2배수로 늘어난다고 했는데요, Dictionary<TKey, TValue>의 경우에는 또 다릅니다.

Dictionary는 내부 배열의 증가를 소수(prime)에 해당하는 크기만큼 바꾸도록 정하고 있는데요,

// System.Collections.Generic.Dictionary 소스 코드

private int Initialize(int capacity)
{
    int size = HashHelpers.GetPrime(capacity);
    int[] buckets = new int[size];
    Entry[] entries = new Entry[size];

    // Assign member variables after both arrays allocated to guard against corruption from OOM if second fails
    _freeList = -1;
#if TARGET_64BIT
    _fastModMultiplier = HashHelpers.GetFastModMultiplier((uint)size);
#endif
    _buckets = buckets;
    _entries = entries;

    return size;
}

그래서 요소가 한 개 추가된 경우 기본 크기가 (소수인) 3개가 되었고,

// System.Collections.HashHelpers에 미리 정의된 소수

public static readonly int[] primes = new int[72]
{
    3, 7, 11, 17, 23, 29, 37, 47, 59, 71,
    89, 107, 131, 163, 197, 239, 293, 353, 431, 521,
    631, 761, 919, 1103, 1327, 1597, 1931, 2333, 2801, 3371,
    4049, 4861, 5839, 7013, 8419, 10103, 12143, 14591, 17519, 21023,
    25229, 30293, 36353, 43627, 52361, 62851, 75431, 90523, 108631, 130363,
    156437, 187751, 225307, 270371, 324449, 389357, 467237, 560689, 672827, 807403,
    968897, 1162687, 1395263, 1674319, 2009191, 2411033, 2893249, 3471899, 4166287, 4999559,
    5999471, 7199369
};

해당 예제에서는 2번의 추가 Add를 했을 때 그 수에 이르렀기 때문에,

using System.Runtime.InteropServices;

var dic = new Dictionary<string, int> {
   { "foo", 1 },
};
bool exists;
ref var foo = ref CollectionsMarshal.GetValueRefOrAddDefault(dic, "foo", out exists);
System.Diagnostics.Debug.Assert(exists);
ref var bar = ref CollectionsMarshal.GetValueRefOrAddDefault(dic, "bar", out exists);
System.Diagnostics.Debug.Assert(!exists);

foo++;
bar++;
Console.WriteLine(string.Join(", ", dic));
// [foo, 2], [bar, 1]

dic.Add("baz", -1);
foo++;
Console.WriteLine(dic["foo"]);
// 3

dic.Add("foobar", -1); // 여기에서 재확보 된다
foo++; // foo는 dic의 내부 참조가 아니다
Console.WriteLine(dic["foo"]);
// 3

내부에서 Resize 과정을 거쳐,

// System.Collections.Generic.Dictionary 소스 코드

private bool TryInsert(TKey key, TValue value, InsertionBehavior behavior)
{
    // ...[생략]...

    int count = _count;
    if (count == entries.Length)
    {
        Resize();
        bucket = ref GetBucket(hashCode);
    }

    // ...[생략]...
}

private void Resize() => Resize(HashHelpers.ExpandPrime(_count), false);

재할당이 발생한 것입니다. 즉, 이것 역시 내부 요소 수가 커지면서 재할당이 발생할 확률이 낮아지므로 Span을 통한 예제 출력 결과가 원문에서 쓴 것처럼 나오지 않을 수도 있습니다.

물론, 어쨌든 원문 저자가 말한 것처럼, "값을 추가하기 전후로 사용하거나 하면 위험"하다는 것에는 변함이 없습니다.




Enumeration 작업을 할 때 컬렉션이 변경되면 "Collection was modified; enumeration operation may not execute." 이런 예외가 발생하는데요, 혹시 위에서도 가능할까요?

이를 위해 확장 메서드가 좋을 듯한데, 아쉽게도 확장 메서드는 제네릭 지원을 하지 못해 다음과 같이 타입을 지정해야만 합니다.

static class ListHelper
{
    [MethodImpl(MethodImplOptions.AggressiveInlining)]
    public static void AddEx(this List<int> list, int item)
    {
#if DEBUG        
        int old = list.Capacity;
#endif
        list.Add(item);
#if DEBUG
        if (list.Capacity != old)
        {
            throw new InvalidOperationException("Collection was modified; Add operation may not execute.");
        }
#endif
    }
}

위의 코드로 다시 실행하면,

List<int> list = Enumerable.Range(0, 10).ToList();

list.AddEx(500); // 예외 발생 InvalidOperationException

목적은 달성했지만, 음... 여러모로 깔끔하지 않군요. ^^




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 3/27/2024]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




1  2  3  4  5  6  7  [8]  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
13743정성태9/26/20246427닷넷: 2298. C# - Console 프로젝트에서의 await 대상으로 Main 스레드 활용하는 방법 [1]
13742정성태9/26/20246712닷넷: 2297. C# - ssh-keygen으로 생성한 ecdsa 유형의 Public Key 파일 해석 [1]파일 다운로드1
13741정성태9/25/20245891디버깅 기술: 202. windbg - ASP.NET MVC Web Application (.NET Framework) 응용 프로그램의 덤프 분석 시 요령
13740정성태9/24/20245755기타: 86. RSA 공개키 등의 modulus 값에 0x00 선행 바이트가 있는 이유(ASN.1 인코딩)
13739정성태9/24/20245907닷넷: 2297. C# - ssh-keygen으로 생성한 Public Key 파일 해석과 fingerprint 값(md5, sha256) 생성 [1]파일 다운로드1
13738정성태9/22/20245624C/C++: 174. C/C++ - 윈도우 운영체제에서의 file descriptor, FILE*파일 다운로드1
13737정성태9/21/20245990개발 환경 구성: 727. Visual C++ - 리눅스 프로젝트를 위한 빌드 서버의 msbuild 구성
13736정성태9/20/20245988오류 유형: 923. Visual Studio Code - Could not establish connection to "...": Port forwarding is disabled.
13735정성태9/20/20246064개발 환경 구성: 726. ARM 플랫폼용 Visual C++ 리눅스 프로젝트 빌드
13734정성태9/19/20245774개발 환경 구성: 725. ssh를 이용한 원격 docker 서비스 사용
13733정성태9/19/20246102VS.NET IDE: 194. Visual Studio - Cross Platform / "Authentication Type: Private Key"로 접속하는 방법
13732정성태9/17/20246141개발 환경 구성: 724. ARM + docker 환경에서 .NET 8 설치
13731정성태9/15/20246734개발 환경 구성: 723. C# / Visual C++ - Control Flow Guard (CFG) 활성화 [1]파일 다운로드2
13730정성태9/10/20246395오류 유형: 922. docker - RULE_APPEND failed (No such file or directory): rule in chain DOCKER
13729정성태9/9/20247139C/C++: 173. Windows / C++ - AllocConsole로 할당한 콘솔과 CRT 함수 연동 [1]파일 다운로드1
13728정성태9/7/20246958C/C++: 172. Windows - C 런타임에서 STARTUPINFO의 cbReserved2, lpReserved2 멤버를 사용하는 이유파일 다운로드1
13727정성태9/6/20247496개발 환경 구성: 722. ARM 플랫폼 빌드를 위한 미니 PC(?) - Khadas VIM4 [1]
13726정성태9/5/20247401C/C++: 171. C/C++ - 윈도우 운영체제에서의 file descriptor와 HANDLE파일 다운로드1
13725정성태9/4/20246153디버깅 기술: 201. WinDbg - sos threads 명령어 실행 시 "Failed to request ThreadStore"
13724정성태9/3/20248009닷넷: 2296. Win32/C# - 자식 프로세스로 HANDLE 상속파일 다운로드1
13723정성태9/2/20248279C/C++: 170. Windows - STARTUPINFO의 cbReserved2, lpReserved2 멤버 사용자 정의파일 다운로드2
13722정성태9/2/20246020C/C++: 169. C/C++ - CRT(C Runtime) 함수에 의존성이 없는 프로젝트 생성
13721정성태8/30/20246049C/C++: 168. Visual C++ CRT(C Runtime DLL: msvcr...dll)에 대한 의존성 제거 - 두 번째 이야기
13720정성태8/29/20246201VS.NET IDE: 193. C# - Visual Studio의 자식 프로세스 디버깅
13719정성태8/28/20246346Linux: 79. C++ - pthread_mutexattr_destroy가 없다면 메모리 누수가 발생할까요?
13718정성태8/27/20247432오류 유형: 921. Visual C++ - error C1083: Cannot open include file: 'float.h': No such file or directory [2]
1  2  3  4  5  6  7  [8]  9  10  11  12  13  14  15  ...