C# - 문자열 연결 시 string.Create를 이용한 GC 할당 최소화
이번 글은 아래의 트윗 내용을 옮겨봅니다. ^^
예전에도 "
C# 10 - (12) 문자열 보간 성능 개선" 글에서 string.Create를 스치듯 다룬 적이 있었습니다. ^^
어쨌든 중요한 것은, string 자체는 참조 타입이라서 GC Heap을 쓸 수밖에 없다는 점입니다. 하지만, string을 연결하는 과정에서 가능한 stack을 활용해 GC 힙의 사용을 최소화하는 노력은 할 수 있습니다.
위의 트윗에서 나온 코드를 실습해 보면,
namespace ConsoleApp1;
internal class Program
{
static void Main(string[] args)
{
{
string text = StringCreate(); // JIT
Console.WriteLine(text.Length * 2);
}
{
long old = GC.GetAllocatedBytesForCurrentThread();
string text = StringCreate();
Console.WriteLine(text);
long now = GC.GetAllocatedBytesForCurrentThread();
Console.WriteLine(now - old);
}
}
static private string title = "Mr.";
static private string first = "David";
static private string middle = "Patrick";
static private string last = "Callan";
static public string StringCreate()
{
string text = string.Create(title.Length + first.Length + middle.Length + last.Length + 3,
(title, first, middle, last),
(span, state) =>
{
state.title.AsSpan().CopyTo(span);
span = span[state.title.Length..];
span[0] = ' ';
span = span[1..];
state.first.AsSpan().CopyTo(span);
span = span[state.first.Length..];
span[0] = ' ';
span = span[1..];
state.middle.AsSpan().CopyTo(span);
span = span[state.middle.Length..];
span[0] = ' ';
span = span[1..];
state.last.AsSpan().CopyTo(span);
}
);
return text;
}
}
화면에는 이런 출력을 얻게 됩니다.
48
Mr. David Patrick Callan
72
StringCreate를 실행했을 때 GC Heap을 72바이트 소비하는 것으로, 문자열 길이가 48바이트이므로 null 2바이트를 포함하면 50바이트, 그래도 22바이트가 더 소비되긴 했습니다. 어떻게 소비된 것인지 다음의 글에 따라 계산해 보면,
windbg - .NET string의 x86/x64 메모리 할당 구조
; https://www.sysnet.pe.kr/2/0/11336
- Object Header: 8바이트
- MethodTable 주소: 8바이트
- m_stringLength: 4바이트
- ...[문자열 48바이트]...
- null 2바이트
- 8바이트 정렬로 인해 2바이트
모두 더해 정확히 72바이트입니다. ^^ 그러니까 결국 Span을 이용한 string.Create의 사용은 대상 문자열로 인한 GC 힙의 사용 외에는 나머지 할당을 완전히 없앤 것입니다.
^^ 눈치채신 분이 있겠지만, 사실 위와 같이 코딩하는 것은 아래와 같이 바꿔쓸 수 있습니다.
// C# 10+, .NET 6+
{
string text = $"{title} {first} {middle} {last}";
}
{
long old = GC.GetAllocatedBytesForCurrentThread();
string text = $"{title} {first} {middle} {last}";
long now = GC.GetAllocatedBytesForCurrentThread();
Console.WriteLine(now - old); // 출력 결과: 72
}
위의 코드 역시 72바이트만을 소비하는데, "
C# 10 - (12) 문자열 보간 성능 개선"에서 설명한 대로 이미
DefaultInterpolatedStringHandler가 내부적으로 string.Create를 이용한 문자열 연결을 하고 있기 때문입니다.
[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]