Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 

C# - 문자열 연결 시 string.Create를 이용한 GC 할당 최소화

이번 글은 아래의 트윗 내용을 옮겨봅니다. ^^



예전에도 "C# 10 - (12) 문자열 보간 성능 개선" 글에서 string.Create를 스치듯 다룬 적이 있었습니다. ^^

어쨌든 중요한 것은, string 자체는 참조 타입이라서 GC Heap을 쓸 수밖에 없다는 점입니다. 하지만, string을 연결하는 과정에서 가능한 stack을 활용해 GC 힙의 사용을 최소화하는 노력은 할 수 있습니다.

위의 트윗에서 나온 코드를 실습해 보면,

namespace ConsoleApp1;

internal class Program
{
    static void Main(string[] args)
    {
        {
            string text = StringCreate(); // JIT
            Console.WriteLine(text.Length * 2);
        }

        {
            long old = GC.GetAllocatedBytesForCurrentThread();
            string text = StringCreate();
            Console.WriteLine(text);
            long now = GC.GetAllocatedBytesForCurrentThread();
            Console.WriteLine(now - old);
        }
    }

    static private string title = "Mr.";
    static private string first = "David";
    static private string middle = "Patrick";
    static private string last = "Callan";

    static public string StringCreate()
    {
        string text = string.Create(title.Length + first.Length + middle.Length + last.Length + 3,
            (title, first, middle, last),
            (span, state) =>
            {
                state.title.AsSpan().CopyTo(span);
                span = span[state.title.Length..];
                span[0] = ' ';
                span = span[1..];

                state.first.AsSpan().CopyTo(span);
                span = span[state.first.Length..];
                span[0] = ' ';
                span = span[1..];

                state.middle.AsSpan().CopyTo(span);
                span = span[state.middle.Length..];
                span[0] = ' ';
                span = span[1..];

                state.last.AsSpan().CopyTo(span);
            }
            );

        return text;
    }
}

화면에는 이런 출력을 얻게 됩니다.

48
Mr. David Patrick Callan
72

StringCreate를 실행했을 때 GC Heap을 72바이트 소비하는 것으로, 문자열 길이가 48바이트이므로 null 2바이트를 포함하면 50바이트, 그래도 22바이트가 더 소비되긴 했습니다. 어떻게 소비된 것인지 다음의 글에 따라 계산해 보면,

windbg - .NET string의 x86/x64 메모리 할당 구조
; https://www.sysnet.pe.kr/2/0/11336

  • Object Header: 8바이트
  • MethodTable 주소: 8바이트
  • m_stringLength: 4바이트
  • ...[문자열 48바이트]...
  • null 2바이트
  • 8바이트 정렬로 인해 2바이트

모두 더해 정확히 72바이트입니다. ^^ 그러니까 결국 Span을 이용한 string.Create의 사용은 대상 문자열로 인한 GC 힙의 사용 외에는 나머지 할당을 완전히 없앤 것입니다.




^^ 눈치채신 분이 있겠지만, 사실 위와 같이 코딩하는 것은 아래와 같이 바꿔쓸 수 있습니다.

// C# 10+, .NET 6+

{
    string text = $"{title} {first} {middle} {last}";
}

{
    long old = GC.GetAllocatedBytesForCurrentThread();
    string text = $"{title} {first} {middle} {last}";
    long now = GC.GetAllocatedBytesForCurrentThread();
    Console.WriteLine(now - old); // 출력 결과: 72
}

위의 코드 역시 72바이트만을 소비하는데, "C# 10 - (12) 문자열 보간 성능 개선"에서 설명한 대로 이미 DefaultInterpolatedStringHandler가 내부적으로 string.Create를 이용한 문자열 연결을 하고 있기 때문입니다.




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 7/23/2023]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




... 31  32  33  34  35  36  37  38  39  40  41  42  43  [44]  45  ...
NoWriterDateCnt.TitleFile(s)
12536정성태2/9/202110136개발 환경 구성: 542. BDP(Bandwidth-delay product)와 TCP Receive Window
12535정성태2/9/20219242개발 환경 구성: 541. Wireshark로 확인하는 LSO(Large Send Offload), RSC(Receive Segment Coalescing) 옵션
12534정성태2/8/20219814개발 환경 구성: 540. Wireshark + C/C++로 확인하는 TCP 연결에서의 closesocket 동작 [1]파일 다운로드1
12533정성태2/8/20219474개발 환경 구성: 539. Wireshark + C/C++로 확인하는 TCP 연결에서의 shutdown 동작파일 다운로드1
12532정성태2/6/20219955개발 환경 구성: 538. Wireshark + C#으로 확인하는 ReceiveBufferSize(SO_RCVBUF), SendBufferSize(SO_SNDBUF) [3]
12531정성태2/5/20218982개발 환경 구성: 537. Wireshark + C#으로 확인하는 PSH flag와 Nagle 알고리듬파일 다운로드1
12530정성태2/4/202113160개발 환경 구성: 536. Wireshark + C#으로 확인하는 TCP 통신의 Receive Window
12529정성태2/4/202110208개발 환경 구성: 535. Wireshark + C#으로 확인하는 TCP 통신의 MIN RTO [1]
12528정성태2/1/20219603개발 환경 구성: 534. Wireshark + C#으로 확인하는 TCP 통신의 MSS(Maximum Segment Size) - 윈도우 환경
12527정성태2/1/20219817개발 환경 구성: 533. Wireshark + C#으로 확인하는 TCP 통신의 MSS(Maximum Segment Size) - 리눅스 환경파일 다운로드1
12526정성태2/1/20217668개발 환경 구성: 532. Azure Devops의 파이프라인 빌드 시 snk 파일 다루는 방법 - Secure file
12525정성태2/1/20217396개발 환경 구성: 531. Azure Devops - 파이프라인 실행 시 빌드 이벤트를 생략하는 방법
12524정성태1/31/20218490개발 환경 구성: 530. 기존 github 프로젝트를 Azure Devops의 빌드 Pipeline에 연결하는 방법 [1]
12523정성태1/31/20218554개발 환경 구성: 529. 기존 github 프로젝트를 Azure Devops의 Board에 연결하는 방법
12522정성태1/31/202110054개발 환경 구성: 528. 오라클 클라우드의 리눅스 VM - 9000 MTU Jumbo Frame 테스트
12521정성태1/31/202110001개발 환경 구성: 527. 이더넷(Ethernet) 환경의 TCP 통신에서 MSS(Maximum Segment Size) 확인 [1]
12520정성태1/30/20218567개발 환경 구성: 526. 오라클 클라우드의 VM에 ping ICMP 여는 방법
12519정성태1/30/20217607개발 환경 구성: 525. 오라클 클라우드의 VM을 외부에서 접근하기 위해 포트 여는 방법
12518정성태1/30/202125062Linux: 37. Ubuntu에 Wireshark 설치 [2]
12517정성태1/30/202112699Linux: 36. 윈도우 클라이언트에서 X2Go를 이용한 원격 리눅스의 GUI 접속 - 우분투 20.04
12516정성태1/29/20219337Windows: 188. Windows - TCP default template 설정 방법
12515정성태1/28/202110590웹: 41. Microsoft Edge - localhost에 대해 http 접근 시 무조건 https로 바뀌는 문제 [3]
12514정성태1/28/202110840.NET Framework: 1021. C# - 일렉트론 닷넷(Electron.NET) 소개 [1]파일 다운로드1
12513정성태1/28/20218903오류 유형: 698. electronize - User Profile 디렉터리에 공백 문자가 있는 경우 빌드가 실패하는 문제 [1]
12512정성태1/28/20218671오류 유형: 697. The program can't start because VCRUNTIME140.dll is missing from your computer. Try reinstalling the program to fix this problem.
12511정성태1/27/20218427Windows: 187. Windows - 도스 시절의 8.3 경로를 알아내는 방법
... 31  32  33  34  35  36  37  38  39  40  41  42  43  [44]  45  ...