Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 

C# - 문자열 연결 시 string.Create를 이용한 GC 할당 최소화

이번 글은 아래의 트윗 내용을 옮겨봅니다. ^^



예전에도 "C# 10 - (12) 문자열 보간 성능 개선" 글에서 string.Create를 스치듯 다룬 적이 있었습니다. ^^

어쨌든 중요한 것은, string 자체는 참조 타입이라서 GC Heap을 쓸 수밖에 없다는 점입니다. 하지만, string을 연결하는 과정에서 가능한 stack을 활용해 GC 힙의 사용을 최소화하는 노력은 할 수 있습니다.

위의 트윗에서 나온 코드를 실습해 보면,

namespace ConsoleApp1;

internal class Program
{
    static void Main(string[] args)
    {
        {
            string text = StringCreate(); // JIT
            Console.WriteLine(text.Length * 2);
        }

        {
            long old = GC.GetAllocatedBytesForCurrentThread();
            string text = StringCreate();
            Console.WriteLine(text);
            long now = GC.GetAllocatedBytesForCurrentThread();
            Console.WriteLine(now - old);
        }
    }

    static private string title = "Mr.";
    static private string first = "David";
    static private string middle = "Patrick";
    static private string last = "Callan";

    static public string StringCreate()
    {
        string text = string.Create(title.Length + first.Length + middle.Length + last.Length + 3,
            (title, first, middle, last),
            (span, state) =>
            {
                state.title.AsSpan().CopyTo(span);
                span = span[state.title.Length..];
                span[0] = ' ';
                span = span[1..];

                state.first.AsSpan().CopyTo(span);
                span = span[state.first.Length..];
                span[0] = ' ';
                span = span[1..];

                state.middle.AsSpan().CopyTo(span);
                span = span[state.middle.Length..];
                span[0] = ' ';
                span = span[1..];

                state.last.AsSpan().CopyTo(span);
            }
            );

        return text;
    }
}

화면에는 이런 출력을 얻게 됩니다.

48
Mr. David Patrick Callan
72

StringCreate를 실행했을 때 GC Heap을 72바이트 소비하는 것으로, 문자열 길이가 48바이트이므로 null 2바이트를 포함하면 50바이트, 그래도 22바이트가 더 소비되긴 했습니다. 어떻게 소비된 것인지 다음의 글에 따라 계산해 보면,

windbg - .NET string의 x86/x64 메모리 할당 구조
; https://www.sysnet.pe.kr/2/0/11336

  • Object Header: 8바이트
  • MethodTable 주소: 8바이트
  • m_stringLength: 4바이트
  • ...[문자열 48바이트]...
  • null 2바이트
  • 8바이트 정렬로 인해 2바이트

모두 더해 정확히 72바이트입니다. ^^ 그러니까 결국 Span을 이용한 string.Create의 사용은 대상 문자열로 인한 GC 힙의 사용 외에는 나머지 할당을 완전히 없앤 것입니다.




^^ 눈치채신 분이 있겠지만, 사실 위와 같이 코딩하는 것은 아래와 같이 바꿔쓸 수 있습니다.

// C# 10+, .NET 6+

{
    string text = $"{title} {first} {middle} {last}";
}

{
    long old = GC.GetAllocatedBytesForCurrentThread();
    string text = $"{title} {first} {middle} {last}";
    long now = GC.GetAllocatedBytesForCurrentThread();
    Console.WriteLine(now - old); // 출력 결과: 72
}

위의 코드 역시 72바이트만을 소비하는데, "C# 10 - (12) 문자열 보간 성능 개선"에서 설명한 대로 이미 DefaultInterpolatedStringHandler가 내부적으로 string.Create를 이용한 문자열 연결을 하고 있기 때문입니다.




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 7/23/2023]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




... 61  62  63  64  65  66  67  68  [69]  70  71  72  73  74  75  ...
NoWriterDateCnt.TitleFile(s)
11922정성태5/29/201911570.NET Framework: 840. ML.NET 데이터 정규화파일 다운로드1
11921정성태5/28/201916505Math: 55. C# - 다항식을 위한 최소 자승법(Least Squares Method)파일 다운로드1
11920정성태5/28/201910061.NET Framework: 839. C# - PLplot 색상 제어
11919정성태5/27/201913209Math: 54. C# - 최소 자승법의 1차 함수에 대한 매개변수를 단순 for 문으로 구하는 방법 [1]파일 다운로드1
11918정성태5/25/201914383Math: 53. C# - 행렬식을 이용한 최소 자승법(LSM: Least Square Method)파일 다운로드1
11917정성태5/24/201914530Math: 52. MathNet을 이용한 간단한 통계 정보 처리 - 분산/표준편차파일 다운로드1
11916정성태5/24/201912517Math: 51. MathNET + OxyPlot을 이용한 간단한 통계 정보 처리 - Histogram파일 다운로드1
11915정성태5/24/201914814Linux: 11. 리눅스의 환경 변수 관련 함수 정리 - putenv, setenv, unsetenv
11914정성태5/24/201914508Linux: 10. 윈도우의 GetTickCount와 리눅스의 clock_gettime파일 다운로드1
11913정성태5/23/201912143.NET Framework: 838. C# - 숫자형 타입의 bit(2진) 문자열, 16진수 문자열 구하는 방법파일 다운로드1
11912정성태5/23/201911792VS.NET IDE: 137. Visual Studio 2019 버전 16.1부터 리눅스 C/C++ 프로젝트에 추가된 WSL 지원
11911정성태5/23/201910870VS.NET IDE: 136. Visual Studio 2019 - 리눅스 C/C++ 프로젝트에 인텔리센스가 동작하지 않는 경우
11910정성태5/23/201919540Math: 50. C# - MathNet.Numerics의 Matrix(행렬) 연산 [1]파일 다운로드1
11909정성태5/22/201913956.NET Framework: 837. C# - PLplot 사용 예제 [1]파일 다운로드1
11908정성태5/22/201912341.NET Framework: 836. C# - Python range 함수 구현파일 다운로드1
11907정성태5/22/201910127오류 유형: 541. msbuild - MSB4024 The imported project file "...targets" could not be loaded
11906정성태5/21/201910084.NET Framework: 835. .NET Core/C# - 리눅스 syslog에 로그 남기는 방법
11905정성태5/21/201910760.NET Framework: 834. C# - 폴더 경로 문자열에서 "..", "." 표기를 고려한 최종 문자열을 얻는 방법 - 두 번째 이야기
11904정성태5/21/201917045.NET Framework: 833. C# - Open Hardware Monitor를 이용한 CPU 온도 정보 [1]파일 다운로드1
11903정성태5/21/201912015오류 유형: 540. .NET Core - System.PlatformNotSupportedException: The named version of this synchronization primitive is not supported on this platform.
11902정성태5/21/201911160오류 유형: 539. mstest 실행 시 "The directory name is invalid." 오류 발생
11901정성태5/21/201912305오류 유형: 538. msbuild 오류 - Could not find a part of the path '%LOCALAPPDATA%\Temp\2\.NETFramework,Version=v4.0.AssemblyAttributes.cs'
11900정성태5/18/201911558오류 유형: 537. "sfc /scannow" 실행 중 시스템이 부팅되는 현상
11899정성태5/17/201912586Linux: 9. Linux에서 윈도우의 OutputDebugString 대신 사용할 수 있는 syslog [1]
11898정성태5/16/201913970VC++: 130. C++ string의 c_str과 data 함수의 차이점 [3]
11897정성태5/16/201920641오류 유형: 536. Visual Studio - "Developer Pack"을 설치했는데도 "대상 프레임워크" 목록에 나오지 않는 경우 [2]
... 61  62  63  64  65  66  67  68  [69]  70  71  72  73  74  75  ...