Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 
(연관된 글이 1개 있습니다.)
(시리즈 글이 9개 있습니다.)
.NET Framework: 497. .NET Garbage Collection에 대한 정리
; https://www.sysnet.pe.kr/2/0/1862

.NET Framework: 728. windbg - 눈으로 확인하는 Workstation GC / Server GC
; https://www.sysnet.pe.kr/2/0/11445

.NET Framework: 729. windbg로 살펴보는 GC heap의 Segment 구조
; https://www.sysnet.pe.kr/2/0/11446

.NET Framework: 1026. 닷넷 5에 추가된 POH (Pinned Object Heap)
; https://www.sysnet.pe.kr/2/0/12545

.NET Framework: 1029. C# - GC 호출로 인한 메모리 압축(Compaction)을 확인하는 방법
; https://www.sysnet.pe.kr/2/0/12572

.NET Framework: 1059. 세대 별 GC(Garbage Collection) 방식에서 Card table의 사용 의미
; https://www.sysnet.pe.kr/2/0/12649

.NET Framework: 1060. 닷넷 GC에 새롭게 구현되는 DPAD(Dynamic Promotion And Demotion for GC)
; https://www.sysnet.pe.kr/2/0/12653

.NET Framework: 2024. .NET 7에 도입된 GC의 메모리 해제에 대한 segment와 region의 차이점
; https://www.sysnet.pe.kr/2/0/13083

닷넷: 2209. .NET 8 - NonGC Heap / FOH (Frozen Object Heap)
; https://www.sysnet.pe.kr/2/0/13536




세대 별 GC(Garbage Collection) 방식에서 Card table의 사용 의미

그러고 보니 지난 글에서,

.NET GC - 하위 세대의 객체를 포함하는 상위 세대의 참조를 추적하기 위한 card-table
; https://www.sysnet.pe.kr/2/0/1670

Card-table에 대한 언급과 함께 JIT 컴파일 시의 JIT_WriteBarrierEAX 코드 출력만 언급하고 왜 사용하는지에 대한 이유를 설명하지 않고 넘어갔는데요. 사실 그 이유는, 위의 글에서 링크한 "Generational Garbage Collection"에서 "Tracking higher to lower generation references" 절에서 자세하게 설명하고 있습니다.

위의 글을 정리해서 풀어보면.

CLR이 선택한 "mark-sweep" 방식의 GC에서 가장 큰 단점은, 전체 heap에 대한 정리를 할 때 프로그램의 중지 시간이 너무 길 수 있다는 것입니다. 그리고 이에 대한 단점을 극복하기 위해 GC에 세대라는 개념을 도입하는 것인데요, 이렇게 해서 성능 향상이 된다는 근거는 다음의 가정을 바탕으로 합니다.

  • 대부분의 개체는 0세대에서 소멸
  • 수집된 90% 이상의 개체들이 지난번 GC 이후 새롭게 생성된 개체들
  • 일단 GC 과정에서 살아남은 개체는 생명 주기가 길수 있다.

위의 가정에 따라, "세대별 GC" 모델에서는 Full GC의 수행 횟수는 낮추고 주로 0세대 개체만 빠르게 GC 함으로써 성능을 확보할 수 있습니다. 물론 이런 경우에도 2세대 힙까지 GC를 하게 되면 실행이 끊기는 현상이 나올 수 있습니다.

그런데 이 과정에서 왜? card-table을 두는 것이 효과가 있을까요?

GC는 해당 개체를 제거하기 위해서는 그 개체를 참조하는 "root 개체"가 없어야 합니다. 이러한 root 개체가 스레드 스택, CPU의 레지스터라면 빠르게 그 참조 여부를 알 수 있습니다. 스택은 기본적으로 1MB지만 실제 commit된 스택을 고려한다면 더 작을 수 있으며 CPU의 레지스터는 그 수가 더욱 한정적이기 때문에 GC 입장에서 성능에 치명적인 요소는 아닙니다.

그런데 문제는, "root 개체"가 다른 개체일 경우입니다. 그리고 그 개체들 중 특히 문제가 되는 것은 2세대에 있는 개체들로부터의 참조 여부를 가릴 때입니다.

일반적으로, Full GC 유형이라면 어차피 모든 heap을 열거해야 하므로 딱히 문제가 안 됩니다. 재미있는 것은, 세대별로 나눠 0세대만 혹은 1세대만 GC하는 경우 그것들의 "root 개체"가 2세대에 있는 개체인지 알아내기 위해 결국 2세대로 누적된 방대한 heap 영역을 모두 뒤져야 한다는 아이러니한 상황이 나오는 것입니다. (차라리 그럴 거면 애당초 Full GC만 하면 됩니다.)

이렇게, 낮은 세대의 개체를 GC하기 위해 Old 세대의 참조 개체가 있는지 빠르게 알 수 있는 방법으로 Card table이 해결책으로 나옵니다. 예를 들어 다음의 그림은 Gen0에 있는 개체를 참조하고 있는 Gen1의 개체가 있는지 알 수 있는 card table의 개념을 보여줍니다.

card_table_image_thumb_7.png

card table은 비트의 집합으로 되어 있고, Gen1의 전체 크기를 4KB 영역으로 나눠 1비트에 대응시킵니다. 가령, Gen1 메모리가 0x1000에서 시작한다고 가정했을 때 card_table의 첫 번째 비트가 1이면 0x1000 ~ 0x2000 사이의 Gen1 개체가 Gen 0의 개체를 참조하고 있다는 표시가 됩니다. 즉, 전체 Gen1 메모리를 뒤질 필요 없이 card-table에서 1비트로 표시된 4KB 구간의 집합만 검색하면 되는 것입니다. (물론, 대부분의 힙에서 1비트로 표시되면 성능이 개선될 수 없겠지만, "Tracking higher to lower generation references" 절에서 언급하듯이 연구 결과에 따르면 실제로 old 개체가 ephemeral 개체(0, 1세대)를 참조하는 경우는 1% 이하라고 합니다.)

그렇다면, card_table에 old 개체가 young 개체를 가리키고 있다는 표시를 해야 하는데요, 그게 바로 이전에 살펴봤던 clr!JIT_WriteBarrierEAX 함수로 JIT 컴파일러에 의해 자동으로 추가되는 코드입니다.

.NET GC - 하위 세대의 객체를 포함하는 상위 세대의 참조를 추적하기 위한 card-table
; https://www.sysnet.pe.kr/2/0/1670

여기서 한 가지 재미있는 점은 아래의 코드에서,

class Program
{
    public InnerType In;

    static void Main(string[] args)
    {
        Program pg = new Program();
        InnerType instance = new InnerType();

        pg.In = instance;
    }
}

class InnerType { }

pg 개체와 instance 개체의 세대 비교를 어떻게 하면 빠르게 할 수 있을지입니다. CLR의 경우 한 가지 다행인 점은, Gen1과 Gen0 개체는 동일한 ephemeral segment에 할당되어 있다는 점입니다. 따라서, pg 개체와 instance 개체가 같은 segment에 있고 그것이 ephemeral segment라면 연속적인 할당이 이뤄지므로 Gen0/1의 경계 주솟값만 비교하면 세대 차이를 알 수 있습니다. 반면 pg 개체와 instance 개체가 다른 segment에 있다고 판단이 되면 마찬가지로 어느 한 쪽만 ephemeral segment 내에 있는지 판단이 되면 자동으로 세대 차이를 알 수 있습니다.




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 5/16/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2022-12-03 10시38분
Segment가 Region으로 바뀌면서,

.NET 7에 도입된 GC의 메모리 해제에 대한 segment와 region의 차이점
; https://www.sysnet.pe.kr/2/0/13083

card table 관련 코드도 바뀌는데, 이에 대한 자세한 설명을 아래의 글에서 볼 수 있습니다.

Write barrier optimizations in regions
; https://maoni0.medium.com/write-barrier-optimizations-in-regions-984bde6c0ffc
정성태

... 106  107  108  109  110  111  [112]  113  114  115  116  117  118  119  120  ...
NoWriterDateCnt.TitleFile(s)
11125정성태1/7/201724397개발 환경 구성: 310. IIS - appcmd.exe를 이용해 특정 페이지에 클라이언트 측 인증서를 제출하도록 설정하는 방법
11124정성태1/4/201727831개발 환경 구성: 309. 3년짜리 유효 기간을 제공하는 StartSSL [2]
11123정성태1/3/201723335.NET Framework: 629. .NET Core의 dotnet.exe CLI 명령어 확장 방법 [1]
11122정성태1/3/201722804.NET Framework: 628. TransactionScope에 사용자 정의 트랜잭션을 참여시키는 방법 [2]파일 다운로드1
11121정성태1/1/201720698개발 환경 구성: 308. "ASP.NET Core Web Application (.NET Core)"와 "ASP.NET Core Web Application (.NET Framework)" 차이점
11120정성태12/25/201626565개발 환경 구성: 307. ASP.NET Core Web Application을 IIS에서 호스팅하는 방법
11119정성태12/23/201649229개발 환경 구성: 306. Visual Studio Code에서 Python 개발 환경 구성 [2]
11118정성태12/22/201635994오류 유형: 374. Python 64비트 설치 시 0x80070659 오류 발생 [3]
11117정성태12/21/201622315웹: 35. nopCommerce 예제 사이트 구성 방법
11116정성태12/21/201624261디버깅 기술: 84. NopCommerce의 Autofac 부하(CPU, Memory) [2]
11115정성태12/21/201627236Windows: 133. 윈도우 서버 2016에서 플래시가 동작하지 않는 경우 [2]
11114정성태12/19/201637245Windows: 132. 역슬래시(backslash) 문자가 왜 통화 표기 문자(한글인 경우 "\")로 보일까요? [2]
11113정성태12/6/201621127오류 유형: 373. ICOMAdminCatalog::GetCollection에서 CO_E_ISOLEVELMISMATCH(0x8004E02F) 오류 발생파일 다운로드1
11112정성태11/23/201626307오류 유형: 372. MySQL 서비스가 올라오지 않는 경우 - Error 1067
11111정성태11/23/201634785.NET Framework: 627. C++로 만든 DLL을 C#에서 사용하기 [2]
11110정성태11/17/201621462.NET Framework: 626. Commit 메모리가 낮은 상황에서도 메모리 부족(Out-of-memory) 예외 발생 [2]
11109정성태11/17/201621447.NET Framework: 625. ASP.NET에서 System.Web.HttpApplication 인스턴스는 다중으로 생성됩니다.
11108정성태11/13/201621261.NET Framework: 624. WPF - Line 요소를 Canvas에 위치시켰을 때 흐림(blur) 현상파일 다운로드1
11107정성태11/9/201625155오류 유형: 371. Post cache substitution is not compatible with modules in the IIS integrated pipeline that modify the response buffers.파일 다운로드1
11106정성태11/8/201625324.NET Framework: 623. C# - PeerFinder를 이용한 Wi-Fi Direct 데이터 통신 예제 [2]파일 다운로드1
11105정성태11/8/201619720.NET Framework: 622. PeerFinder Wi-Fi Direct 통신 시 Read/Write/Dispose 문제
11104정성태11/8/201619203개발 환경 구성: 305. PeerFinder로 Wi-Fi Direct 연결 시 방화벽 문제
11103정성태11/8/201619149오류 유형: 370. PeerFinder.ConnectAsync의 결과 값인 Task.Result를 호출할 때 System.AggregateException 예외 발생
11102정성태11/8/201619255오류 유형: 369. PeerFinder.FindAllPeersAsync 호출 시 System.UnauthorizedAccessException 예외 발생
11101정성태11/8/201622024.NET Framework: 621. 닷넷 프로파일러의 오류 코드 - 0x80131363
11100정성태11/7/201628823개발 환경 구성: 304. Wi-Fi Direct 지원 여부 확인 방법 [1]
... 106  107  108  109  110  111  [112]  113  114  115  116  117  118  119  120  ...