Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 

세대 별 GC(Garbage Collection) 방식에서 Card table의 사용 의미

그러고 보니 지난 글에서,

.NET GC - 하위 세대의 객체를 포함하는 상위 세대의 참조를 추적하기 위한 card-table
; https://www.sysnet.pe.kr/2/0/1670

Card-table에 대한 언급과 함께 JIT 컴파일 시의 JIT_WriteBarrierEAX 코드 출력만 언급하고 왜 사용하는지에 대한 이유를 설명하지 않고 넘어갔는데요. 사실 그 이유는, 위의 글에서 링크한 "Generational Garbage Collection"에서 "Tracking higher to lower generation references" 절에서 자세하게 설명하고 있습니다.

위의 글을 정리해서 풀어보면.

CLR이 선택한 "mark-sweep" 방식의 GC에서 가장 큰 단점은, 전체 heap에 대한 정리를 할 때 프로그램의 중지 시간이 너무 길 수 있다는 것입니다. 그리고 이에 대한 단점을 극복하기 위해 GC에 세대라는 개념을 도입하는 것인데요, 이렇게 해서 성능 향상이 된다는 근거는 다음의 가정을 바탕으로 합니다.

  • 대부분의 개체는 0세대에서 소멸
  • 수집된 90% 이상의 개체들이 지난번 GC 이후 새롭게 생성된 개체들
  • 일단 GC 과정에서 살아남은 개체는 생명 주기가 길수 있다.

위의 가정에 따라, "세대별 GC" 모델에서는 Full GC의 수행 횟수는 낮추고 주로 0세대 개체만 빠르게 GC 함으로써 성능을 확보할 수 있습니다. 물론 이런 경우에도 2세대 힙까지 GC를 하게 되면 실행이 끊기는 현상이 나올 수 있습니다.

그런데 이 과정에서 왜? card-table을 두는 것이 효과가 있을까요?

GC는 해당 개체를 제거하기 위해서는 그 개체를 참조하는 "root 개체"가 없어야 합니다. 이러한 root 개체가 스레드 스택, CPU의 레지스터라면 빠르게 그 참조 여부를 알 수 있습니다. 스택은 기본적으로 1MB지만 실제 commit된 스택을 고려한다면 더 작을 수 있으며 CPU의 레지스터는 그 수가 더욱 한정적이기 때문에 GC 입장에서 성능에 치명적인 요소는 아닙니다.

그런데 문제는, "root 개체"가 다른 개체일 경우입니다. 그리고 그 개체들 중 특히 문제가 되는 것은 2세대에 있는 개체들로부터의 참조 여부를 가릴 때입니다.

일반적으로, Full GC 유형이라면 어차피 모든 heap을 열거해야 하므로 딱히 문제가 안 됩니다. 재미있는 것은, 세대별로 나눠 0세대만 혹은 1세대만 GC하는 경우 그것들의 "root 개체"가 2세대에 있는 개체인지 알아내기 위해 결국 2세대로 누적된 방대한 heap 영역을 모두 뒤져야 한다는 아이러니한 상황이 나오는 것입니다. (차라리 그럴 거면 애당초 Full GC만 하면 됩니다.)

이렇게, 낮은 세대의 개체를 GC하기 위해 Old 세대의 참조 개체가 있는지 빠르게 알 수 있는 방법으로 Card table이 해결책으로 나옵니다. 예를 들어 다음의 그림은 Gen0에 있는 개체를 참조하고 있는 Gen1의 개체가 있는지 알 수 있는 card table의 개념을 보여줍니다.

card_table_image_thumb_7.png

card table은 비트의 집합으로 되어 있고, Gen1의 전체 크기를 4KB 영역으로 나눠 1비트에 대응시킵니다. 가령, Gen1 메모리가 0x1000에서 시작한다고 가정했을 때 card_table의 첫 번째 비트가 1이면 0x1000 ~ 0x2000 사이의 Gen1 개체가 Gen 0의 개체를 참조하고 있다는 표시가 됩니다. 즉, 전체 Gen1 메모리를 뒤질 필요 없이 card-table에서 1비트로 표시된 4KB 구간의 집합만 검색하면 되는 것입니다. (물론, 대부분의 힙에서 1비트로 표시되면 성능이 개선될 수 없겠지만, "Tracking higher to lower generation references" 절에서 언급하듯이 연구 결과에 따르면 실제로 old 개체가 ephemeral 개체(0, 1세대)를 참조하는 경우는 1% 이하라고 합니다.)

그렇다면, card_table에 old 개체가 young 개체를 가리키고 있다는 표시를 해야 하는데요, 그게 바로 이전에 살펴봤던 clr!JIT_WriteBarrierEAX 함수로 JIT 컴파일러에 의해 자동으로 추가되는 코드입니다.

.NET GC - 하위 세대의 객체를 포함하는 상위 세대의 참조를 추적하기 위한 card-table
; https://www.sysnet.pe.kr/2/0/1670

여기서 한 가지 재미있는 점은 아래의 코드에서,

class Program
{
    public InnerType In;

    static void Main(string[] args)
    {
        Program pg = new Program();
        InnerType instance = new InnerType();

        pg.In = instance;
    }
}

class InnerType { }

pg 개체와 instance 개체의 세대 비교를 어떻게 하면 빠르게 할 수 있을지입니다. CLR의 경우 한 가지 다행인 점은, Gen1과 Gen0 개체는 동일한 ephemeral segment에 할당되어 있다는 점입니다. 따라서, pg 개체와 instance 개체가 같은 segment에 있고 그것이 ephemeral segment라면 연속적인 할당이 이뤄지므로 Gen0/1의 경계 주솟값만 비교하면 세대 차이를 알 수 있습니다. 반면 pg 개체와 instance 개체가 다른 segment에 있다고 판단이 되면 마찬가지로 어느 한 쪽만 ephemeral segment 내에 있는지 판단이 되면 자동으로 세대 차이를 알 수 있습니다.




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]


donaricano-btn



[최초 등록일: ]
[최종 수정일: 5/16/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 쓴 사람
 




1  2  3  4  5  6  7  [8]  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
12675정성태6/16/2021363Java: 20. maven package 명령어 결과물로 (war가 아닌) jar 생성 방법
12674정성태6/15/2021389VC++: 142. DEFINE_GUID 사용법
12673정성태6/15/2021527Java: 19. IntelliJ - 자바(Java)로 만드는 Web App을 Tomcat에서 실행하는 방법
12672정성태6/15/2021481오류 유형: 725. IntelliJ에서 Java webapp 실행 시 "Address localhost:1099 is already in use" 오류
12671정성태6/15/2021753오류 유형: 724. Tomcat 실행 시 Failed to initialize connector [Connector[HTTP/1.1-8080]] 오류
12670정성태6/13/2021380.NET Framework: 1071. DLL Surrogate를 이용한 Out-of-process COM 개체에서의 CoInitializeSecurity 문제파일 다운로드1
12669정성태6/11/2021544.NET Framework: 1070. 사용자 정의 GetHashCode 메서드 구현은 C# 9.0의 record 또는 리팩터링에 맡기세요.
12668정성태6/11/2021689.NET Framework: 1069. C# - DLL Surrogate를 이용한 Out-of-process COM 개체 제작파일 다운로드2
12667정성태6/10/2021508.NET Framework: 1068. COM+ 서버 응용 프로그램을 이용해 CoInitializeSecurity 제약 해결파일 다운로드1
12666정성태6/10/2021484.NET Framework: 1067. 별도 DLL에 포함된 타입을 STAThread Main 메서드에서 사용하는 경우 CoInitializeSecurity 자동 호출파일 다운로드1
12665정성태6/9/2021494.NET Framework: 1066. Wslhub.Sdk 사용으로 알아보는 CoInitializeSecurity 사용 제약파일 다운로드1
12664정성태6/9/2021416오류 유형: 723. COM+ PIA 참조 시 "This operation failed because the QueryInterface call on the COM component" 오류
12663정성태6/9/2021481.NET Framework: 1065. Windows Forms - 속성 창의 디자인 설정 지원: 문자열 목록 내에서 항목을 선택하는 TypeConverter 제작파일 다운로드1
12662정성태6/8/2021534.NET Framework: 1064. C# COM 개체를 PIA(Primary Interop Assembly)로써 "Embed Interop Types" 참조하는 방법파일 다운로드1
12661정성태6/4/20211681.NET Framework: 1063. C# - MQTT를 이용한 클라이언트/서버(Broker) 통신 예제 [3]파일 다운로드1
12660정성태6/3/2021631.NET Framework: 1062. Windows Forms - 폼 내에서 발생하는 마우스 이벤트를 자식 컨트롤 영역에 상관없이 수신하는 방법 [1]파일 다운로드1
12659정성태6/2/2021616Linux: 40. 우분투 설치 후 MBR 디스크 드라이브 여유 공간이 인식되지 않은 경우 - Logical Volume Management
12658정성태6/2/2021650Windows: 194. Microsoft Store에 있는 구글의 공식 Youtube App
12657정성태6/2/2021890Windows: 193. 윈도우 패키지 관리자 - winget 설치
12656정성태6/1/2021417.NET Framework: 1061. 서버 유형의 COM+에 적용할 수 없는 Server GC
12655정성태6/1/2021460오류 유형: 722. windbg/sos - savemodule - Fail to read memory
12654정성태5/31/2021449오류 유형: 721. Hyper-V - Saved 상태의 VM을 시작 시 오류 발생
12653정성태5/31/2021710.NET Framework: 1060. 닷넷 GC에 새롭게 구현되는 DPAD(Dynamic Promotion And Demotion for GC)
12652정성태5/31/2021418VS.NET IDE: 164. Visual Studio - Web Deploy로 Publish 시 암호창이 매번 뜨는 문제
12651정성태5/31/2021595오류 유형: 720. PostgreSQL - ERROR: 22P02: malformed array literal: "..."
12650정성태5/17/2021470기타: 82. OpenTabletDriver의 버튼에 더블 클릭을 매핑 및 게임에서의 지원 방법
1  2  3  4  5  6  7  [8]  9  10  11  12  13  14  15  ...