Microsoft MVP성태의 닷넷 이야기
글쓴 사람
홈페이지
첨부 파일

.NET Thread 상태가 Cooperative일 때 GC hang 현상 재현 방법

예전 글에서,

C# - Thread.Suspend 호출 시 응용 프로그램 hang 현상
; https://www.sysnet.pe.kr/2/0/11473

각각의 스레드는 GC 작업을 해도 괜찮은지에 대한 상태를 Preemptive와 Cooperative로 나눠 구분하는데, 전자의 경우가 안전한 것이고 후자의 상태에 있는 스레드가 있다면 GC 스레드는 GC 작업을 수행하지 않고 대상 스레드가 Cooperative에서 Preemptive 상태로 바뀔 때까지 대기하게 됩니다.


라고 언급한 적이 있습니다. 이상하네요... 제가 출처를 안 남겼었군요. ^^ 위의 내용은 다음의 글에 있었습니다.

MANAGED DEBUGGING with WINDBG. Managed Heap. Part 1
; https://blogs.msdn.microsoft.com/alejacma/2009/08/13/managed-debugging-with-windbg-managed-heap-part-1/

Preemptive GC indicates what GC mode the thread is in: "enabled" in the table means the thread is in preemptive mode where GC could preempt this thread at any time; "disabled" means the thread is in cooperative mode where GC has to wait the thread to give up its current work (the work is related to GC objects so it can't allow GC to move the objects around). When the thread is executing managed code (the current IP is in managed code), it is always in cooperative mode; when the thread is in Execution Engine (unmanaged code), EE code could choose to stay in either mode and could switch mode at any time; when a thread is outside of CLR (i.e. calling into native code using interop), it is always in preemptive mode.


위에서 보면 스레드가 실행하고 있는 코드 유형에 따라 다음과 같이 3가지 정도로 나눌 수 있습니다.

1. 관리 코드를 실행 중일 때 (즉, IP 레지스터가 관리 코드 영역의 주소를 담고 있을 때)

2. 비관리 코드를 실행 중일 때,
    2.1 CLR의 Execution Engine 내의 비관리 코드를 실행 중일 떄
    2.2 그 이외의 비관리 코드를 실행 중일 때

이 중에서 Cooperative 모드인 경우는 1번과 2.1번에 해당합니다. 그리고 그중에서도 2.1번의 경우에는 preemptive/cooperative 모드 중 하나일 수 있으면서 언제든지 모드 전환을 할 수 있다고 하며, 1번의 경우에는 항상 cooperative 상태라고 합니다.

오호~~~ 그렇다면 cooperative 모드를 쉽게 재현할 수 있겠는데, 가령 다음과 같이 예제 코드를 작성하면 됩니다.

private static void threadFunc()
{
    Console.WriteLine("threadFunc TID: " + AppDomain.GetCurrentThreadId());
    long sum = 0;

    for (long i = 0; i < long.MaxValue; i ++)
    {
        sum += i;
    }

    Console.WriteLine("SUM: " + sum);
}

저 코드의 for-loop 수행 중에는 cooperative 상태라고 떠야 합니다. 실제로 위의 코드를 포함한 콘솔 프로그램을 실행하고 windbg로 연결해 다음과 같이 스레드 상태를 확인할 수 있습니다.

.loadby sos clr

0:007> !threads
ThreadCount:      3
UnstartedThread:  0
BackgroundThread: 2
PendingThread:    0
DeadThread:       0
Hosted Runtime:   no
                                                                                                        Lock  
       ID OSID ThreadOBJ           State GC Mode     GC Alloc Context                  Domain           Count Apt Exception
   0    1 8364 00000236d48851d0    2a020 Preemptive  0000000000000000:0000000000000000 00000236d4869720 1     MTA 
   6    2 82d8 00000236d48cf990    2b220 Preemptive  0000000000000000:0000000000000000 00000236d4869720 0     MTA (Finalizer) 
   7    3 5810 00000236d4909f90    2b220 Cooperative 0000000000000000:0000000000000000 00000236d4869720 0     MTA 

저렇게 코딩했다면 언제나 1개는 Cooperative 모드의 스레드를 확인할 수 있습니다. 그나저나, Cooperative 모드 상태에서는 GC 측에서 해당 스레드가 안전한 영역으로 이동할 때까지 대기해야 한다고 했습니다. 그런데 실제로 해 보면 GC가 잘 호출이 됩니다. 어찌 보면 당연한 건데, 일례로 무한 루프에 빠진 관리 코드가 있다면 해당 프로세스는 영원히 GC가 안 된다는 의미가 되기 때문입니다.

그럼, 문서가 잘못된 걸까요? 그건 아닌 것 같고 Cooperative 모드이면서 아래의 조건에 해당하는 작업을 하는 동안이라는 단서가 붙습니다.

(the work is related to GC objects so it can't allow GC to move the objects around)

이를 재현하기 위해서는 열심히 GC 힙의 객체를 건드리는 코드를 넣어 보면 됩니다.

private static void allocThreadFunc()
{
    Random rand = new Random(Environment.TickCount);

    while (true)
    {
        int count = rand.Next(500, 1000);
        List<int> list = new List<int>();

        for (int i = 0; i < count; i ++)
        {
            list.Add(i);
        }
    }
}

위의 코드를 실행하고 역시 windbg로 연결해 보면 스레드 상태를 다음과 같이 확인할 수 있습니다.

                                               Lock  
       ID OSID ThreadOBJ           State GC Mode     GC Alloc Context                  Domain           Count Apt Exception
   0    1 8364 00000236d48851d0    2a020 Preemptive  0000000000000000:0000000000000000 00000236d4869720 1     MTA 
   6    2 82d8 00000236d48cf990    2b220 Preemptive  0000000000000000:0000000000000000 00000236d4869720 0     MTA (Finalizer) 
   7    3 5810 00000236d4909f90    2b220 Cooperative 0000000000000000:0000000000000000 00000236d4869720 0     MTA 
   8    4 1c94 00000236d490b060    2b220 Cooperative 00000236D67FC9B8:00000236D67FE1B0 00000236d4869720 0     MTA 

혹시, 그럼 저렇게 "GC Alloc Context"에 값이 있는 Cooperative의 스레드가 있을 때는 GC가 구동을 못하는 것 아닐까요?

테스트는 약간 조잡하지만 간단하게 해볼 수 있습니다. 위의 프로그램을 실행하고 Process Explorer를 이용해 allocThreadFunc을 호출하는 스레드를 일시 중지(Suspend)시키는 것입니다. 그다음 windbg의 !threads 명령어로 확인했을 때 GC Alloc Context의 값이 있어야 합니다. 만약, 없다면 다시 ^^ Process Explorer의 스레드 창에서 allocThreadFunc을 재개하고 다시 중지시키는 것입니다.

높은 확률로 GC Alloc Context에 값이 나온 상태의 스레드 중지를 할 수 있을 것입니다. 그런 상태에서 GC.Collect를 호출해 보면,

{
    Console.WriteLine("before: GC.Collect");
    GCCount();
    GC.Collect(2);
    GCCount();
    Console.WriteLine("after: GC.Collect");
    Console.ReadLine();
}

와~~~ 정말 GC.Collect 메서드가 끝나질 않습니다. 이렇게 blocking 된 상태의 !threads 명령어를 보면,

0:008> !threads
ThreadCount:      4
UnstartedThread:  0
BackgroundThread: 3
PendingThread:    0
DeadThread:       0
Hosted Runtime:   no
                                                                                                        Lock  
       ID OSID ThreadOBJ           State GC Mode     GC Alloc Context                  Domain           Count Apt Exception
   0    1 2bb0 000001b5bd072600    2a020 Preemptive  000001B5BEF64860:000001B5BEF667B0 000001b5bd0482f0 1     MTA (GC) 
   3    2 64d0 000001b5bd09d5c0    2b220 Preemptive  0000000000000000:0000000000000000 000001b5bd0482f0 0     MTA (Finalizer) 
   4    3 51a0 000001b5bd0c6700    2b220 Preemptive  0000000000000000:0000000000000000 000001b5bd0482f0 0     MTA 
   5    4  f44 000001b5bd0d5bb0    2b2a2 Cooperative 000001B5BEF62DB8:000001B5BEF647B0 000001b5bd0482f0 0     MTA 

2bb0 == GC.Collect 수행 스레드
f44  == allocThreadFunc 실행 중 suspend된 스레드

GC.Collect를 호출한 스레드에도 "GC Alloc Context" 값이 있고 마지막에 GC 수행 중임을 알리는 "(GC)" 문자열도 보입니다. 이어서 GC.Collect를 수행한 스레드의 콜 스택을 보면,

0:000> k
 # Child-SP          RetAddr           Call Site
00 0000002d`69afe618 00007ffa`18db9252 ntdll!NtWaitForSingleObject+0x14
01 0000002d`69afe620 00007ffa`059d2c77 KERNELBASE!WaitForSingleObjectEx+0xa2
02 0000002d`69afe6c0 00007ffa`059d2c2f clr!LogHelp_NoGuiOnAssert+0x23b87
03 0000002d`69afe700 00007ffa`059d2bb0 clr!LogHelp_NoGuiOnAssert+0x23b3f
04 0000002d`69afe760 00007ffa`05a08854 clr!LogHelp_NoGuiOnAssert+0x23ac0
05 0000002d`69afe7f0 00007ffa`05a06704 clr!LogHelp_NoGuiOnAssert+0x59764
06 0000002d`69afe8e0 00007ffa`05b4bbb3 clr!LogHelp_NoGuiOnAssert+0x57614
07 0000002d`69afe9e0 00007ffa`05b06e7d clr!ClrCreateManagedInstance+0x4a763
08 0000002d`69afea40 00007ffa`05af3efa clr!ClrCreateManagedInstance+0x5a2d
09 0000002d`69afea90 00007ffa`02dfd1fa clr!PreBindAssemblyEx+0x31ca
0a 0000002d`69afeb20 00007ffa`02dfd065 mscorlib_ni!System.GC.Collect(Int32, System.GCCollectionMode, Boolean, Boolean)$##6000E92+0xaa
...[생략]...
16 0000002d`69affa30 00007ffa`0f0aa4cc mscoreei!CorExeMain+0x112
17 0000002d`69affa90 00007ffa`1ab33034 MSCOREE!CorExeMain_Exported+0x6c
18 0000002d`69affac0 00007ffa`1c491431 KERNEL32!BaseThreadInitThunk+0x14
19 0000002d`69affaf0 00000000`00000000 ntdll!RtlUserThreadStart+0x21

GC.Collect 내부 호출 과정 중에 NtWaitForSingleObject에 걸려 있습니다. 만약 이런 상태의 hang이 걸린 경우 덤프를 뜨고 "DebugDiag Analysis"를 돌려 보면 다음과 같은 메시지를 확인할 수 있습니다.

The following threads in ConsoleApp1.dmp are waiting for .net garbage collection to finish. Thread 0 triggered the garbage collection. The gargage collector thread wont start doing its work till the time the threads which have pre-emptive GC disabled have finished executing. The following threads have pre-emptive GC disabled 5,


위에서 "pre-emptive GC disabled" 상태가 바로 Cooperative 모드입니다. 즉, 디버거 스레드 id 5번에 해당하는 스레드가 현재 Cooperative 모드로부터 풀릴 때까지 대기하고 있다는 것입니다. 재미있는 건, 해당 스레드의 호출 스택을 DebugDiag가 더 잘 보여준다는 것입니다. 실제로 다음과 같은 호출 스택을 보여주는데,

ntdll!NtWaitForSingleObject+14 
KERNELBASE!WaitForSingleObjectEx+a2 
clr!CLREventWaitHelper2+3c 
clr!CLREventWaitHelper+1f 
clr!CLREventBase::WaitEx+7c 
clr!ThreadSuspend::SuspendRuntime+32c 
clr!ThreadSuspend::SuspendEE+128 
clr!WKS::GCHeap::GarbageCollectGeneration+b7 
clr!WKS::GCHeap::GarbageCollect+8d 
clr!GCInterface::Collect+6a 
mscorlib_ni!System.GC.Collect(Int32, System.GCCollectionMode, Boolean, Boolean)+aa 
[[InlinedCallFrame] (System.GC._Collect)] System.GC._Collect(Int32, Int32) 
mscorlib_ni!System.GC.Collect(Int32)+15 
ConsoleApp1.Program.Main(System.String[])+173 
...[생략]...
ntdll!RtlUserThreadStart+21 

GC를 수행하기 위해 다른 스레드들이 안전한 지점에 이를 때까지 대기하고 있는 것을 유추해 볼 수 있습니다. 또한, 순수 닷넷 코드만을 실행시키던 threadFunc은 같은 시기에 다음과 같이 GC 작업이 완료되기를 기다리면서 중지 상태로 빠집니다. (즉, GC 수행 준비 기간부터 이미 중지 상태로 빠지는 것입니다.)

ntdll!NtWaitForSingleObject+14 
KERNELBASE!WaitForSingleObjectEx+a2 
clr!CLREventWaitHelper2+3c 
clr!CLREventWaitHelper+1f 
clr!CLREventBase::WaitEx+7c 
clr!WKS::GCHeap::WaitUntilGCComplete+2b 
clr!Thread::RareDisablePreemptiveGC+180 
clr!Thread::RedirectedHandledJITCase+1bf 
[[RedirectedThreadFrame]] 
clr!RedirectedHandledJITCaseForGCThreadControl_Stub+26 
ConsoleApp1.Program.threadFunc()+c6 
...[생략]...
ntdll!RtlUserThreadStart+21 

threadFunc의 저런 상태에 대해 비록 Full Framework은 아니지만 아래의 글에 있는 내용을 참고할 수 있습니다.

NETCF: GC and thread blocking
; https://blogs.msdn.microsoft.com/abhinaba/2009/09/02/netcf-gc-and-thread-blocking/

Before actually running GC the CLR tries to go into a “safe point”. Each thread has a suspend event associated with it and this event is checked by each thread regularly. Before starting GC the CLR enumerates all managed threads and in each of them sets this event. In the next point when the thread checks and finds this event set, it blocks waiting for the event to get reset (which happens when GC is complete).


이 정도면, preemptive/cooperative 모드에 대한 미스터리가 어느 정도 풀린 것 같습니다. ^^

(첨부 파일은 이 글의 예제 코드를 포함합니다.)




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]





[최초 등록일: ]
[최종 수정일: 8/1/2018 ]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer@outlook.com

비밀번호

댓글 쓴 사람
 




1  2  3  4  5  6  7  8  9  10  11  12  13  14  [15]  ...
NoWriterDateCnt.TitleFile(s)
11655정성태8/18/20181626사물인터넷: 28. 저항과 병렬로 연결한 LED파일 다운로드1
11654정성태8/18/20181299사물인터넷: 27. 병렬 회로의 저항, 전압 및 전류파일 다운로드1
11653정성태8/18/20181131사물인터넷: 26. 입력 전압에 따른 LED의 전압/저항 변화파일 다운로드1
11652정성태9/11/20181018사물인터넷: 25. 컬렉터 9V, 베이스에 5V와 3.3V 전압으로 테스트하는 C1815 트랜지스터파일 다운로드1
11651정성태9/4/20182033사물인터넷: 24. 9V 전압에서 테스트하는 C1815 트랜지스터파일 다운로드3
11650정성태8/18/20181116사물인터넷: 23. 가변저항으로 분압파일 다운로드1
11649정성태8/14/20181228사물인터넷: 22. 저항에 따른 전류 테스트파일 다운로드1
11648정성태10/17/20181690사물인터넷: 21. 퓨즈를 이용한 회로 보호파일 다운로드3
11647정성태8/8/20181382오류 유형: 476. 음수의 음수는 여전히 음수가 되는 수(절대값이 음수인 수)
11646정성태8/8/20181101오류 유형: 475. gacutil.exe 실행 시 "Failure initializing gacutil" 오류 발생
11645정성태8/8/20181204오류 유형: 474. 닷넷 COM+ - Failed to load the runtime.
11644정성태8/8/20181735디버깅 기술: 118. windbg - 닷넷 개발자를 위한 MEX Debugging Extension 소개
11643정성태8/12/20181831사물인터넷: 20. 아두이노 레오나르도 R3 호환 보드의 3.3v 핀의 LED 전압/전류 테스트 [1]파일 다운로드1
11642정성태8/3/20181722Graphics: 20. Unity - LightMode의 ForwardBase에 따른 _WorldSpaceLightPos0 값 변화
11641정성태8/3/20182368Graphics: 19. Unity로 실습하는 Shader (10) - 빌보드 구현파일 다운로드1
11640정성태8/3/20181877Graphics: 18. Unity - World matrix(unity_ObjectToWorld)로부터 Position, Rotation, Scale 값을 복원하는 방법파일 다운로드1
11639정성태8/2/20181436디버깅 기술: 117. windbg - 덤프 파일로부터 추출한 DLL을 참조하는 방법
11638정성태8/2/20181308오류 유형: 473. windbg - 덤프 파일로부터 추출한 DLL 참조 시 "Resolved file has a bad image, no metadata, or is otherwise inaccessible." 빌드 오류
11637정성태8/1/20181639Graphics: 17. Unity - World matrix(unity_ObjectToWorld)로부터 TRS(이동/회전/크기) 행렬로 복원하는 방법파일 다운로드1
11636정성태8/1/20182412Graphics: 16. 3D 공간에서 두 점이 이루는 각도 구하기파일 다운로드1
11635정성태8/1/20181406오류 유형: 472. C# 컴파일 오류 - Your project is not referencing the ".NETFramework,Version=v3.5" framework.
11634정성태8/1/20181338.NET Framework: 790. .NET Thread 상태가 Cooperative일 때 GC hang 현상 재현 방법파일 다운로드1
11633정성태7/29/20182064Graphics: 15. Unity - shader의 World matrix(unity_ObjectToWorld)를 수작업으로 구성
11632정성태7/28/20183980Graphics: 14. C# - Unity에서 캐릭터가 바라보는 방향을 기준으로 카메라의 위치 이동 및 회전하는 방법
11631정성태7/27/20183139Graphics: 13. Unity로 실습하는 Shader (9) - 투명 배경이 있는 텍스처 입히기
11630정성태7/27/20181836개발 환경 구성: 391. (GitHub 등과 직접 연동해) 소스 코드 디버깅을 쉽게 해 주는 SourceLink [2]
1  2  3  4  5  6  7  8  9  10  11  12  13  14  [15]  ...