Microsoft MVP성태의 닷넷 이야기
.NET Framework: 734. C# - Thread.Suspend 호출 시 응용 프로그램 hang 현상 [링크 복사], [링크+제목 복사],
조회: 24527
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
(연관된 글이 1개 있습니다.)
(시리즈 글이 4개 있습니다.)
.NET Framework: 734. C# - Thread.Suspend 호출 시 응용 프로그램 hang 현상
; https://www.sysnet.pe.kr/2/0/11473

디버깅 기술: 113. windbg - Thread.Suspend 호출 시 응용 프로그램 hang 현상에 대한 덤프 분석
; https://www.sysnet.pe.kr/2/0/11475

.NET Framework: 863. C# - Thread.Suspend 호출 시 응용 프로그램 hang 현상을 해결하기 위한 시도
; https://www.sysnet.pe.kr/2/0/12028

.NET Framework: 1056. C# - Thread.Suspend 호출 시 응용 프로그램 hang 현상 (2)
; https://www.sysnet.pe.kr/2/0/12626




C# - Thread.Suspend 호출 시 응용 프로그램 hang 현상

닷넷에서, 다른 스레드의 콜 스택을 얻는 여러 가지 방법이 있지만,

.NET에서의 스레드 콜 스택 덤프
; https://www.sysnet.pe.kr/2/0/802

"Stack Walking" in the .NET Runtime
; https://mattwarren.org/2019/01/21/Stackwalking-in-the-.NET-Runtime/

그중에서 (제 경험으로는) 가장 안정적인 것은 System.Diagnostics.StackTrace를 이용하는 방법이었습니다. 그런데, 이것을 사용하기 위해서는 대상 스레드를 반드시 Suspend 시켜야 합니다. 그리고 Suspend 메서드의 경우,

Thread.Suspend Method
; https://learn.microsoft.com/en-us/dotnet/api/system.threading.thread.suspend

주의 사항으로 다음과 같은 문구가 있습니다.

Do not use the Suspend and Resume methods to synchronize the activities of threads. You have no way of knowing what code a thread is executing when you suspend it. If you suspend a thread while it holds locks during a security permission evaluation, other threads in the AppDomain might be blocked. If you suspend a thread while it is executing a class constructor, other threads in the AppDomain that attempt to use that class are blocked. Deadlocks can occur very easily.


hang 현상은 다음과 같은 코드로 쉽게 재현이 가능합니다.

using System;
using System.Collections.Generic;
using System.Threading;

namespace ConsoleApp1
{
    class Program
    {
        List<Thread> _threads = new List<Thread>();

        static void Main(string[] args)
        {
            Program pg = new Program();
            pg.Start();
            Console.ReadLine();
        }

        int _count = 0;
        int _gcCount = 0;

        private void Start()
        {
            for (int i = 0; i < 4; i++)
            {
                Thread t = new Thread(threadFunc);
                _threads.Add(t);
                t.IsBackground = true;
                t.Name = i.ToString();
                t.Start();
            }

            Thread.Sleep(5000);
            Random rd = new Random(Environment.TickCount);

            while (true)
            {
                _count++;
                int idx = rd.Next(0, _threads.Count - 1);
                Thread t = _threads[idx];

                {
                    GetCallStack(t);
                }

                _gcCount = GC.CollectionCount(2);

                if (_count % 100 == 0)
                {
                    Console.WriteLine(_count + ": " + _gcCount);
                }
            }
        }

        private static string GetCallStack(Thread t)
        {
            System.Diagnostics.StackTrace trace = null;
            t.Suspend();
            try
            {
                trace = new System.Diagnostics.StackTrace(t, false);
                return trace.ToString();
            }
            catch
            {
            }
            finally
            {
                try
                {
                    t.Resume();
                }
                catch { }
            }

            return "";
        }

        private static void threadFunc()
        {
            List<byte[]> _bufs = new List<byte[]>();

            while (true)
            {
                byte[] buf1 = new byte[4096 * 512];
                lock (_bufs)
                {
                    _bufs.Add(buf1);

                    if (_bufs.Count >= 2)
                    {
                        _bufs.Clear();
                    }
                }

                Thread.Sleep(10);
            }
        }
    }
}

/*

app.config

<?xml version="1.0" encoding="utf-8" ?>
<configuration>
    <startup> 
        <supportedRuntime version="v4.0" sku=".NETFramework,Version=v4.7.1" />
    </startup>

    <runtime>
        <gcServer enabled="true"/>
    </runtime>
</configuration>

*/

실행해 보면, 무작위 시점에서 응용 프로그램이 멈추는 것을 확인할 수 있습니다.

이유는 간단합니다. 스레드 하나가 new로 관리 힙에 객체를 생성하다가 어느 순간 GC가 필요하다고 판단될 때가 있습니다. 하지만, GC를 수행하는 스레드는 GC 작업을 수행해도 안전한지에 대해 다른 스레드들의 상태를 확인합니다. 각각의 스레드는 GC 작업을 해도 괜찮은 지에 대한 상태를 Preemptive와 Cooperative로 나눠 구분하는데, 전자의 경우가 안전한 것이고 후자의 상태에 있는 스레드가 있다면 GC 스레드는 GC 작업을 수행하지 않고 대상 스레드를 멈춘(suspend) 후 안전 영역의 코드를 수행 중인지 다시 확인합니다. 만약 안전 영역이라면 GC 수행을 할 수 있고, 안전하지 않다면 안전 영역으로 나올 수 있도록 스레드를 resume 시킨 후 GC는 대기하게 됩니다. (Resume으로 다시 동작하게 된 스레드는 안전 영역으로 나오자마자 GC가 수행되도록 blocking됩니다.)

다시 정리해 보면, A 스레드가 GC를 수행해야 한다고 판단했고 다른 스레드의 상태를 체크하는 코드를 수행 중입니다. 그런데 바로 그 시점에 B 스레드가 A 스레드를 Suspend 시키고 A 스레드의 호출 스택을 가져오려고 합니다. 여기서 문제는, 호출 스택을 가져오려는 그 동작조차도 "new"로 인한 관리 힙을 사용하려고 시도하기 때문에 관리 힙이 GC를 위한 준비 상태이므로 GC 작업이 끝날 때까지 대기하게 됩니다. 결국 B 스레드는 A 스레드를 Resume하지 못하고 대기하므로 이 시점부터 응용 프로그램의 모든 스레드에서 "new"를 호출하기만 하면 대기 상태에 빠지게 됩니다. 한마디로, 응용 프로그램 레벨에서 hang 상태에 빠지는 것입니다.

(첨부 파일은 이 글의 예제 코드를 포함합니다.)




이 사례에 비춰서 "If you suspend a thread while it holds locks during a security permission evaluation" 구문도 유추할 수 있습니다. 즉, 보안 권한에 대한 평가를 위해 내부적으로 CLR은 lock을 획득한다는 것이고, 그 상태의 스레드를 Suspend 시킨 측의 스레드가 Resume을 호출하기 전 역시 보안 권한에 대한 평가를 하는 코드를 호출하게 된다면... 으로 해석할 수 있습니다.




(2020-10-09 업데이트) 이런 문제를 방지하려면 GC 수행이 있을 것이라는 감지를 하면 될 텐데, 이게 또 쉽지 않습니다. ^^; 일례로 다음의 글에 보면,

Thread.Suspend Method
; https://mattwarren.org/2016/08/08/GC-Pauses-and-Safe-Points/

ETW를 이용해 GC의 실행 예측을 할 수 있지만,
  1. GCSuspendEE_V1
  2. GCSuspendEEEnd_V1 <- suspension is done
  3. GCStart_V1
  4. GCEnd_V1 <- actual GC is done
  5. GCRestartEEBegin_V1
  6. GCRestartEEEnd_V1 <- resumption is done.
아쉽게도 예전에 설명했듯이 ETW는 실시간이 아니므로,

ETW(Event Tracing for Windows)를 이용한 닷넷 프로그램의 내부 이벤트 활용
; https://www.sysnet.pe.kr/2/0/12244

C# - ETW 관련 Win32 API 사용 예제 코드 (4) CLR ETW Consumer
; https://www.sysnet.pe.kr/2/0/12300

스레드 제어 시 사용할 수 없습니다. 또 다른 방법으로, CLR Profiler 관련한 GC 이벤트를 받는 것인데 이것은 실시간은 만족하지만 이로 인한 부하가 심해져,

windbg 분석 사례 - 닷넷 프로파일러의 GC 콜백 부하
; https://www.sysnet.pe.kr/2/0/10897

역시 현실적인 수준에서 사용할 수 없습니다.
(혹시 좋은 방법이 있으신 분은 덧글 부탁드립니다. ^^)




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 8/21/2023]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




... 166  167  168  169  170  171  172  173  174  175  [176]  177  178  179  180  ...
NoWriterDateCnt.TitleFile(s)
599정성태10/5/200830074디버깅 기술: 17. TFS Team Build + Symbol Server [1]
598정성태10/3/200820049VS.NET IDE: 57. VS.NET 2008 - 다중 프로젝트에서 단일 SNK를 사용하는 방법
597정성태10/2/200818733Team Foundation Server: 25. VSTS 2008의 Build Explorer
596정성태10/2/200825477오류 유형: 58. WPF : 드롭다운 유형의 ComboBox가 펼쳐지지 않는 문제
595정성태10/1/200833061디버깅 기술: 16. Watson Bucket 정보를 이용한 CLR 응용 프로그램 예외 분석 [2]
594정성태9/22/200821025.NET Framework: 104. Win32Exception 클래스 소개
591정성태7/24/200817810오류 유형: 57. VS.NET 2008 TFC - 체크인 시에 비프 음과 함께 정지되는 현상
592정성태7/28/200817794    답변글 오류 유형: 57.1. VS.NET 2008 TFC - 체크인 시에 비프 음과 함께 정지되는 현상 [1]
590정성태7/20/200823605.NET Framework: 103. WPF - ControlTemplate을 코드에서 다뤄보기 [1]
589정성태6/17/200820508.NET Framework: 102. COM 개체의 이벤트를 구독하는 코드 제작 [1]
588정성태6/13/200822363VC++: 35. COM 이벤트에서 반환값을 가진 콜백 정의
587정성태6/10/200827144VS.NET IDE: 56. C#에서 아쉬운 __DATE__, __TIME__ 매크로 [2]
586정성태6/4/200824772오류 유형: 56. WPF 디자이너 - The string was not recognized as a valid DateTime [2]
585정성태6/4/200832870.NET Framework: 101. WPF - ActiveX 컨트롤 호스팅하는 방법 [2]
582정성태5/16/200824717오류 유형: 55. Windowless ActiveX controls are not supported
580정성태4/24/200823798VC++: 34. 64비트 윈도우즈에서의 이벤트 후킹
579정성태4/24/200823653VC++: 33. 변환 후의 RGS 파일 내용을 얻는 방법
577정성태4/16/200824535.NET Framework: 100. XML Serializer를 이용한 값 복사 [5]
575정성태4/7/200821685오류 유형: 54. TFS Source Control - 명령을 사용할 수 없음 [2]
574정성태3/31/200819941오류 유형: 53. TFS 연결 오류 - The workspace [...] exists on computer [...]
573정성태3/25/200823665Windows: 31. TS Web Access와 UAC [1]
570정성태3/17/200823040오류 유형: 52. TFS 연결 오류 - TF31001 [2]
569정성태3/16/200823951Team Foundation Server: 24. TFS 2008로 마이그레이션 (2) [2]
566정성태2/28/200825107.NET Framework: 99. AppDomain.GetEntryAssembly()를 우회하는 방법파일 다운로드1
564정성태2/16/200824654Windows: 30. TS Web Access + Vista SP1 [2]
563정성태2/16/200824075오류 유형: 51. Vista(UAC) + 웹 프로젝트 디버깅: System.UnauthorizedAccessException
... 166  167  168  169  170  171  172  173  174  175  [176]  177  178  179  180  ...