Microsoft MVP성태의 닷넷 이야기
.NET Framework: 922. C# - .NET ThreadPool의 Local/Global Queue [링크 복사], [링크+제목 복사]
조회: 10933
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일

C# - .NET ThreadPool의 Local/Global Queue

오~~~ 멋진 글을 하나 읽어서 공유합니다. ^^

.NET ThreadPool starvation, and how queuing makes it worse
; https://medium.com/criteo-labs/net-threadpool-starvation-and-how-queuing-makes-it-worse-512c8d570527

위의 글에 포함된 링크를 보면 .NET ThreadPool의 Local/Global 큐에 대한 동작 방식을 확실히 알 수 있습니다. ^^

New and Improved CLR 4 Thread Pool Engine
; http://www.danielmoth.com/Blog/New-And-Improved-CLR-4-Thread-Pool-Engine.aspx

Work-Stealing in .NET 4.0
; https://learn.microsoft.com/en-us/archive/blogs/jennifer/work-stealing-in-net-4-0

정리해 보면, 스레드 풀은 1개의 Global Queue와 스레드 풀 내의 스레드 별로 1개씩의 Local Queue를 가집니다.

ThreadPool - Global Queue
    Thread #1 - LocalQueue
    Thread #2 - LocalQueue
    ...

그리고, 작업을 할당(Enqueue)할 때의 규칙은 이렇게 정리됩니다.

Global Queue에 추가하는 규칙
    - ThreadPool 외부의 스레드가 작업을 할당하는 경우
    -            내부의 스레드가 작업을 할당하는 경우
                    * ThreadPool.QueueUserWorkItem or ThreadPool.UnsafeQueueUserWorkItem
                    * Task.Factory.StartNew with the TaskCreationOptions.PreferFairness
                    * Task.Yield on the default task scheduler

Local Queue에 추가하는 규칙
    - 그 외의 모든 경우

가만 보면, 어차피 ThreadPool에 속하지 않은 외부의 스레드는 LocalQueue를 소유하고 있지 않기 때문에 GlobalQueue에 넣을 수밖에 없습니다. 그리고, 특별히 LocalQueue를 가지고 있는 ThreadPool 내의 스레드일지라도 3가지 규칙을 제외하고는 모두 LocalQueue에 넣는 정도로 이해하면 됩니다.

그리고, 이렇게 큐에 할당된 작업을 스레드 풀의 여유 스레드가 가져가는(Dequeue) 규칙은 이렇습니다.

ThreadPool 내의 스레드가 자유롭게 되면,
    - 해당 스레드의 LocalQueue에서 마지막 추가된(LIFO) 항목, 즉 큐의 tail에 있는 작업을 꺼내서 실행
        ; 마지막에 추가된 항목, 즉 최근 추가된 항목을 처리하는 이유는 cache의 locality에 따른 적중률을 높이기 위함
    - LocalQueue가 비었으면 GlobalQueue에서 오래된 항목(FIFO), 즉 큐의 head에 있는 작업을 꺼내서 실행
        ; 어차피 GlobalQueue라면 현재 스레드가 실행 중인 CPU의 cache 적중률이 높지 않을 것이므로 FIFO로 처리
    - GlobalQueue도 비었으면, 다른 스레드의 LocalQueue에서 오래된 항목(FIFO)을 꺼내서 실행
        ; 어차피 다른 스레드의 작업 항목이라면 마찬가지로 cache 적중률이 높지 않을 것이므로 FIFO 처리

보는 바와 같이 꽤나 상식적인 수준입니다. 우선 자신의 LocalQueue를 보고, 없으면 GlobalQueue를 보고, 그래도 없으면 ThreadPool 내의 다른 스레드가 소유한 LocalQueue를 보는 것입니다.




그런데, ".NET ThreadPool starvation, and how queuing makes it worse" 글에서 hang 현상에 빠지면서도 스레드는 계속 증가하는 재미있는 예제를 제시합니다.

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading;
using System.Threading.Tasks;

namespace ConsoleApp1
{
    class Program
    {
        static void Main(string[] args)
        {
            ThreadPool.SetMinThreads(8, 8);

            Task.Factory.StartNew(
                Producer,
                TaskCreationOptions.None);

            Console.ReadLine();
        }

        static void Producer()
        {
            while (true)
            {
                Process();

                Thread.Sleep(200);
            }
        }

        static async Task Process()
        {
            await Task.Yield();

            var tcs = new TaskCompletionSource<bool>();

            Task.Run(() =>
            {
                Thread.Sleep(1000);
                tcs.SetResult(true);
            });

            tcs.Task.Wait();

            Console.WriteLine($"Ended - {DateTime.Now} {tid} {mid}");
        }

        static int tid => AppDomain.GetCurrentThreadId();
        static int mid => Thread.CurrentThread.ManagedThreadId;
    }
}

위의 프로그램을 실행하면 다음과 같은 몇 번의 출력이 있은 다음 hang 상태에 빠집니다. (출력의 횟수는 실행할 때마다 달라질 수 있습니다.)

Ended - 2020-07-02 오후 10:44:50 7408 4
Ended - 2020-07-02 오후 10:44:51 9424 6
Ended - 2020-07-02 오후 10:44:51 21152 7
Ended - 2020-07-02 오후 10:44:51 5264 5
Ended - 2020-07-02 오후 10:44:52 14436 8
Ended - 2020-07-02 오후 10:44:52 20184 9
Ended - 2020-07-02 오후 10:44:53 5264 5
Ended - 2020-07-02 오후 10:44:53 7408 4

재미있는 것은, hang 상태를 겪으면서도 스레드는 계속 증가한다는 점입니다. 찬찬히 이 현상을 분석해 볼까요? ^^ 처음 Producer 메서드를,

- Main 스레드가 Producer를 GlobalQueue에 추가
- 1번 ThreadPoolThread가 Producer 꺼내서 실행

이후 200ms 마다 (이상적인 조건 하에) 다음과 같은 동작을 하다 결국 hang 상태에 빠집니다.

    0 - Process를 GlobalQueue에 추가
        2번 ThreadPoolThread가 Process를 실행하고, LocalQueue에 Thread.Sleep(1000)을 포함하는 작업 추가
        3번 ThreadPoolThread가 2번의 LocalQueue에 있는 작업을 실행 (1초 소모)
  200 - Process를 GlobalQueue에 추가
        4번 ThreadPoolThread가 Process를 실행하고, LocalQueue에 Thread.Sleep(1000)을 포함하는 작업 추가
        5번 ThreadPoolThread가 4번의 LocalQueue에 있는 작업을 실행 (1초 소모)
  400 - Process를 GlobalQueue에 추가
        6번 ThreadPoolThread가 Process를 실행하고, LocalQueue에 Thread.Sleep(1000)을 포함하는 작업 추가
        7번 ThreadPoolThread가 6번의 LocalQueue에 있는 작업을 실행 (1초 소모)
  600 - Process를 GlobalQueue에 추가
        8번 ThreadPoolThread가 Process를 실행하고, LocalQueue에 Thread.Sleep(1000)을 포함하는 작업 추가
  800 - Process를 GlobalQueue에 추가
 1000 - Process를 GlobalQueue에 추가
        3번 ThreadPoolThread가 2번의 LocalQueue에 있는 작업 실행 완료 후, 
            GlobalQueue로부터 Process를 실행하고, LocalQueue에 Thread.Sleep(1000)을 포함하는 작업 추가
        2번 ThreadPoolThread가 깨어나고,
            GlobalQueue로부터 Process를 실행하고, LocalQueue에 Thread.Sleep(1000)을 포함하는 작업 추가
        9번 ThreadPoolThread 추가
            Local/Global 모두 비어 있으므로 다른 스레드(예: 8번)의 LocalQueue에 있는 작업을 실행 (1초 소모)
 1200 - Process를 GlobalQueue에 추가
        5번 ThreadPoolThread가 4번의 LocalQueue에 있는 작업 실행 완료 후, 
            GlobalQueue로부터 Process를 실행하고, LocalQueue에 Thread.Sleep(1000)을 포함하는 작업 추가
        4번 ThreadPoolThread가 깨어나고,
            Local/Global 모두 비어 있으므로 다른 스레드(예: 3번)의 LocalQueue에 있는 작업을 실행 (1초 소모)
 1400 - Process를 GlobalQueue에 추가
        7번 ThreadPoolThread가 6번의 LocalQueue에 있는 작업 실행 완료 후, 
            GlobalQueue로부터 Process를 실행하고, LocalQueue에 Thread.Sleep(1000)을 포함하는 작업 추가
        6번 ThreadPoolThread가 깨어나고,
            Local/Global 모두 비어 있으므로 다른 스레드(예: 5번)의 LocalQueue에 있는 작업을 실행 (1초 소모)
 1600 - Process를 GlobalQueue에 추가
 1800 - Process를 GlobalQueue에 추가
 2000 - Process를 GlobalQueue에 추가
        9번 ThreadPoolThread가 8번의 LocalQueue에 있는 작업 실행 완료 후, 
            GlobalQueue로부터 Process를 실행하고, LocalQueue에 Thread.Sleep(1000)을 포함하는 작업 추가
        8번 ThreadPoolThread가 깨어나고,
            GlobalQueue로부터 Process를 실행하고, LocalQueue에 Thread.Sleep(1000)을 포함하는 작업 추가
       10번 ThreadPoolThread 추가
            GlobalQueue로부터 Process를 실행하고, LocalQueue에 Thread.Sleep(1000)을 포함하는 작업 추가
 2200 - Process를 GlobalQueue에 추가
        4번 ThreadPoolThread가 3번의 LocalQueue에 있는 작업 실행 완료 후, 
            GlobalQueue로부터 Process를 실행하고, LocalQueue에 Thread.Sleep(1000)을 포함하는 작업 추가
        3번 ThreadPoolThread가 깨어나고,
            Local/Global 모두 비어 있으므로 다른 스레드(예: 7번)의 LocalQueue에 있는 작업을 실행 (1초 소모)
 2400 - Process를 GlobalQueue에 추가
        6번 ThreadPoolThread가 5번의 LocalQueue에 있는 작업 실행 완료 후, 
            GlobalQueue로부터 Process를 실행하고, LocalQueue에 Thread.Sleep(1000)을 포함하는 작업 추가
        5번 ThreadPoolThread가 깨어나고,
            Local/Global 모두 비어 있으므로 다른 스레드(예: 9번)의 LocalQueue에 있는 작업을 실행 (1초 소모)
 2600 - Process를 GlobalQueue에 추가
 2800 - Process를 GlobalQueue에 추가
 3000 - Process를 GlobalQueue에 추가
       11번 ThreadPoolThread 추가
            GlobalQueue로부터 Process를 실행하고, LocalQueue에 Thread.Sleep(1000)을 포함하는 작업 추가
 3200 - Process를 GlobalQueue에 추가
        3번 ThreadPoolThread가 7번의 LocalQueue에 있는 작업 실행 완료 후, 
            GlobalQueue로부터 Process를 실행하고, LocalQueue에 Thread.Sleep(1000)을 포함하는 작업 추가
 3400 - Process를 GlobalQueue에 추가
        5번 ThreadPoolThread가 9번의 LocalQueue에 있는 작업 실행 완료 후, 
            GlobalQueue로부터 Process를 실행하고, LocalQueue에 Thread.Sleep(1000)을 포함하는 작업 추가
 3600 - Process를 GlobalQueue에 추가
 3800 - Process를 GlobalQueue에 추가
 4000 - Process를 GlobalQueue에 추가
       12번 ThreadPoolThread 추가
            GlobalQueue로부터 Process를 실행하고, LocalQueue에 Thread.Sleep(1000)을 포함하는 작업 추가
 4200 - Process를 GlobalQueue에 추가
 4400 - Process를 GlobalQueue에 추가
 4600 - Process를 GlobalQueue에 추가
 4800 - Process를 GlobalQueue에 추가
    .... 이후 반복 (LocalQueue에 있는 Thread.Sleep(1000)을 포함하는 작업을 꺼내올 스레드가 없어 모든 스레드 풀의 스레드가 작업이 완료되지 않은 체로 hang)

좀 지겹게 긴데 ^^ 간단하게 요약해 보면, SetMinThreads를 8로 지정했기 때문에 처음 8개의 스레드는 스레드 풀 내에서 요청이 있으면 곧바로 생성되지만, 그 이후의 스레드는 필요하면 1초 정도의 지연 후에 스레드 풀에 추가되므로 1초에 5개의 작업이 생성되는 것을 못 따라갑니다. 문제는, 못 따라가는 것뿐만 아니라 해당 Task가 종료되기 위해 내부에서 다시 생성한 Task의 작업을 담당할 스레드가 없게 되어 결국 hang이 걸릴 수밖에 없는 것입니다.

이 현상을 없애려면, Process 메서드 작업을 Global Queue가 아닌 Local Queue에 등록하도록 하면 됩니다. 따라서 소스 코드 중 (Global Queue에 등록하는) Task.Yield를 (Local Queue로 등록하는) Task.Factory.StartNew로 대체하면 hang 현상이 해결됩니다.

static void Producer()
{
    while (true)
    {
        // Process 작업을 Local Queue에 추가
        Task.Factory.StartNew(Process);
        Thread.Sleep(200);
    }
}

static async Task Process()
{
    // Removed the Task.Yield

    var tcs = new TaskCompletionSource();
    Guid guid = Guid.NewGuid();

    Task.Run(() =>
    {
        Thread.Sleep(1000);
        tcs.SetResult(true);
    });

    tcs.Task.Wait();

    Console.WriteLine($"Ended - {guid} {DateTime.Now} {tid} {mid}");
}

물론 위의 소스 코드에서도 Task.Factory.StartNew에 TaskCreationOptions.PreferFairness 옵션을 주면 Global Queue에 추가를 하므로 다시 hang 현상이 발생합니다.

static void Producer()
{
    while (true)
    {
        Task.Factory.StartNew(Process, TaskCreationOptions.PreferFairness); // Global Queue에 추가하므로 hang 현상 발생
        Thread.Sleep(200);
    }
}




위의 문제를 얼핏 보면, 개발자가 그럼 Global Queue와 Local Queue에 대한 것도 감안해서 코딩을 해야 하느냐...라는 질문을 할 수 있습니다. 물론 그렇긴 한데, 보다 더 간단하게 "스레드 풀 내의 스레드에서 다른 작업의 완료를 기다리는 처리는 주의해야 한다"라는 것으로 원칙을 삼으면 됩니다.

그러고 보니, 이와 유사한 문제를 전에도 async/await을 다루면서 설명한 적이 있습니다. ^^

async/await 사용 시 hang 문제가 발생하는 경우
; https://www.sysnet.pe.kr/2/0/1541

참고로, 이 문제는 Global/Local 큐에 대한 규칙과 함께 ThreadPool에 신규 스레드를 추가하는데 1초 정도의 지연이 발생하는 문제가 함께 겹쳐서 발생하는 것이기도 합니다.

ThreadPool.QueueUserWorkItem의 실행 지연
; https://www.sysnet.pe.kr/2/0/1455

따라서, "원 글"에서 제시한 방법인 Global Queue를 사용하지 않도록 하는 것 외에도, 초기 스레드 풀의 스레드 수를 넉넉하게 지정하는 해결책도 있습니다. 즉, 문제가 되었던 코드에서 SetMinThreads를 다음과 같이 바꿔도 hang 현상 없이 정상적으로 잘 서비스가 됩니다.

ThreadPool.SetMinThreads(30, 30);

(첨부 파일은 이 글의 예제 코드를 포함합니다.)




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 5/29/2023]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




... 16  17  [18]  19  20  21  22  23  24  25  26  27  28  29  30  ...
NoWriterDateCnt.TitleFile(s)
13172정성태11/25/20225096.NET Framework: 2071. 닷넷에서 ESP/RSP 레지스터 값을 구하는 방법파일 다운로드1
13171정성태11/25/20224680Windows: 214. 윈도우 - 스레드 스택의 "red zone"
13170정성태11/24/20224989Windows: 213. 윈도우 - 싱글 스레드는 컨텍스트 스위칭이 없을까요?
13169정성태11/23/20225607Windows: 212. 윈도우의 Protected Process (Light) 보안 [1]파일 다운로드2
13168정성태11/22/20224877제니퍼 .NET: 31. 제니퍼 닷넷 적용 사례 (9) - DB 서비스에 부하가 걸렸다?!
13167정성태11/21/20224917.NET Framework: 2070. .NET 7 - Console.ReadKey와 리눅스의 터미널 타입
13166정성태11/20/20224638개발 환경 구성: 651. Windows 사용자 경험으로 WSL 환경에 dotnet 런타임/SDK 설치 방법
13165정성태11/18/20224546개발 환경 구성: 650. Azure - "scm" 프로세스와 엮인 서비스 모음
13164정성태11/18/20225463개발 환경 구성: 649. Azure - 비주얼 스튜디오를 이용한 AppService 원격 디버그 방법
13163정성태11/17/20225390개발 환경 구성: 648. 비주얼 스튜디오에서 안드로이드 기기 인식하는 방법
13162정성태11/15/20226461.NET Framework: 2069. .NET 7 - AOT(ahead-of-time) 컴파일
13161정성태11/14/20225702.NET Framework: 2068. C# - PublishSingleFile로 배포한 이미지의 역어셈블 가능 여부 (난독화 필요성) [4]
13160정성태11/11/20225631.NET Framework: 2067. C# - PublishSingleFile 적용 시 native/managed 모듈 통합 옵션
13159정성태11/10/20228805.NET Framework: 2066. C# - PublishSingleFile과 관련된 옵션 [3]
13158정성태11/9/20225112오류 유형: 826. Workload definition 'wasm-tools' in manifest 'microsoft.net.workload.mono.toolchain' [...] conflicts with manifest 'microsoft.net.workload.mono.toolchain.net7'
13157정성태11/8/20225765.NET Framework: 2065. C# - Mutex의 비동기 버전파일 다운로드1
13156정성태11/7/20226678.NET Framework: 2064. C# - Mutex와 Semaphore/SemaphoreSlim 차이점파일 다운로드1
13155정성태11/4/20226188디버깅 기술: 183. TCP 동시 접속 (연결이 아닌) 시도를 1개로 제한한 서버
13154정성태11/3/20225660.NET Framework: 2063. .NET 5+부터 지원되는 GC.GetGCMemoryInfo파일 다운로드1
13153정성태11/2/20226936.NET Framework: 2062. C# - 코드로 재현하는 소켓 상태(SYN_SENT, SYN_RECV)
13152정성태11/1/20225563.NET Framework: 2061. ASP.NET Core - DI로 추가한 클래스의 초기화 방법 [1]
13151정성태10/31/20225676C/C++: 161. Windows 11 환경에서 raw socket 테스트하는 방법파일 다운로드1
13150정성태10/30/20225714C/C++: 160. Visual Studio 2022로 빌드한 C++ 프로그램을 위한 다른 PC에서 실행하는 방법
13149정성태10/27/20225643오류 유형: 825. C# - CLR ETW 이벤트 수신이 GCHeapStats_V1/V2에 대해 안 되는 문제파일 다운로드1
13148정성태10/26/20225637오류 유형: 824. msbuild 에러 - error NETSDK1005: Assets file '...\project.assets.json' doesn't have a target for 'net5.0'. Ensure that restore has run and that you have included 'net5.0' in the TargetFramew
13147정성태10/25/20224760오류 유형: 823. Visual Studio 2022 - Unable to attach to CoreCLR. The debugger's protocol is incompatible with the debuggee.
... 16  17  [18]  19  20  21  22  23  24  25  26  27  28  29  30  ...