Microsoft MVP성태의 닷넷 이야기
.NET Framework: 763. .NET Core 2.1 - Tiered Compilation 도입 [링크 복사], [링크+제목 복사],
조회: 11902
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
(연관된 글이 4개 있습니다.)

.NET Core 2.1 - Tiered Compilation 도입

아래의 글에 tiered compilation에 대한 소개가 있습니다.

Announcing .NET Core 2.1
; https://devblogs.microsoft.com/dotnet/announcing-net-core-2-1/

"Adaptive optimization"이라고도 알려진 이것의 개념은 간단합니다. 이 옵션이 켜져 있으면 해당 응용 프로그램은 JIT 컴파일 시에 최적화보다는 빠른 속도를 위주로 기계어 번역을 하게 됩니다. 이 단계를 "first tier"라고 합니다. 그러다, 자주 실행되는 메서드가 있으면 그에 대해 감지하고 다시 최적화된 코드로 JIT 컴파일을 하는 식인데 이를 "second tier"라고 합니다.

과거 자바 런타임이 했던 방식과 유사한 면이 있습니다. 자바의 경우 최초 실행 시에 JIT하지 않고 바이트 언어를 그냥 인터프리팅 식으로 그때그때 해석해서 실행하는데, 자주 실행되는 함수라고 판단이 되면 그제서야 JIT를 해 기계어로 번역하는 식입니다.

"tiered compilation" 적용 방법은 프로젝트 파일에 TieredCompilation 옵션을 true로 설정하거나,

<Project Sdk="Microsoft.NET.Sdk">

  <PropertyGroup>
    <OutputType>Exe</OutputType>
    <TargetFramework>netcoreapp2.1</TargetFramework>
    <Description>A simple .NET Core global tool called "dotnetsay".</Description>
    ...[생략]...
    <TieredCompilation>true</TieredCompilation>
  </PropertyGroup>

  <ItemGroup Condition="'$(ContinuousIntegrationBuild)'=='true'">
    <PackageReference Include="Microsoft.SourceLink.GitHub" Version="1.0.0-beta-62925-02" PrivateAssets="All"/>
  </ItemGroup>

</Project>

.NET Core 2.1 이상의 응용 프로그램을 실행 시 환경 변수에 COMPlus_TieredCompilation을 "1"로 설정하면 됩니다.

SET COMPlus_TieredCompilation="1"

(2023-11-20 업데이트: .NET Core 3.0+부터는 TieredCompilation 옵션의 기본값이 enabled로 바뀌었습니다.)




혹시 눈으로 직접 확인해 볼 수 있을까요? ^^

그래서 예제 코드를 하나 준비해봤습니다.

using System;
using System.Reflection;
using System.Threading;

namespace ConsoleApp1
{
    // 빌드: .NET Core x64 + Release
    class Program
    {
        static void Main(string[] args)
        {
            Thread t = new Thread(CheckMethodJitAddress);
            t.IsBackground = true;

            Program pg = new Program();

            {
                pg.ManyCalls();
                CheckMethodJitAddress(false);
            }

            Console.ReadLine(); // first-tier 확인을 위해!
            t.Start(true);

            Thread.Sleep(1000);

            while (true)
            {
                pg.ManyCalls(); // 아마 이 루프의 어디선가 second-tier로 진행할 듯!
                Thread.Sleep(1000);
            }
        }

        public long ManyCalls()
        {
            long sum = 0;

            for (int i = 0; i < (Environment.TickCount % 10_000); i ++)
            {
                sum += i;
            }

            return sum;
        }

        private static void CheckMethodJitAddress(object obj)
        {
            do
            {
                MethodInfo mi = typeof(Program).GetMethod("ManyCalls");
                RuntimeMethodHandle rmh = mi.MethodHandle;

                Console.WriteLine(rmh.GetFunctionPointer().ToString("x"));
                Thread.Sleep(1000);
            } while ((bool)obj == true);
        }
    }
}

위의 코드를 실행하면, ManyCalls라는 메서드를 1초에 한 번씩 계속 실행하는데 다른 스레드에서는 그것의 FunctionPointer를 구해,

상황별 GetFunctionPointer 반환값 정리
; https://www.sysnet.pe.kr/2/0/1027

출력합니다. JIT가 2번째가 되면 FunctionPointer의 주소가 바뀔 거라고 생각한 건데요, 의외로 계속 바뀌지 않고 그냥 고정된 값을 출력합니다. 음... ^^ 딴 방법을 이용해야 할 것 같습니다.

이를 위해 windbg를 이용해 봤는데요, sos 확장을 로드하고,

0:009> .loadby sos coreclr

ManyCalls의 JIT 이후의 기계어 코드 위치를 다음과 같이 확인할 수 있습니다.

0:009> !name2ee ConsoleApp1!ConsoleApp1.Program
Module:      00007ff7b2024578
Assembly:    ConsoleApp1.dll
Token:       0000000002000002
MethodTable: 00007ff7b2025560
EEClass:     00007ff7b21c1088
Name:        ConsoleApp1.Program

0:009> !dumpmt -md  00007ff7b2025560
EEClass:         00007ff7b21c1088
Module:          00007ff7b2024578
Name:            ConsoleApp1.Program
mdToken:         0000000002000002
File:            E:\ConsoleApp1\bin\Release\netcoreapp2.1\ConsoleApp1.dll
BaseSize:        0x18
ComponentSize:   0x0
Slots in VTable: 8
Number of IFaces in IFaceMap: 0
--------------------------------------
MethodDesc Table
           Entry       MethodDesc    JIT Name
00007ff807aa2020 00007ff807600988 PreJIT System.Object.ToString()
00007ff807aa2040 00007ff807600990 PreJIT System.Object.Equals(System.Object)
00007ff807aa2090 00007ff8076009b8 PreJIT System.Object.GetHashCode()
00007ff807aa20a0 00007ff8076009d8 PreJIT System.Object.Finalize()
00007ff7b21410b0 00007ff7b2025550    JIT ConsoleApp1.Program..ctor()
00007ff7b2141098 00007ff7b2025508    JIT ConsoleApp1.Program.Main(System.String[])
00007ff7b21410a0 00007ff7b2025520    JIT ConsoleApp1.Program.ManyCalls()
00007ff7b21410a8 00007ff7b2025538    JIT ConsoleApp1.Program.CheckMethodJitAddress(System.Object)

00007ff7b21410a0 값은 실제로 GetFunctionPointer가 반환한 값과 일치합니다. ManyCalls 메서드에 대해 좀 더 살펴보면,

0:009> !DumpMD /d 00007ff7b2025520
Method Name:          ConsoleApp1.Program.ManyCalls()
Class:                00007ff7b21c1088
MethodTable:          00007ff7b2025560
mdToken:              0000000006000002
Module:               00007ff7b2024578
IsJitted:             yes
Current CodeAddr:     00007ff7b2142010
Code Version History:
  CodeAddr:           00007ff7b2142010  (Tier 0)
  NativeCodeVersion:  0000000000000000

최초 한 번 실행된 상태이기 때문에 "Tier 0" 단계임을 알 수 있습니다. 그리고 응용 프로그램을 계속 실행해 ManyCalls를 어느 정도 실행한 시점에 다시 windbg로 멈추고 덤프를 해보면,

0:010> !DumpMD /d 00007ff7b2025520
Method Name:          ConsoleApp1.Program.ManyCalls()
Class:                00007ff7b21c1088
MethodTable:          00007ff7b2025560
mdToken:              0000000006000002
Module:               00007ff7b2024578
IsJitted:             yes
Current CodeAddr:     00007ff7b21439e0
Code Version History:
  CodeAddr:           00007ff7b21439e0  (Tier 1)
  NativeCodeVersion:  000001e92a9693c0
  CodeAddr:           00007ff7b2142010  (Tier 0)
  NativeCodeVersion:  0000000000000000

보는 바와 같이 JIT CodeAddr 위치가 바뀌었고 Tier 1이라고 보여줍니다. 즉, 실제로 JIT가 대상 메서드에 대해 2번 발생한 것입니다.




그런데 GetFunctionPointer 반환값은 무엇일까요? Tier 1 단계에서 해당 위치를 역어셈블 해보면,

0:010> u 00007ff7b21410a0
00007ff7`b21410a0 e93b290000      jmp     00007ff7`b21439e0
...[생략]...

보는 바와 같이 jmp 문의 위치가 바로 GetFunctionPointer의 값입니다. jmp 문의 기계어를 보면 e93b290000인데, 5바이트 중 첫 번째 e9이 jmp이고 이후의 4바이트가 점프할 상대 변위(offset) 값입니다.

jmp     == e9
offset  == 3b290000

실제로 GetFunctionPointer가 반환한 00007ff7b21410a0 주소와 "!dumpmd"로 확인한 "Current CodeAddr"의 00007ff7b21439e0 주소의 차이를 보면,

0:010> ? 00007ff7`b21439e0 - 00007ff7`b21410a0
Evaluate expression: 10560 = 00000000`00002940

0:010> ? 00007ff7`b21439e0 - 00007ff7`b21410a0 - 5
Evaluate expression: 10555 = 00000000`0000293b

0000293b 값이 나옵니다. little endian 저장임을 감안하면 e93b290000 기계어 코드와 정확히 일치합니다.




windbg를 통해 알게 된 지식으로 이제 C#에서의 확인 코드를 다음과 같이 작성할 수 있습니다.

private static void CheckMethodJitAddress(object obj)
{
    do
    {
        MethodInfo mi = typeof(Program).GetMethod("ManyCalls");
        RuntimeMethodHandle rmh = mi.MethodHandle;

        IntPtr ptr = rmh.GetFunctionPointer();

        byte jmpCode = Marshal.ReadByte(ptr);    // jmp 문
        int offset = Marshal.ReadInt32(ptr + 1); // offset 값

        Console.WriteLine(jmpCode.ToString("x") + ": " + offset.ToString("x8"));

        Thread.Sleep(1000);
    } while ((bool)obj == true);
}

이렇게 바꾸고 실행하면 다음과 같은 출력 결과를 볼 수 있습니다.

called: 1
e9: 0000108b
e8: 0000041b
called: 2
e8: 0000041b
e8: 0000041b
...[생략]...
called: 28
e8: 0000041b
called: 29
e8: 0000041b
called: 30
e9: 0000392b
called: 31

보면 다음과 같은 공통점이 나옵니다.

1번째 호출: e9 0000108b
2번째 ~ 29번째 호출: e8 0000041b
30번째 호출: e9 0000392b

실제로 저 단계별로 windbg에서 점프 위치에 대한 값을 확인해 보면,

[1번째 호출]
0:010> u 00007ff7`ad9710a0
00007ff7`ad9710a0 e98b100000      jmp     00007ff7`ad972130
...[생략]...


[2번째 ~ 29번째 호출]
0:010> u 00007ff7`ad9710a0
00007ff7`ad9710a0 e8fbd4ab5f      call    coreclr!PrecodeFixupThunk (00007ff8`0d42e5a0)
...[생략]...


[30번째 호출]
0:010> u 00007ff7`ad9710a0
00007ff7`ad9710a0 e96b340000      jmp     00007ff7`ad974510
...[생략]...

위의 결과를 바탕으로 대략 결론이 유추됩니다. 처음 메서드 호출 시 Tier-0 JIT를 빠르게 한 다음 그 이후의 호출에서는 최적화 JIT을 하기보다는 최적화를 할 조건을 갖출 때까지의 판단 코드가 있는 PrecodeFixupThunk를 경유해서 호출이 되다가 30번째 호출이 되었을 때 비로소 Tier-1 JIT를 하게 되는 것입니다.

(첨부 파일은 이 글의 예제 코드를 포함합니다.)




(2024-04-04: 업데이트)

pgo_tier_instrument_1.png




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 4/4/2024]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




... 31  32  [33]  34  35  36  37  38  39  40  41  42  43  44  45  ...
NoWriterDateCnt.TitleFile(s)
12805정성태8/24/20218257.NET Framework: 1104. C# 10 - (8) 분해 구문에서 기존 변수의 재사용 가능파일 다운로드1
12804정성태8/24/20219032.NET Framework: 1103. C# 10 - (7) Source Generator V2 APIs
12803정성태8/23/20218615개발 환경 구성: 600. pip cache 디렉터리 옮기는 방법
12802정성태8/23/20218921.NET Framework: 1102. .NET Conf Mini 21.08 - WinUI 3 따라해 보기 [1]
12801정성태8/23/20218416.NET Framework: 1101. C# 10 - (6) record class 타입의 ToString 메서드를 sealed 처리 허용파일 다운로드1
12800정성태8/22/20218651개발 환경 구성: 599. PyCharm - (반대로) 원격 프로세스가 PyCharm에 디버그 연결하는 방법
12799정성태8/22/20218705.NET Framework: 1100. C# 10 - (5) 속성 패턴의 개선파일 다운로드1
12798정성태8/21/202110050개발 환경 구성: 598. PyCharm - 원격 프로세스를 디버그하는 방법
12797정성태8/21/20217756Windows: 197. TCP의 MSS(Maximum Segment Size) 크기는 고정된 것일까요?
12796정성태8/21/20218418.NET Framework: 1099. C# 10 - (4) 상수 문자열에 포맷 식 사용 가능파일 다운로드1
12795정성태8/20/20219036.NET Framework: 1098. .NET 6에 포함된 신규 BCL API - 스레드 관련
12794정성태8/20/20218491스크립트: 23. 파이썬 - WSGI를 만족하는 최소한의 구현 코드 및 PyCharm에서의 디버깅 방법 [1]
12793정성태8/20/20219184.NET Framework: 1097. C# 10 - (3) 개선된 변수 초기화 판정파일 다운로드1
12792정성태8/19/20219663.NET Framework: 1096. C# 10 - (2) 전역 네임스페이스 선언파일 다운로드1
12791정성태8/19/20218010.NET Framework: 1095. C# COM 개체를 C++에서 사용하는 예제 [3]파일 다운로드1
12790정성태8/18/202110228.NET Framework: 1094. C# 10 - (1) 구조체를 생성하는 record struct파일 다운로드1
12789정성태8/18/20219258개발 환경 구성: 597. PyCharm - 윈도우 환경에서 WSL을 이용해 파이썬 앱 개발/디버깅하는 방법
12788정성태8/17/20217828.NET Framework: 1093. C# - 인터페이스의 메서드가 다형성을 제공할까요? (virtual일까요?)파일 다운로드1
12787정성태8/17/20218036.NET Framework: 1092. (책 내용 수정) "4.5.1.4 인터페이스"의 "인터페이스와 다형성"
12786정성태8/16/20219567.NET Framework: 1091. C# - Python range 함수 구현 (2) INumber<T>를 이용한 개선 [1]파일 다운로드1
12785정성태8/16/20217825.NET Framework: 1090. .NET 6 Preview 7에 추가된 숫자 형식에 대한 제네릭 연산 지원 [1]파일 다운로드1
12784정성태8/15/20217217오류 유형: 757. 구글 메일 - 아웃룩에서 메일 전송 시 Sending' reported error (0x800CCC0F, 0x800CCC92)
12783정성태8/15/20216783.NET Framework: 1089. C# - Indexer에 Range 및 람다 식을 이용한 필터 구현 [1]파일 다운로드1
12782정성태8/14/20216577오류 유형: 756. 파이썬 - 윈도우 환경에서 pytagcloud의 한글 출력 방법
12781정성태8/14/20218732오류 유형: 755. 파이썬 - konlpy 사용 시 JVM과 jpype1 관련 오류
12780정성태8/13/20217115.NET Framework: 1088. C# - 버스 노선 및 위치 정보 조회 API 사용을 위한 기초 라이브러리 [2]
... 31  32  [33]  34  35  36  37  38  39  40  41  42  43  44  45  ...