Microsoft MVP성태의 닷넷 이야기
.NET Framework: 763. .NET Core 2.1 - Tiered Compilation 도입 [링크 복사], [링크+제목 복사],
조회: 19913
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
(연관된 글이 3개 있습니다.)
(시리즈 글이 11개 있습니다.)
.NET Framework: 202. CLR JIT 컴파일러가 생성한 기계어 코드 확인하는 방법
; https://www.sysnet.pe.kr/2/0/975

.NET Framework: 210. Windbg 환경에서 확인해 본 .NET 메서드 JIT 컴파일 전과 후
; https://www.sysnet.pe.kr/2/0/1023

.NET Framework: 395. C# - 프로퍼티로 정의하면 필드보다 느릴까요?
; https://www.sysnet.pe.kr/2/0/1545

.NET Framework: 396. C# - 프로퍼티로 정의하면 필드보다 느릴까요? - windbg / ollydbg
; https://www.sysnet.pe.kr/2/0/1546

.NET Framework: 542. 닷넷 - 특정 클래스가 로드되었는지 여부를 알 수 있을까?
; https://www.sysnet.pe.kr/2/0/10888

.NET Framework: 545. 닷넷 - 특정 클래스가 로드되었는지 여부를 알 수 있을까? - 두 번째 이야기
; https://www.sysnet.pe.kr/2/0/10893

.NET Framework: 763. .NET Core 2.1 - Tiered Compilation 도입
; https://www.sysnet.pe.kr/2/0/11539

디버깅 기술: 161. Windbg 환경에서 확인해 본 .NET 메서드 JIT 컴파일 전과 후 - 두 번째 이야기
; https://www.sysnet.pe.kr/2/0/12133

.NET Framework: 2015. C# - 인라인 메서드(inline methods)
; https://www.sysnet.pe.kr/2/0/13063

.NET Framework: 2016. C# - JIT 컴파일러의 인라인 메서드 처리 유무
; https://www.sysnet.pe.kr/2/0/13064

닷넷: 2132. C# - sealed 클래스의 메서드를 callback 호출했을 때 인라인 처리가 될까요?
; https://www.sysnet.pe.kr/2/0/13391




.NET Core 2.1 - Tiered Compilation 도입

아래의 글에 tiered compilation에 대한 소개가 있습니다.

Announcing .NET Core 2.1
; https://devblogs.microsoft.com/dotnet/announcing-net-core-2-1/

"Adaptive optimization"이라고도 알려진 이것의 개념은 간단합니다. 이 옵션이 켜져 있으면 해당 응용 프로그램은 JIT 컴파일 시에 최적화보다는 빠른 속도를 위주로 기계어 번역을 하게 됩니다. 이 단계를 "first tier"라고 합니다. 그러다, 자주 실행되는 메서드가 있으면 그에 대해 감지하고 다시 최적화된 코드로 JIT 컴파일을 하는 식인데 이를 "second tier"라고 합니다.

과거 자바 런타임이 했던 방식과 유사한 면이 있습니다. 자바의 경우 최초 실행 시에 JIT하지 않고 바이트 언어를 그냥 인터프리팅 식으로 그때그때 해석해서 실행하는데, 자주 실행되는 함수라고 판단이 되면 그제서야 JIT를 해 기계어로 번역하는 식입니다.

"tiered compilation" 적용 방법은 프로젝트 파일에 TieredCompilation 옵션을 true로 설정하거나,

<Project Sdk="Microsoft.NET.Sdk">

  <PropertyGroup>
    <OutputType>Exe</OutputType>
    <TargetFramework>netcoreapp2.1</TargetFramework>
    <Description>A simple .NET Core global tool called "dotnetsay".</Description>
    ...[생략]...
    <TieredCompilation>true</TieredCompilation>
  </PropertyGroup>

  <ItemGroup Condition="'$(ContinuousIntegrationBuild)'=='true'">
    <PackageReference Include="Microsoft.SourceLink.GitHub" Version="1.0.0-beta-62925-02" PrivateAssets="All"/>
  </ItemGroup>

</Project>

.NET Core 2.1 이상의 응용 프로그램을 실행 시 환경 변수에 COMPlus_TieredCompilation을 "1"로 설정하면 됩니다.

SET COMPlus_TieredCompilation="1"

(2023-11-20 업데이트: .NET Core 3.0+부터는 TieredCompilation 옵션의 기본값이 enabled로 바뀌었습니다.)




혹시 눈으로 직접 확인해 볼 수 있을까요? ^^

그래서 예제 코드를 하나 준비해봤습니다.

using System;
using System.Reflection;
using System.Threading;

namespace ConsoleApp1
{
    // 빌드: .NET Core x64 + Release
    class Program
    {
        static void Main(string[] args)
        {
            Thread t = new Thread(CheckMethodJitAddress);
            t.IsBackground = true;

            Program pg = new Program();

            {
                pg.ManyCalls();
                CheckMethodJitAddress(false);
            }

            Console.ReadLine(); // first-tier 확인을 위해!
            t.Start(true);

            Thread.Sleep(1000);

            while (true)
            {
                pg.ManyCalls(); // 아마 이 루프의 어디선가 second-tier로 진행할 듯!
                Thread.Sleep(1000);
            }
        }

        public long ManyCalls()
        {
            long sum = 0;

            for (int i = 0; i < (Environment.TickCount % 10_000); i ++)
            {
                sum += i;
            }

            return sum;
        }

        private static void CheckMethodJitAddress(object obj)
        {
            do
            {
                MethodInfo mi = typeof(Program).GetMethod("ManyCalls");
                RuntimeMethodHandle rmh = mi.MethodHandle;

                Console.WriteLine(rmh.GetFunctionPointer().ToString("x"));
                Thread.Sleep(1000);
            } while ((bool)obj == true);
        }
    }
}

위의 코드를 실행하면, ManyCalls라는 메서드를 1초에 한 번씩 계속 실행하는데 다른 스레드에서는 그것의 FunctionPointer를 구해,

상황별 GetFunctionPointer 반환값 정리
; https://www.sysnet.pe.kr/2/0/1027

출력합니다. JIT가 2번째가 되면 FunctionPointer의 주소가 바뀔 거라고 생각한 건데요, 의외로 계속 바뀌지 않고 그냥 고정된 값을 출력합니다. 음... ^^ 딴 방법을 이용해야 할 것 같습니다.

이를 위해 windbg를 이용해 봤는데요, sos 확장을 로드하고,

0:009> .loadby sos coreclr

ManyCalls의 JIT 이후의 기계어 코드 위치를 다음과 같이 확인할 수 있습니다.

0:009> !name2ee ConsoleApp1!ConsoleApp1.Program
Module:      00007ff7b2024578
Assembly:    ConsoleApp1.dll
Token:       0000000002000002
MethodTable: 00007ff7b2025560
EEClass:     00007ff7b21c1088
Name:        ConsoleApp1.Program

0:009> !dumpmt -md  00007ff7b2025560
EEClass:         00007ff7b21c1088
Module:          00007ff7b2024578
Name:            ConsoleApp1.Program
mdToken:         0000000002000002
File:            E:\ConsoleApp1\bin\Release\netcoreapp2.1\ConsoleApp1.dll
BaseSize:        0x18
ComponentSize:   0x0
Slots in VTable: 8
Number of IFaces in IFaceMap: 0
--------------------------------------
MethodDesc Table
           Entry       MethodDesc    JIT Name
00007ff807aa2020 00007ff807600988 PreJIT System.Object.ToString()
00007ff807aa2040 00007ff807600990 PreJIT System.Object.Equals(System.Object)
00007ff807aa2090 00007ff8076009b8 PreJIT System.Object.GetHashCode()
00007ff807aa20a0 00007ff8076009d8 PreJIT System.Object.Finalize()
00007ff7b21410b0 00007ff7b2025550    JIT ConsoleApp1.Program..ctor()
00007ff7b2141098 00007ff7b2025508    JIT ConsoleApp1.Program.Main(System.String[])
00007ff7b21410a0 00007ff7b2025520    JIT ConsoleApp1.Program.ManyCalls()
00007ff7b21410a8 00007ff7b2025538    JIT ConsoleApp1.Program.CheckMethodJitAddress(System.Object)

00007ff7b21410a0 값은 실제로 GetFunctionPointer가 반환한 값과 일치합니다. ManyCalls 메서드에 대해 좀 더 살펴보면,

0:009> !DumpMD /d 00007ff7b2025520
Method Name:          ConsoleApp1.Program.ManyCalls()
Class:                00007ff7b21c1088
MethodTable:          00007ff7b2025560
mdToken:              0000000006000002
Module:               00007ff7b2024578
IsJitted:             yes
Current CodeAddr:     00007ff7b2142010
Code Version History:
  CodeAddr:           00007ff7b2142010  (Tier 0)
  NativeCodeVersion:  0000000000000000

최초 한 번 실행된 상태이기 때문에 "Tier 0" 단계임을 알 수 있습니다. 그리고 응용 프로그램을 계속 실행해 ManyCalls를 어느 정도 실행한 시점에 다시 windbg로 멈추고 덤프를 해보면,

0:010> !DumpMD /d 00007ff7b2025520
Method Name:          ConsoleApp1.Program.ManyCalls()
Class:                00007ff7b21c1088
MethodTable:          00007ff7b2025560
mdToken:              0000000006000002
Module:               00007ff7b2024578
IsJitted:             yes
Current CodeAddr:     00007ff7b21439e0
Code Version History:
  CodeAddr:           00007ff7b21439e0  (Tier 1)
  NativeCodeVersion:  000001e92a9693c0
  CodeAddr:           00007ff7b2142010  (Tier 0)
  NativeCodeVersion:  0000000000000000

보는 바와 같이 JIT CodeAddr 위치가 바뀌었고 Tier 1이라고 보여줍니다. 즉, 실제로 JIT가 대상 메서드에 대해 2번 발생한 것입니다.




그런데 GetFunctionPointer 반환값은 무엇일까요? Tier 1 단계에서 해당 위치를 역어셈블 해보면,

0:010> u 00007ff7b21410a0
00007ff7`b21410a0 e93b290000      jmp     00007ff7`b21439e0
...[생략]...

보는 바와 같이 jmp 문의 위치가 바로 GetFunctionPointer의 값입니다. jmp 문의 기계어를 보면 e93b290000인데, 5바이트 중 첫 번째 e9이 jmp이고 이후의 4바이트가 점프할 상대 변위(offset) 값입니다.

jmp     == e9
offset  == 3b290000

실제로 GetFunctionPointer가 반환한 00007ff7b21410a0 주소와 "!dumpmd"로 확인한 "Current CodeAddr"의 00007ff7b21439e0 주소의 차이를 보면,

0:010> ? 00007ff7`b21439e0 - 00007ff7`b21410a0
Evaluate expression: 10560 = 00000000`00002940

0:010> ? 00007ff7`b21439e0 - 00007ff7`b21410a0 - 5
Evaluate expression: 10555 = 00000000`0000293b

0000293b 값이 나옵니다. little endian 저장임을 감안하면 e93b290000 기계어 코드와 정확히 일치합니다.




windbg를 통해 알게 된 지식으로 이제 C#에서의 확인 코드를 다음과 같이 작성할 수 있습니다.

private static void CheckMethodJitAddress(object obj)
{
    do
    {
        MethodInfo mi = typeof(Program).GetMethod("ManyCalls");
        RuntimeMethodHandle rmh = mi.MethodHandle;

        IntPtr ptr = rmh.GetFunctionPointer();

        byte jmpCode = Marshal.ReadByte(ptr);    // jmp 문
        int offset = Marshal.ReadInt32(ptr + 1); // offset 값

        Console.WriteLine(jmpCode.ToString("x") + ": " + offset.ToString("x8"));

        Thread.Sleep(1000);
    } while ((bool)obj == true);
}

이렇게 바꾸고 실행하면 다음과 같은 출력 결과를 볼 수 있습니다.

called: 1
e9: 0000108b
e8: 0000041b
called: 2
e8: 0000041b
e8: 0000041b
...[생략]...
called: 28
e8: 0000041b
called: 29
e8: 0000041b
called: 30
e9: 0000392b
called: 31

보면 다음과 같은 공통점이 나옵니다.

1번째 호출: e9 0000108b
2번째 ~ 29번째 호출: e8 0000041b
30번째 호출: e9 0000392b

실제로 저 단계별로 windbg에서 점프 위치에 대한 값을 확인해 보면,

[1번째 호출]
0:010> u 00007ff7`ad9710a0
00007ff7`ad9710a0 e98b100000      jmp     00007ff7`ad972130
...[생략]...


[2번째 ~ 29번째 호출]
0:010> u 00007ff7`ad9710a0
00007ff7`ad9710a0 e8fbd4ab5f      call    coreclr!PrecodeFixupThunk (00007ff8`0d42e5a0)
...[생략]...


[30번째 호출]
0:010> u 00007ff7`ad9710a0
00007ff7`ad9710a0 e96b340000      jmp     00007ff7`ad974510
...[생략]...

위의 결과를 바탕으로 대략 결론이 유추됩니다. 처음 메서드 호출 시 Tier-0 JIT를 빠르게 한 다음 그 이후의 호출에서는 최적화 JIT을 하기보다는 최적화를 할 조건을 갖출 때까지의 판단 코드가 있는 PrecodeFixupThunk를 경유해서 호출이 되다가 30번째 호출이 되었을 때 비로소 Tier-1 JIT를 하게 되는 것입니다.

(첨부 파일은 이 글의 예제 코드를 포함합니다.)




(2024-04-04: 업데이트)

pgo_tier_instrument_1.png




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 4/4/2024]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




1  2  3  4  5  6  7  [8]  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
13743정성태9/26/20246443닷넷: 2298. C# - Console 프로젝트에서의 await 대상으로 Main 스레드 활용하는 방법 [1]
13742정성태9/26/20246732닷넷: 2297. C# - ssh-keygen으로 생성한 ecdsa 유형의 Public Key 파일 해석 [1]파일 다운로드1
13741정성태9/25/20245919디버깅 기술: 202. windbg - ASP.NET MVC Web Application (.NET Framework) 응용 프로그램의 덤프 분석 시 요령
13740정성태9/24/20245770기타: 86. RSA 공개키 등의 modulus 값에 0x00 선행 바이트가 있는 이유(ASN.1 인코딩)
13739정성태9/24/20245921닷넷: 2297. C# - ssh-keygen으로 생성한 Public Key 파일 해석과 fingerprint 값(md5, sha256) 생성 [1]파일 다운로드1
13738정성태9/22/20245637C/C++: 174. C/C++ - 윈도우 운영체제에서의 file descriptor, FILE*파일 다운로드1
13737정성태9/21/20245999개발 환경 구성: 727. Visual C++ - 리눅스 프로젝트를 위한 빌드 서버의 msbuild 구성
13736정성태9/20/20246009오류 유형: 923. Visual Studio Code - Could not establish connection to "...": Port forwarding is disabled.
13735정성태9/20/20246078개발 환경 구성: 726. ARM 플랫폼용 Visual C++ 리눅스 프로젝트 빌드
13734정성태9/19/20245786개발 환경 구성: 725. ssh를 이용한 원격 docker 서비스 사용
13733정성태9/19/20246116VS.NET IDE: 194. Visual Studio - Cross Platform / "Authentication Type: Private Key"로 접속하는 방법
13732정성태9/17/20246169개발 환경 구성: 724. ARM + docker 환경에서 .NET 8 설치
13731정성태9/15/20246759개발 환경 구성: 723. C# / Visual C++ - Control Flow Guard (CFG) 활성화 [1]파일 다운로드2
13730정성태9/10/20246427오류 유형: 922. docker - RULE_APPEND failed (No such file or directory): rule in chain DOCKER
13729정성태9/9/20247172C/C++: 173. Windows / C++ - AllocConsole로 할당한 콘솔과 CRT 함수 연동 [1]파일 다운로드1
13728정성태9/7/20246994C/C++: 172. Windows - C 런타임에서 STARTUPINFO의 cbReserved2, lpReserved2 멤버를 사용하는 이유파일 다운로드1
13727정성태9/6/20247534개발 환경 구성: 722. ARM 플랫폼 빌드를 위한 미니 PC(?) - Khadas VIM4 [1]
13726정성태9/5/20247430C/C++: 171. C/C++ - 윈도우 운영체제에서의 file descriptor와 HANDLE파일 다운로드1
13725정성태9/4/20246174디버깅 기술: 201. WinDbg - sos threads 명령어 실행 시 "Failed to request ThreadStore"
13724정성태9/3/20248026닷넷: 2296. Win32/C# - 자식 프로세스로 HANDLE 상속파일 다운로드1
13723정성태9/2/20248282C/C++: 170. Windows - STARTUPINFO의 cbReserved2, lpReserved2 멤버 사용자 정의파일 다운로드2
13722정성태9/2/20246023C/C++: 169. C/C++ - CRT(C Runtime) 함수에 의존성이 없는 프로젝트 생성
13721정성태8/30/20246062C/C++: 168. Visual C++ CRT(C Runtime DLL: msvcr...dll)에 대한 의존성 제거 - 두 번째 이야기
13720정성태8/29/20246219VS.NET IDE: 193. C# - Visual Studio의 자식 프로세스 디버깅
13719정성태8/28/20246370Linux: 79. C++ - pthread_mutexattr_destroy가 없다면 메모리 누수가 발생할까요?
13718정성태8/27/20247456오류 유형: 921. Visual C++ - error C1083: Cannot open include file: 'float.h': No such file or directory [2]
1  2  3  4  5  6  7  [8]  9  10  11  12  13  14  15  ...