Microsoft MVP성태의 닷넷 이야기
.NET Framework: 2016. C# - JIT 컴파일러의 인라인 메서드 처리 유무 [링크 복사], [링크+제목 복사],
조회: 7042
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 
(연관된 글이 1개 있습니다.)
(시리즈 글이 10개 있습니다.)
.NET Framework: 202. CLR JIT 컴파일러가 생성한 기계어 코드 확인하는 방법
; https://www.sysnet.pe.kr/2/0/975

.NET Framework: 210. Windbg 환경에서 확인해 본 .NET 메서드 JIT 컴파일 전과 후
; https://www.sysnet.pe.kr/2/0/1023

.NET Framework: 395. C# - 프로퍼티로 정의하면 필드보다 느릴까요?
; https://www.sysnet.pe.kr/2/0/1545

.NET Framework: 396. C# - 프로퍼티로 정의하면 필드보다 느릴까요? - windbg / ollydbg
; https://www.sysnet.pe.kr/2/0/1546

.NET Framework: 542. 닷넷 - 특정 클래스가 로드되었는지 여부를 알 수 있을까?
; https://www.sysnet.pe.kr/2/0/10888

.NET Framework: 545. 닷넷 - 특정 클래스가 로드되었는지 여부를 알 수 있을까? - 두 번째 이야기
; https://www.sysnet.pe.kr/2/0/10893

디버깅 기술: 161. Windbg 환경에서 확인해 본 .NET 메서드 JIT 컴파일 전과 후 - 두 번째 이야기
; https://www.sysnet.pe.kr/2/0/12133

.NET Framework: 2015. C# - 인라인 메서드(inline methods)
; https://www.sysnet.pe.kr/2/0/13063

.NET Framework: 2016. C# - JIT 컴파일러의 인라인 메서드 처리 유무
; https://www.sysnet.pe.kr/2/0/13064

닷넷: 2132. C# - sealed 클래스의 메서드를 callback 호출했을 때 인라인 처리가 될까요?
; https://www.sysnet.pe.kr/2/0/13391




C# - JIT 컴파일러의 인라인 메서드 처리 유무

지난 글을 기준으로,

C# - 인라인 메서드(inline methods)
; https://www.sysnet.pe.kr/2/0/13063

실제로 인라인 여부를 확인해볼까요? ^^ 일반적인 Increment 메서드의 구현이라면,

static void Main(string[] args)
{
    int x = Increment(args.Length);
    Console.WriteLine(x);

    Console.ReadLine();
}

static int Increment(int x)
{
    if (x < 0)
    {
        ThrowArgumentException();
    }

    return (x + 1);
}

static int ThrowArgumentException()
{
    throw new ArgumentException();
}

(Release 빌드로 실행해 ReadLine에 걸렸을 때 debug attach 시킨 후) disassembly 창으로 보면 이렇게 JIT 컴파일링 된 것을 확인할 수 있습니다.

00007FFDC0E02990  push        rbp  
00007FFDC0E02991  sub         rsp,20h  
00007FFDC0E02995  lea         rbp,[rsp+20h]  
00007FFDC0E0299A  mov         qword ptr [rbp+10h],rcx  
00007FFDC0E0299E  mov         rcx,qword ptr [rbp+10h]  
            int x = Increment(args.Length);
00007FFDC0E029A2  mov         ecx,dword ptr [rcx+8]  
00007FFDC0E029A5  call        CLRStub[MethodDescPrestub]@7ffdc0dff118 (07FFDC0DFF118h)  
            Console.WriteLine(x);
00007FFDC0E029AA  mov         ecx,eax  
00007FFDC0E029AC  call        CLRStub[MethodDescPrestub]@7ffdc0e028e8 (07FFDC0E028E8h)

인라인이 안 되었죠? ^^ 아니... 인라인 시킨다면서요? 게다가 해당 메서드에 "[MethodImpl(MethodImplOptions.AggressiveInlining)]" 특성을 부여해도 결과는 마찬가지입니다.




왜냐하면, JIT 컴파일러는 위와 같은 상황에서 Increment 호출을 인라인 시킨다고 크게 성능상 장점이 없다고 판단하는 것 같습니다. 그래서 인라인을 위한 계산 비용보다는 그냥 함수 호출로 빠르게 JIT 번역해 버리는 것입니다.

오호~~~ 그렇다면, 성능 향상이 부각되는 상황으로 만들면 되겠군요. ^^ 그래서 임의로 다음과 같이 for 문을 구성해 봤습니다.

for (int i = 0; i < 100; i++)
{
    int x = Increment(args.Length);
    Console.WriteLine(x);
}

이렇게 만들면 이제 인라인이 됩니다.

            int x = Increment(args.Length);
00007FFDC0E229AB  mov         ecx,edi  
00007FFDC0E229AD  test        ecx,ecx  
00007FFDC0E229AF  jl          Program.Main(System.String[])+02Ch (07FFDC0E229CCh)  
00007FFDC0E229B1  inc         ecx  
            Console.WriteLine(x);
00007FFDC0E229B3  call        CLRStub[MethodDescPrestub]@7ffdc0e228e8 (07FFDC0E228E8h)  
...[생략]...
            ThrowArgumentException();
00007FFDC0E229CC  call        CLRStub[MethodDescPrestub]@7ffdc0e1f120 (07FFDC0E1F120h)

(참고로, 위의 경우 AggressiveInlining 옵션을 빼도 상관없습니다.)




그런데, 재미있는 점이 하나 있습니다. ^^; .NET 6 환경에서 위의 상황을, Increment에 throw를 포함하는 유형으로 테스트를 하면,

static int Increment(int x)
{
    if (x < 0)
    {
        throw new ArgumentException();
    }

    return (x + 1);
}

그래도 여전히 인라인이 되는 것을 확인할 수 있습니다. 아니... 이게 어떻게 된 일입니까? ^^; ".NET Core Best Practices" 글을 쓴 사람은 분명히 인라인이 안 된다고 했습니다. 어쩔 수 없습니다. 그냥 사실을 받아들여야 합니다. ^^ 어쨌든 (어느 버전인지는 일일이 테스트를 해보면 알겠지만) 적어도 .NET 6의 JIT 컴파일러는 throw 문을 포함해도 정상적으로 인라인 시킬 정도로 더 똑똑해진 것입니다.

그래서, 동일한 코드를 .NET Framework 4.8 런타임에서 실행해 보면 다시 이렇게 인라인이 안 되는 것을 볼 수 있습니다.

031E0848  push        ebp  
031E0849  mov         ebp,esp  
031E084B  push        edi  
031E084C  push        esi  
031E084D  xor         esi,esi  
031E084F  mov         edi,dword ptr [ecx+4]  
            int x = Increment(args.Length);
031E0852  mov         ecx,edi  
031E0854  call        dword ptr [Pointer to: Program.Increment(Int32) (03154D58h)]  
            Console.WriteLine(x);
031E085A  mov         ecx,eax  
031E085C  call        System.Console.WriteLine(Int32) (6F931938h) 

결국, 이런 내부적인 동작은 끊임없이 바뀔 것이고 특별한 경우가 아니라면 굳이 신경 쓸 필요는 없습니다. 단지, 우리는 그냥 free lunch를 즐기는 식으로 가볍게 지나가면 되겠습니다. ^^




그나저나, (적어도 .NET 6 환경에서는) "[MethodImpl(MethodImplOptions.AggressiveInlining)]" 특성은 이젠 거의 무시하는 분위기인 듯합니다. 왜냐하면, 그 옵션의 유무에 따른 변화가 딱히 없습니다. 혹시, 이 옵션에 따라 달라지는 상황이 있다면 덧글 부탁드립니다.




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 5/19/2022]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




... 31  32  [33]  34  35  36  37  38  39  40  41  42  43  44  45  ...
NoWriterDateCnt.TitleFile(s)
12820정성태9/1/20218107VC++: 147. Golang - try/catch에 대응하는 panic/recover [1]파일 다운로드1
12819정성태8/31/20218236.NET Framework: 1111. C# - FormattableString 타입
12818정성태8/31/20217465Windows: 198. 윈도우 - 작업 관리자에서 (tensorflow 등으로 인한) GPU 연산 부하 보는 방법
12817정성태8/31/202110117스크립트: 25. 파이썬 - 윈도우 환경에서 directml을 이용한 tensorflow의 AMD GPU 사용 방법
12816정성태8/30/202115459스크립트: 24. 파이썬 - tensorflow 2.6 NVidia GPU 사용 방법 [2]
12815정성태8/30/20218551개발 환경 구성: 602. WSL 2 - docker-desktop-data, docker-desktop (%LOCALAPPDATA%\Docker\wsl\data\ext4.vhdx) 파일을 다른 디렉터리로 옮기는 방법
12814정성태8/30/202110881.NET Framework: 1110. C# 11 - 인터페이스 내에 정적 추상 메서드 정의 가능 (DIM for Static Members) [2]파일 다운로드1
12813정성태8/29/20219070.NET Framework: 1109. C# 10 - (11) Lambda 개선파일 다운로드1
12812정성태8/28/20218695.NET Framework: 1108. C# 10 - (10) 개선된 #line 지시자
12811정성태8/27/20218934Linux: 44. 윈도우 개발자를 위한 리눅스 fork 동작 방식 설명 (파이썬 코드)
12810정성태8/27/20217729.NET Framework: 1107. .NET Core/5+에서 동적 컴파일한 C# 코드를 (Breakpoint도 활용하며) 디버깅하는 방법 - #line 지시자파일 다운로드1
12809정성태8/26/20218398.NET Framework: 1106. .NET Core/5+에서 C# 코드를 동적으로 컴파일/사용하는 방법 [1]파일 다운로드1
12808정성태8/25/20219627오류 유형: 758. go: ...: missing go.sum entry; to add it: go mod download ...
12807정성태8/25/20219611.NET Framework: 1105. C# 10 - (9) 비동기 메서드가 사용할 AsyncMethodBuilder 선택 가능파일 다운로드1
12806정성태8/24/20217256개발 환경 구성: 601. PyCharm - 다중 프로세스 디버깅 방법
12805정성태8/24/20218480.NET Framework: 1104. C# 10 - (8) 분해 구문에서 기존 변수의 재사용 가능파일 다운로드1
12804정성태8/24/20219192.NET Framework: 1103. C# 10 - (7) Source Generator V2 APIs
12803정성태8/23/20218944개발 환경 구성: 600. pip cache 디렉터리 옮기는 방법
12802정성태8/23/20219163.NET Framework: 1102. .NET Conf Mini 21.08 - WinUI 3 따라해 보기 [1]
12801정성태8/23/20218657.NET Framework: 1101. C# 10 - (6) record class 타입의 ToString 메서드를 sealed 처리 허용파일 다운로드1
12800정성태8/22/20218889개발 환경 구성: 599. PyCharm - (반대로) 원격 프로세스가 PyCharm에 디버그 연결하는 방법
12799정성태8/22/20218896.NET Framework: 1100. C# 10 - (5) 속성 패턴의 개선파일 다운로드1
12798정성태8/21/202110349개발 환경 구성: 598. PyCharm - 원격 프로세스를 디버그하는 방법
12797정성태8/21/20217986Windows: 197. TCP의 MSS(Maximum Segment Size) 크기는 고정된 것일까요?
12796정성태8/21/20218625.NET Framework: 1099. C# 10 - (4) 상수 문자열에 포맷 식 사용 가능파일 다운로드1
12795정성태8/20/20219253.NET Framework: 1098. .NET 6에 포함된 신규 BCL API - 스레드 관련
... 31  32  [33]  34  35  36  37  38  39  40  41  42  43  44  45  ...