Microsoft MVP성태의 닷넷 이야기
.NET Framework: 658. C#의 tail call 구현은? [링크 복사], [링크+제목 복사],
조회: 21240
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 
(연관된 글이 1개 있습니다.)

C#의 tail call 구현은?

우선, CLR 수준에서 어떻게 tail call이 처리되고 있는지에 대한 문서들을 웹상에서 찾아볼 수 있습니다.

Enter, Leave, Tailcall Hooks Part 2: Tall tales of tail calls
; https://learn.microsoft.com/en-us/archive/blogs/davbr/enter-leave-tailcall-hooks-part-2-tall-tales-of-tail-calls

Tail Call Improvements in .NET Framework 4
; https://learn.microsoft.com/en-us/archive/blogs/clrcodegeneration/tail-call-improvements-in-net-framework-4

그리고, CLR 2.0 기준으로 64bit/32bit에 따른 tail call이 가능하지 않은 조건들을 설명한 글이 있습니다.

Tail call JIT conditions
; https://learn.microsoft.com/en-us/archive/blogs/davbr/tail-call-jit-conditions

(* You must not take dependencies on this behavior. Use this information for your own personal entertainment only.)

이 중에서 "Tail Call Improvements in .NET Framework 4" 글이 그나마 최신인데요. 대충 설명해 보면 다음과 같이 요약됩니다.

  • CLR 2 + 64bit JIT: '쉬운(easy)' 경우만을 대상으로 tail call 최적화 처리, 이 때문에 tail. 접두사가 명시되어 있다 해도 'easy case'가 아니라면 tail call 최적화를 하지 못함.
  • CLR 2 + 32bit JIT: tail. 접두사가 명시된 경우만. (하지만, 64bit JIT보다 tail call 처리를 할 수 없는 더 많은 예외적인 상황이 존재)
  • CLR 4 + 64bit JIT: tail. 접두사가 명시된 경우 모든 상황에서 tail. 접두사를 (tail call 방식이 아니라도 TailCallHelper를 통해) 처리하도록 JIT 개선
  • CLR 4 + 32bit/IA64 JIT: CLR 2의 상황과 바뀐 것이 없음. (따라서, tail. 접두사가 명시된 경우만 제한적으로.)

즉, CLR 4 + 64bit JIT에 와서야 "tail." 접두사가 존재한다면 어떤 식으로든 stack overflow가 발생하지 않도록 처리가 되었습니다.

이쯤에서, C#에서의 tail call 처리가 궁금할 텐데요. 일단, C# 컴파일러는 어떠한 코드에서도 "tail." 접두사를 생성하지 않습니다. 따라서, CLR 2/4에 상관없이 32bit JIT 컴파일러는 tail call 최적화를 하지 않습니다. 단지, 64bit JIT에서는 임의 재량으로 쉬운 것만을 대상으로 변환을 해줍니다.

F#이라면 어떨까요? F# 컴파일러는 언어의 특성상 "tail." 접두사를 상황에 따라 IL 코드에 출력을 합니다. 일단, "tail." 접두사가 출력되었다면 CLR 4 + 64bit JIT 환경에서 stack overflow 예외는 피할 수 있다고 안심하셔도 됩니다.




C#의 경우, 간단한 예제로 한번 테스트해볼까요? ^^

using System;

class Program
{
    static void Main(string[] args)
    {
        RecursiveCall(1);
    }

    private static void RecursiveCall(int v)
    {
        if (v % 100 == 0)
        {
            Console.WriteLine(v);
        }

        RecursiveCall(v + 1);
    }
}

C# 컴파일러로 위의 코드를 CLR 2 - x64/Release 빌드하면 다음과 같은 IL 코드가 생성됩니다.

.method private hidebysig static void RecursiveCall(int32 v) cil managed
{
    .maxstack 8
    L_0000: ldarg.0 
    L_0001: ldc.i4.s 100
    L_0003: rem 
    L_0004: brtrue.s L_000c
    L_0006: ldarg.0 
    L_0007: call void [mscorlib]System.Console::WriteLine(int32)
    L_000c: ldarg.0 
    L_000d: ldc.i4.1 
    L_000e: add 
    L_000f: call void Program::RecursiveCall(int32)
    L_0014: ret 
}

보는 바와 같이 L_000f의 call 이전에 "tail." 접두사가 없습니다. 하지만, 이 코드를 실행해 보면 stack overflow 예외 없이 잘 실행됩니다. 반면, CLR 2 - x86/Release로 빌드해 실행하면 이번에는 "Process is terminated due to StackOverflowException." 예외가 발생합니다.

이 상황은 CLR 4에서도 동일하며, Debug 빌드의 경우에는 어떤 모드로 해도 tail call 처리를 JIT 컴파일러가 하지 않으므로 stack overflow가 발생합니다.




이야기 나온 김에 ^^ "tail." 접두사가 있는 경우도 테스트해 보겠습니다. ildasm.exe를 이용해 위의 예제를 빌드한 ConsoleApp1.exe를 IL 소스 코드로 변경한 다음,

ildasm /OUT=test.il ConsoleApp1.exe

생성된 test.il 파일을 메모장 등에서 열어 call 전에 "tail." 접두사를 추가해 줍니다. (IL_???? 번호는 br 계열 명령어의 오프셋 값만 일치시켜 준다면 임의로 변경하셔도 됩니다.)

.method private hidebysig static void  RecursiveCall(int32 v) cil managed
{
	// Code size       21 (0x15)
	.maxstack  8
	IL_0000:  ldarg.0
	IL_0001:  ldc.i4.s   100
	IL_0003:  rem
	IL_0004:  brtrue.s   IL_000c

	IL_0006:  ldarg.0
	IL_0007:  call       void [mscorlib]System.Console::WriteLine(int32)
	IL_000c:  ldarg.0
	IL_000d:  ldc.i4.1
	IL_000e:  add
	IL_000f:  tail.
	IL_0014:  call       void Program::RecursiveCall(int32)
	IL_0018:  ret
} // end of method Program::RecursiveCall

"tail." 접두사가 추가된 il 코드를 CLR 2 버전의 ilasm.exe를 이용해 빌드하고,

"C:\Windows\Microsoft.NET\Framework\v2.0.50727\ilasm.exe" /OUTPUT=test.exe test.il /RESOURCE=test.res

test.exe를 실행해 보면, "tail." 접두사가 있는 데다 "Tail call JIT conditions" 문서에 따른 예외적인 조건이 아니기 때문에 정상적으로 tail call 처리가 되어 stack overflow 예외 없이 CLR 2 + x86에서도 잘 실행이 됩니다.




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 12/2/2022]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2024-10-21 10시16분
Evaluating tail call elimination in the face of return address protection, part 1
; https://devblogs.microsoft.com/oldnewthing/20241017-00/?p=110380

Evaluating tail call elimination in the face of return address protection, part 2
; https://devblogs.microsoft.com/oldnewthing/20241018-00/?p=110385
정성태

1  2  3  4  5  [6]  7  8  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
13793정성태10/28/20245164C/C++: 183. C++ - 윈도우에서 한글(및 유니코드)을 포함한 콘솔 프로그램을 컴파일 및 실행하는 방법
13792정성태10/27/20244648Linux: 99. Linux - 프로세스의 실행 파일 경로 확인
13791정성태10/27/20244917Windows: 267. Win32 API의 A(ANSI) 버전은 DBCS를 사용할까요?파일 다운로드1
13790정성태10/27/20244632Linux: 98. Ubuntu 22.04 - 리눅스 커널 빌드 및 업그레이드
13789정성태10/27/20244945Linux: 97. menuconfig에 CONFIG_DEBUG_INFO_BTF, CONFIG_DEBUG_INFO_BTF_MODULES 옵션이 없는 경우
13788정성태10/26/20244470Linux: 96. eBPF (bpf2go) - fentry, fexit를 이용한 트레이스
13787정성태10/26/20244998개발 환경 구성: 730. github - Linux 커널 repo를 윈도우 환경에서 git clone하는 방법 [1]
13786정성태10/26/20245242Windows: 266. Windows - 대소문자 구분이 가능한 파일 시스템
13785정성태10/23/20244998C/C++: 182. 윈도우가 운영하는 2개의 Code Page파일 다운로드1
13784정성태10/23/20245269Linux: 95. eBPF - kprobe를 이용한 트레이스
13783정성태10/23/20244875Linux: 94. eBPF - vmlinux.h 헤더 포함하는 방법 (bpf2go에서 사용)
13782정성태10/23/20244638Linux: 93. Ubuntu 22.04 - 커널 이미지로부터 커널 함수 역어셈블
13781정성태10/22/20244819오류 유형: 930. WSL + eBPF: modprobe: FATAL: Module kheaders not found in directory
13780정성태10/22/20245570Linux: 92. WSL 2 - 커널 이미지로부터 커널 함수 역어셈블
13779정성태10/22/20244876개발 환경 구성: 729. WSL 2 - Mariner VM 커널 이미지 업데이트 방법
13778정성태10/21/20245702C/C++: 181. C/C++ - 소스코드 파일의 인코딩, 바이너리 모듈 상태의 인코딩
13777정성태10/20/20244960Windows: 265. Win32 API의 W(유니코드) 버전은 UCS-2일까요? UTF-16 인코딩일까요?
13776정성태10/19/20245299C/C++: 180. C++ - 고수준 FILE I/O 함수에서의 Unicode stream 모드(_O_WTEXT, _O_U16TEXT, _O_U8TEXT)파일 다운로드1
13775정성태10/19/20245510개발 환경 구성: 728. 윈도우 환경의 개발자를 위한 UTF-8 환경 설정
13774정성태10/18/20245203Linux: 91. Container 환경에서 출력하는 eBPF bpf_get_current_pid_tgid의 pid가 존재하지 않는 이유
13773정성태10/18/20244892Linux: 90. pid 네임스페이스 구성으로 본 WSL 2 + docker-desktop
13772정성태10/17/20245179Linux: 89. pid 네임스페이스 구성으로 본 WSL 2 배포본의 계층 관계
13771정성태10/17/20245081Linux: 88. WSL 2 리눅스 배포본 내에서의 pid 네임스페이스 구성
13770정성태10/17/20245359Linux: 87. ps + grep 조합에서 grep 명령어를 사용한 프로세스를 출력에서 제거하는 방법
13769정성태10/15/20246129Linux: 86. Golang + bpf2go를 사용한 eBPF 기본 예제파일 다운로드1
13768정성태10/15/20245416C/C++: 179. C++ - _O_WTEXT, _O_U16TEXT, _O_U8TEXT의 Unicode stream 모드파일 다운로드2
1  2  3  4  5  [6]  7  8  9  10  11  12  13  14  15  ...