Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 
(연관된 글이 2개 있습니다.)

.NET 5+ 환경에서 P/Invoke의 성능을 높이기 위한 SuppressGCTransition 특성

오호~~~ 재미있는 트윗이 하나 올라왔군요. ^^


...I did some research on the SuppressGCTransition attribute....
; https://twitter.com/KooKiz/status/1692127734854459426?s=20

SuppressGCTransition
; https://minidump.net/suppressgctransition-b9a8a774edbd

위의 글을 정리해 볼까요? ^^

SuppressGCTransition 특성은 .NET 5부터 추가된 것으로, DllImport를 적용한 P/Inovke API에 함께 적용할 수 있습니다.

[DllImport("NativeLib.dll")]
[SuppressGCTransition]
static extern int Increment(int value);

이것을 적용하면 (저자가 작성한 테스트 함수의 경우) 4배 정도의 속도 향상이 있었다고 하는데요, 그럴 수밖에 없는 것이 해당 특성으로 인해 P/Invoke의 Transition 관련 코드들이 없어지기 때문입니다. 이에 대해서는 전에 몇 번 언급한 적이 있군요. ^^

P/Invoke의 성능을 높이기 위해 C++/CLI가 선택되려면?
; https://www.sysnet.pe.kr/2/0/1229

windbg - C# PInvoke 호출 시 마샬링을 담당하는 함수 분석
; https://www.sysnet.pe.kr/2/0/12065

하지만, SuppressGCTransition이 항상 좋은 것은 아닌데요, 원문의 글에서도 나오듯이 P/Invoke API의 실행 시간을 일부러 100ms 지연시킨 경우에는 반대로 2배의 속도 저하가 생깁니다.




속도 저하의 원인을 설명하기 위해서는 스레드의 2가지 상태, Preemptive와 Cooperative를 알아야 합니다.

.NET Thread 상태가 Cooperative일 때 GC hang 현상 재현 방법
; https://www.sysnet.pe.kr/2/0/11634

닷넷 세계에서, P/Invoke를 통해 진입한 비-관리 코드는 GC에 방해를 하지 않는 Preemptive 상태입니다. 이러한 상태 변화는 P/Invoke 대상이 되는 API의 앞/뒤로 실행되는 Transition 관리 코드에서 처리하는데요, 대충 이런 식입니다.

...[닷넷 코드를 수행 중인 Cooperative 상태의 스레드가 P/Invoke 호출]...
[transition - 스레드를 Preemptive 상태로 마킹]
Native API 호출
[transition - 스레드를 Cooperative 상태로 마킹]
...[닷넷 코드를 계속 수행(Cooperative 상태)]...

하지만 SuppressGCTransition 특성을 지정하면 transition 코드가 없어지기 때문에,

...[닷넷 코드를 수행 중인 Cooperative 상태의 스레드가 P/Invoke 호출]...
Native API 호출 (여전히 Cooperative 상태)
...[닷넷 코드를 계속 수행(Cooperative 상태)]...

Native API 실행 중에도 Cooperative로 남게 되는 것입니다.

저런 변화를 GC에 엮어서 설명해 볼까요?

GC는, Preemptive 상태의 스레드는 무시하고 수행할 수 있습니다. P/Invoke의 상황을 예로 들면, 일단 Preemptive로 표시된 후 Native API가 호출되는 동안에 GC는 그 스레드와 병렬로 수행될 수 있습니다. 그렇다면 GC가 수행되는 사이 Native API 호출이 완료되고 Cooperative 모드의 닷넷 코드 영역으로 넘어가면 문제가 되지 않을까요? ^^

그럴 수가 없는 것이, Native API 호출 이후 현재 GC가 수행 중이면 닷넷 코드로 진입하기 전에 blocking을 하기 때문입니다.

자, 그럼 SuppressGCTransition 특성이 왜 성능에 영향을 미치는지 예상할 수 있습니다. Native API 전/후의 transition 코드를 없애기 때문에 스레드는 계속 Cooperative 상태로 머물게 되고, 이때 GC는 그 스레드와 병렬로 수행할 수 없습니다. 결국 GC는 Cooperative 스레드를 안전한 위치의 코드를 수행 중인 지 확인하기 위해 suspend 시켜, 1) 만약 안전한 영역이라면 그대로 (suspend 상태로) GC를 수행하지만, 2) 안전하지 않은 영역을 수행 중이면 안전한 영역으로 나올 때까지 다시 resume 시킨 후 GC는 "대기"를 하게 됩니다.

정리하면, SuppressGCTransition으로 인해 GC는 모든 .NET 스레드를 중지시킨 체로 대기하다가 P/Invoke API의 호출이 완료돼 해당 스레드가 중지되어서야 비로소 GC 작업을 하기 때문에 성능에 영향을 미치게 되는 것입니다.




SuppressGCTransition 적용의 또 다른 부작용은 디버거가 정상적으로 P/Invoke로 들어선 스레드의 호출 스택을 보여줄 수 없다는 것입니다. 아마도 이것은 차차 개선되지 않을까 싶은데요, 현재의 SOS Debugger 확장은 Transition이 당연히 있는 것으로 가정하고 !clrstack의 결과를 찾기 때문에 SuppressGCTransition이 있는 P/Invoke 호출에 대해서는 정상적인 풀이를 못하는 듯합니다. (순전히 제 의견입니다. ^^)

문서에 따르면, P/Invoke로 호출하는 native 함수 안에서 예외를 던져서도 안 된다고 합니다. 원문의 저자가 수행한 테스트로는 별다른 부작용을 발견할 수는 없었지만, 아무튼 문서에 따르는 것이 좋겠다는 의견입니다.

또한, P/Invoke 내에서 닷넷 측으로의 콜백(Reverse P/Invokes)도 해서는 안 된다고 합니다. 이것은 Transition 층이 없어지는 것으로 인한 부작용인데요, 예를 들어 기존에는 다음과 같은 호출과 스레드 상태 변경이 있었는데,

// SuppressGCTransition 미지정
.net code -> (transition) ->  p/invoke code -> (transition) -> (callback to) .net code -> (transition) -> p/invoke code
[Cooperative]      ->         [Preemptive]           ->                      [Cooperative]      ->        [Preemptive]

보는 바와 같이 p/invoke에서 콜백을 호출하기 전/후 동일하게 [Preemptive] 상태로 일치합니다. 반면 SuppressGCTransition으로 transition 코드가 빠진 경우에는,

// SuppressGCTransition 지정

.net code ->  p/invoke code -> (transition) -> (callback to) .net code -> (transition) -> p/invoke code
[Cooperative]                      ->                        [Cooperative]    ->          [Preemptive]

콜백 호출 전에는 Cooperative 모드였는데, 콜백을 완료하고 나서는 Preemptive 모드로 바뀌었습니다. 따라서 GC로 하여금 안전한 상태로 판정받기 때문에 별다른 조치가 없는 상태에서 P/Invoke 호출을 빠져나와 곧바로 .NET Code를 수행하는 시점에 자칫 (아마도) ExecutionEngineException 오류가 발생할 수 있습니다.

기타 "Stack spill"에 대해서도 설명하지만 어차피 이것은 Transition 코드가 갖는 오버헤드이므로 딱히 중요한 것은 아닙니다.

마지막으로, 문서에는 SuppressGCTransition에 대한 사용 지침을 알려주고 있으니 참고하시고,

  • 가능한 1us(1마이크로 초) 안에 수행될 함수에 대해서만 SuppressGCTransition 지정 (권장)
  • 닷넷 코드로의 callback이 없어야 하고 (필수),
  • 예외를 발생시켜서는 안 되고 (필수),
  • (블록킹을 발생할 수 있는) lock을 다루지 않아야 함 (권장)

덕분에 재미있는 것을 알게 되었습니다. ^^




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 8/21/2023]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2023-08-20 01시09분
좋은 글 감사합니다!
이승후

[1]  2  3  4  5  6  7  8  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
13688정성태7/21/2024316닷넷: 2279. C# - Lock / Wait 상태에서도 일부 Win32 메시지 처리파일 다운로드1
13687정성태7/19/2024270닷넷: 2279. C# - PostThreadMessage로 보낸 메시지를 Windows Forms에서 수신하는 방법파일 다운로드1
13686정성태7/19/2024261오류 유형: 918. Visual Studio - ATL Simple Object 추가 시 error C2065: 'IDR_...': undeclared identifier
13685정성태7/19/2024296스크립트: 66. Windows 디렉터리 경로를 WSL의 /mnt 포맷으로 구하는 방법 - 두 번째 이야기
13684정성태7/19/2024313닷넷: 2278. C# - 문자열 보간식 사례
13683정성태7/18/2024284오류 유형: 917. ClrMD - Linux 환경의 .NET 5 덤프 분석 시 hang 현상
13682정성태7/18/2024369닷넷: 2277. WPF - 스레드에 종속되는 DependencyObject파일 다운로드1
13681정성태7/17/2024425닷넷: 2276. C# 13 - (2) 메서드 그룹의 자연 타입 개선 (메서드 추론 개선)파일 다운로드1
13680정성태7/16/2024520닷넷: 2275. C# - Method Group, Natural Type, function_type파일 다운로드1
13679정성태7/16/2024650Linux: 75. Linux - C++ (getaddrinfo 등을 담고 있는) libnss 정적 링크
13678정성태7/15/2024541VS.NET IDE: 191. Visual Studio 2022 - .NET 5 프로젝트를 Docker Support로 실행했을 때 오류
13677정성태7/15/2024572오류 유형: 916. MSBuild - CheckEolTargetFramework (warning NETSDK1138)
13676정성태7/14/2024560Linux: 75. gdb에서 glibc의 함수에 Breakpoint 걸기
13675정성태7/13/2024810C/C++: 166. C/C++ - DLL에서 template 함수를 export하는 방법파일 다운로드1
13674정성태7/13/2024932오류 유형: 915. Unhandled Exception: Microsoft.Diagnostics.NETCore.Client.ServerNotAvailableException: Unable to connect to Process
13673정성태7/11/2024980닷넷: 2274. C# 13 - (1) 신규 이스케이프 시퀀스 '\e'파일 다운로드1
13672정성태7/10/2024991닷넷: 2273. IIS - (프로세스 종료 없는) AppDomain Recycle
13671정성태7/10/2024845오류 유형: 914. Package ca-certificates is not installed.
13669정성태7/9/2024988오류 유형: 913. C# - AOT StaticExecutable 정적 링킹 시 빌드 오류
13668정성태7/8/2024959개발 환경 구성: 716. Hyper-V - Ubuntu 22.04 Generation 2 유형의 VM 설치
13667정성태7/7/2024873닷넷: 2272. C# - 리눅스 환경에서의 Hyper-V Socket 연동 (AF_VSOCK)파일 다운로드1
13666정성태7/7/20241114Linux: 74. C++ - Vsock 예제 (Hyper-V Socket 연동)파일 다운로드1
13665정성태7/6/20241148Linux: 73. Linux 측의 socat을 이용한 Hyper-V 호스트와의 vsock 테스트파일 다운로드1
13663정성태7/5/20241131닷넷: 2271. C# - Hyper-V Socket 통신(AF_HYPERV, AF_VSOCK)의 VMID Wildcards 유형파일 다운로드1
13662정성태7/4/20241392닷넷: 2270. C# - WSL 2 VM의 VM ID를 알아내는 방법 - Host Compute System API파일 다운로드1
[1]  2  3  4  5  6  7  8  9  10  11  12  13  14  15  ...