Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 
(연관된 글이 2개 있습니다.)

.NET 5+ 환경에서 P/Invoke의 성능을 높이기 위한 SuppressGCTransition 특성

오호~~~ 재미있는 트윗이 하나 올라왔군요. ^^


...I did some research on the SuppressGCTransition attribute....
; https://twitter.com/KooKiz/status/1692127734854459426?s=20

SuppressGCTransition
; https://minidump.net/suppressgctransition-b9a8a774edbd

위의 글을 정리해 볼까요? ^^

SuppressGCTransition 특성은 .NET 5부터 추가된 것으로, DllImport를 적용한 P/Inovke API에 함께 적용할 수 있습니다.

[DllImport("NativeLib.dll")]
[SuppressGCTransition]
static extern int Increment(int value);

이것을 적용하면 (저자가 작성한 테스트 함수의 경우) 4배 정도의 속도 향상이 있었다고 하는데요, 그럴 수밖에 없는 것이 해당 특성으로 인해 P/Invoke의 Transition 관련 코드들이 없어지기 때문입니다. 이에 대해서는 전에 몇 번 언급한 적이 있군요. ^^

P/Invoke의 성능을 높이기 위해 C++/CLI가 선택되려면?
; https://www.sysnet.pe.kr/2/0/1229

windbg - C# PInvoke 호출 시 마샬링을 담당하는 함수 분석
; https://www.sysnet.pe.kr/2/0/12065

하지만, SuppressGCTransition이 항상 좋은 것은 아닌데요, 원문의 글에서도 나오듯이 P/Invoke API의 실행 시간을 일부러 100ms 지연시킨 경우에는 반대로 2배의 속도 저하가 생깁니다.




속도 저하의 원인을 설명하기 위해서는 스레드의 2가지 상태, Preemptive와 Cooperative를 알아야 합니다.

.NET Thread 상태가 Cooperative일 때 GC hang 현상 재현 방법
; https://www.sysnet.pe.kr/2/0/11634

닷넷 세계에서, P/Invoke를 통해 진입한 비-관리 코드는 GC에 방해를 하지 않는 Preemptive 상태입니다. 이러한 상태 변화는 P/Invoke 대상이 되는 API의 앞/뒤로 실행되는 Transition 관리 코드에서 처리하는데요, 대충 이런 식입니다.

...[닷넷 코드를 수행 중인 Cooperative 상태의 스레드가 P/Invoke 호출]...
[transition - 스레드를 Preemptive 상태로 마킹]
Native API 호출
[transition - 스레드를 Cooperative 상태로 마킹]
...[닷넷 코드를 계속 수행(Cooperative 상태)]...

하지만 SuppressGCTransition 특성을 지정하면 transition 코드가 없어지기 때문에,

...[닷넷 코드를 수행 중인 Cooperative 상태의 스레드가 P/Invoke 호출]...
Native API 호출 (여전히 Cooperative 상태)
...[닷넷 코드를 계속 수행(Cooperative 상태)]...

Native API 실행 중에도 Cooperative로 남게 되는 것입니다.

저런 변화를 GC에 엮어서 설명해 볼까요?

GC는, Preemptive 상태의 스레드는 무시하고 수행할 수 있습니다. P/Invoke의 상황을 예로 들면, 일단 Preemptive로 표시된 후 Native API가 호출되는 동안에 GC는 그 스레드와 병렬로 수행될 수 있습니다. 그렇다면 GC가 수행되는 사이 Native API 호출이 완료되고 Cooperative 모드의 닷넷 코드 영역으로 넘어가면 문제가 되지 않을까요? ^^

그럴 수가 없는 것이, Native API 호출 이후 현재 GC가 수행 중이면 닷넷 코드로 진입하기 전에 blocking을 하기 때문입니다.

자, 그럼 SuppressGCTransition 특성이 왜 성능에 영향을 미치는지 예상할 수 있습니다. Native API 전/후의 transition 코드를 없애기 때문에 스레드는 계속 Cooperative 상태로 머물게 되고, 이때 GC는 그 스레드와 병렬로 수행할 수 없습니다. 결국 GC는 Cooperative 스레드를 안전한 위치의 코드를 수행 중인 지 확인하기 위해 suspend 시켜, 1) 만약 안전한 영역이라면 그대로 (suspend 상태로) GC를 수행하지만, 2) 안전하지 않은 영역을 수행 중이면 안전한 영역으로 나올 때까지 다시 resume 시킨 후 GC는 "대기"를 하게 됩니다.

정리하면, SuppressGCTransition으로 인해 GC는 모든 .NET 스레드를 중지시킨 체로 대기하다가 P/Invoke API의 호출이 완료돼 해당 스레드가 중지되어서야 비로소 GC 작업을 하기 때문에 성능에 영향을 미치게 되는 것입니다.




SuppressGCTransition 적용의 또 다른 부작용은 디버거가 정상적으로 P/Invoke로 들어선 스레드의 호출 스택을 보여줄 수 없다는 것입니다. 아마도 이것은 차차 개선되지 않을까 싶은데요, 현재의 SOS Debugger 확장은 Transition이 당연히 있는 것으로 가정하고 !clrstack의 결과를 찾기 때문에 SuppressGCTransition이 있는 P/Invoke 호출에 대해서는 정상적인 풀이를 못하는 듯합니다. (순전히 제 의견입니다. ^^)

문서에 따르면, P/Invoke로 호출하는 native 함수 안에서 예외를 던져서도 안 된다고 합니다. 원문의 저자가 수행한 테스트로는 별다른 부작용을 발견할 수는 없었지만, 아무튼 문서에 따르는 것이 좋겠다는 의견입니다.

또한, P/Invoke 내에서 닷넷 측으로의 콜백(Reverse P/Invokes)도 해서는 안 된다고 합니다. 이것은 Transition 층이 없어지는 것으로 인한 부작용인데요, 예를 들어 기존에는 다음과 같은 호출과 스레드 상태 변경이 있었는데,

// SuppressGCTransition 미지정
.net code -> (transition) ->  p/invoke code -> (transition) -> (callback to) .net code -> (transition) -> p/invoke code
[Cooperative]      ->         [Preemptive]           ->                      [Cooperative]      ->        [Preemptive]

보는 바와 같이 p/invoke에서 콜백을 호출하기 전/후 동일하게 [Preemptive] 상태로 일치합니다. 반면 SuppressGCTransition으로 transition 코드가 빠진 경우에는,

// SuppressGCTransition 지정

.net code ->  p/invoke code -> (transition) -> (callback to) .net code -> (transition) -> p/invoke code
[Cooperative]                      ->                        [Cooperative]    ->          [Preemptive]

콜백 호출 전에는 Cooperative 모드였는데, 콜백을 완료하고 나서는 Preemptive 모드로 바뀌었습니다. 따라서 GC로 하여금 안전한 상태로 판정받기 때문에 별다른 조치가 없는 상태에서 P/Invoke 호출을 빠져나와 곧바로 .NET Code를 수행하는 시점에 자칫 (아마도) ExecutionEngineException 오류가 발생할 수 있습니다.

기타 "Stack spill"에 대해서도 설명하지만 어차피 이것은 Transition 코드가 갖는 오버헤드이므로 딱히 중요한 것은 아닙니다.

마지막으로, 문서에는 SuppressGCTransition에 대한 사용 지침을 알려주고 있으니 참고하시고,

  • 가능한 1us(1마이크로 초) 안에 수행될 함수에 대해서만 SuppressGCTransition 지정 (권장)
  • 닷넷 코드로의 callback이 없어야 하고 (필수),
  • 예외를 발생시켜서는 안 되고 (필수),
  • (블록킹을 발생할 수 있는) lock을 다루지 않아야 함 (권장)

덕분에 재미있는 것을 알게 되었습니다. ^^




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 8/21/2023]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2023-08-20 01시09분
좋은 글 감사합니다!
이승후

1  2  [3]  4  5  6  7  8  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
13868정성태1/17/20253109Windows: 277. Hyper-V - Windows 11 VM의 Enhanced Session 모드로 로그인을 할 수 없는 문제
13867정성태1/17/20254062오류 유형: 943. Hyper-V에 Windows 11 설치 시 "This PC doesn't currently meet Windows 11 system requirements" 오류
13866정성태1/16/20254263개발 환경 구성: 739. Windows 10부터 바뀐 device driver 서명 방법
13865정성태1/15/20253943오류 유형: 942. C# - .NET Framework 4.5.2 이하의 버전에서 HttpWebRequest로 https 호출 시 "System.Net.WebException" 예외 발생
13864정성태1/15/20253906Linux: 114. eBPF를 위해 필요한 SELinux 보안 정책
13863정성태1/14/20253356Linux: 113. Linux - 프로세스를 위한 전용 SELinux 보안 문맥 지정
13862정성태1/13/20253628Linux: 112. Linux - 데몬을 위한 SELinux 보안 정책 설정
13861정성태1/11/20253907Windows: 276. 명령행에서 원격 서비스를 동기/비동기로 시작/중지
13860정성태1/10/20253614디버깅 기술: 216. WinDbg - 2가지 유형의 식 평가 방법(MASM, C++)
13859정성태1/9/20253971디버깅 기술: 215. Windbg - syscall 이후 실행되는 KiSystemCall64 함수 및 SSDT 디버깅
13858정성태1/8/20254100개발 환경 구성: 738. PowerShell - 원격 호출 시 "powershell.exe"가 아닌 "pwsh.exe" 환경으로 명령어를 실행하는 방법
13857정성태1/7/20254147C/C++: 187. Golang - 콘솔 응용 프로그램을 Linux 데몬 서비스를 지원하도록 변경파일 다운로드1
13856정성태1/6/20253726디버깅 기술: 214. Windbg - syscall 단계까지의 Win32 API 호출 (예: Sleep)
13855정성태12/28/20244459오류 유형: 941. Golang - os.StartProcess() 사용 시 오류 정리
13854정성태12/27/20244558C/C++: 186. Golang - 콘솔 응용 프로그램을 NT 서비스를 지원하도록 변경파일 다운로드1
13853정성태12/26/20244023디버깅 기술: 213. Windbg - swapgs 명령어와 (Ring 0 커널 모드의) FS, GS Segment 레지스터
13852정성태12/25/20244485디버깅 기술: 212. Windbg - (Ring 3 사용자 모드의) FS, GS Segment 레지스터파일 다운로드1
13851정성태12/23/20244238디버깅 기술: 211. Windbg - 커널 모드 디버깅 상태에서 사용자 프로그램을 디버깅하는 방법
13850정성태12/23/20244741오류 유형: 940. "Application Information" 서비스를 중지한 경우, "This file does not have an app associated with it for performing this action."
13849정성태12/20/20244878디버깅 기술: 210. Windbg - 논리(가상) 주소를 Segmentation을 거쳐 선형 주소로 변경
13848정성태12/18/20244817디버깅 기술: 209. Windbg로 알아보는 Prototype PTE파일 다운로드2
13847정성태12/18/20244855오류 유형: 939. golang - 빌드 시 "unknown directive: toolchain" 오류 빌드 시 이런 오류가 발생한다면?
13846정성태12/17/20245053디버깅 기술: 208. Windbg로 알아보는 Trans/Soft PTE와 2가지 Page Fault 유형파일 다운로드1
13845정성태12/16/20244526디버깅 기술: 207. Windbg로 알아보는 PTE (_MMPTE)
13844정성태12/14/20245211디버깅 기술: 206. Windbg로 알아보는 PFN (_MMPFN)파일 다운로드1
13843정성태12/13/20244391오류 유형: 938. Docker container 내에서 빌드 시 error MSB3021: Unable to copy file "..." to "...". Access to the path '...' is denied.
1  2  [3]  4  5  6  7  8  9  10  11  12  13  14  15  ...