Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 
(연관된 글이 2개 있습니다.)

.NET 5+ 환경에서 P/Invoke의 성능을 높이기 위한 SuppressGCTransition 특성

오호~~~ 재미있는 트윗이 하나 올라왔군요. ^^


...I did some research on the SuppressGCTransition attribute....
; https://twitter.com/KooKiz/status/1692127734854459426?s=20

SuppressGCTransition
; https://minidump.net/suppressgctransition-b9a8a774edbd

위의 글을 정리해 볼까요? ^^

SuppressGCTransition 특성은 .NET 5부터 추가된 것으로, DllImport를 적용한 P/Inovke API에 함께 적용할 수 있습니다.

[DllImport("NativeLib.dll")]
[SuppressGCTransition]
static extern int Increment(int value);

이것을 적용하면 (저자가 작성한 테스트 함수의 경우) 4배 정도의 속도 향상이 있었다고 하는데요, 그럴 수밖에 없는 것이 해당 특성으로 인해 P/Invoke의 Transition 관련 코드들이 없어지기 때문입니다. 이에 대해서는 전에 몇 번 언급한 적이 있군요. ^^

P/Invoke의 성능을 높이기 위해 C++/CLI가 선택되려면?
; https://www.sysnet.pe.kr/2/0/1229

windbg - C# PInvoke 호출 시 마샬링을 담당하는 함수 분석
; https://www.sysnet.pe.kr/2/0/12065

하지만, SuppressGCTransition이 항상 좋은 것은 아닌데요, 원문의 글에서도 나오듯이 P/Invoke API의 실행 시간을 일부러 100ms 지연시킨 경우에는 반대로 2배의 속도 저하가 생깁니다.




속도 저하의 원인을 설명하기 위해서는 스레드의 2가지 상태, Preemptive와 Cooperative를 알아야 합니다.

.NET Thread 상태가 Cooperative일 때 GC hang 현상 재현 방법
; https://www.sysnet.pe.kr/2/0/11634

닷넷 세계에서, P/Invoke를 통해 진입한 비-관리 코드는 GC에 방해를 하지 않는 Preemptive 상태입니다. 이러한 상태 변화는 P/Invoke 대상이 되는 API의 앞/뒤로 실행되는 Transition 관리 코드에서 처리하는데요, 대충 이런 식입니다.

...[닷넷 코드를 수행 중인 Cooperative 상태의 스레드가 P/Invoke 호출]...
[transition - 스레드를 Preemptive 상태로 마킹]
Native API 호출
[transition - 스레드를 Cooperative 상태로 마킹]
...[닷넷 코드를 계속 수행(Cooperative 상태)]...

하지만 SuppressGCTransition 특성을 지정하면 transition 코드가 없어지기 때문에,

...[닷넷 코드를 수행 중인 Cooperative 상태의 스레드가 P/Invoke 호출]...
Native API 호출 (여전히 Cooperative 상태)
...[닷넷 코드를 계속 수행(Cooperative 상태)]...

Native API 실행 중에도 Cooperative로 남게 되는 것입니다.

저런 변화를 GC에 엮어서 설명해 볼까요?

GC는, Preemptive 상태의 스레드는 무시하고 수행할 수 있습니다. P/Invoke의 상황을 예로 들면, 일단 Preemptive로 표시된 후 Native API가 호출되는 동안에 GC는 그 스레드와 병렬로 수행될 수 있습니다. 그렇다면 GC가 수행되는 사이 Native API 호출이 완료되고 Cooperative 모드의 닷넷 코드 영역으로 넘어가면 문제가 되지 않을까요? ^^

그럴 수가 없는 것이, Native API 호출 이후 현재 GC가 수행 중이면 닷넷 코드로 진입하기 전에 blocking을 하기 때문입니다.

자, 그럼 SuppressGCTransition 특성이 왜 성능에 영향을 미치는지 예상할 수 있습니다. Native API 전/후의 transition 코드를 없애기 때문에 스레드는 계속 Cooperative 상태로 머물게 되고, 이때 GC는 그 스레드와 병렬로 수행할 수 없습니다. 결국 GC는 Cooperative 스레드를 안전한 위치의 코드를 수행 중인 지 확인하기 위해 suspend 시켜, 1) 만약 안전한 영역이라면 그대로 (suspend 상태로) GC를 수행하지만, 2) 안전하지 않은 영역을 수행 중이면 안전한 영역으로 나올 때까지 다시 resume 시킨 후 GC는 "대기"를 하게 됩니다.

정리하면, SuppressGCTransition으로 인해 GC는 모든 .NET 스레드를 중지시킨 체로 대기하다가 P/Invoke API의 호출이 완료돼 해당 스레드가 중지되어서야 비로소 GC 작업을 하기 때문에 성능에 영향을 미치게 되는 것입니다.




SuppressGCTransition 적용의 또 다른 부작용은 디버거가 정상적으로 P/Invoke로 들어선 스레드의 호출 스택을 보여줄 수 없다는 것입니다. 아마도 이것은 차차 개선되지 않을까 싶은데요, 현재의 SOS Debugger 확장은 Transition이 당연히 있는 것으로 가정하고 !clrstack의 결과를 찾기 때문에 SuppressGCTransition이 있는 P/Invoke 호출에 대해서는 정상적인 풀이를 못하는 듯합니다. (순전히 제 의견입니다. ^^)

문서에 따르면, P/Invoke로 호출하는 native 함수 안에서 예외를 던져서도 안 된다고 합니다. 원문의 저자가 수행한 테스트로는 별다른 부작용을 발견할 수는 없었지만, 아무튼 문서에 따르는 것이 좋겠다는 의견입니다.

또한, P/Invoke 내에서 닷넷 측으로의 콜백(Reverse P/Invokes)도 해서는 안 된다고 합니다. 이것은 Transition 층이 없어지는 것으로 인한 부작용인데요, 예를 들어 기존에는 다음과 같은 호출과 스레드 상태 변경이 있었는데,

// SuppressGCTransition 미지정
.net code -> (transition) ->  p/invoke code -> (transition) -> (callback to) .net code -> (transition) -> p/invoke code
[Cooperative]      ->         [Preemptive]           ->                      [Cooperative]      ->        [Preemptive]

보는 바와 같이 p/invoke에서 콜백을 호출하기 전/후 동일하게 [Preemptive] 상태로 일치합니다. 반면 SuppressGCTransition으로 transition 코드가 빠진 경우에는,

// SuppressGCTransition 지정

.net code ->  p/invoke code -> (transition) -> (callback to) .net code -> (transition) -> p/invoke code
[Cooperative]                      ->                        [Cooperative]    ->          [Preemptive]

콜백 호출 전에는 Cooperative 모드였는데, 콜백을 완료하고 나서는 Preemptive 모드로 바뀌었습니다. 따라서 GC로 하여금 안전한 상태로 판정받기 때문에 별다른 조치가 없는 상태에서 P/Invoke 호출을 빠져나와 곧바로 .NET Code를 수행하는 시점에 자칫 (아마도) ExecutionEngineException 오류가 발생할 수 있습니다.

기타 "Stack spill"에 대해서도 설명하지만 어차피 이것은 Transition 코드가 갖는 오버헤드이므로 딱히 중요한 것은 아닙니다.

마지막으로, 문서에는 SuppressGCTransition에 대한 사용 지침을 알려주고 있으니 참고하시고,

  • 가능한 1us(1마이크로 초) 안에 수행될 함수에 대해서만 SuppressGCTransition 지정 (권장)
  • 닷넷 코드로의 callback이 없어야 하고 (필수),
  • 예외를 발생시켜서는 안 되고 (필수),
  • (블록킹을 발생할 수 있는) lock을 다루지 않아야 함 (권장)

덕분에 재미있는 것을 알게 되었습니다. ^^




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 8/21/2023]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2023-08-20 01시09분
좋은 글 감사합니다!
이승후

1  2  3  [4]  5  6  7  8  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
13490정성태12/19/20231392개발 환경 구성: 698. Golang - GLIBC 의존을 없애는 정적 빌드 방법
13489정성태12/19/20231179개발 환경 구성: 697. GoLand에서 ldflags 지정 방법
13488정성태12/18/20231186오류 유형: 884. HTTP 500.0 - 명령행에서 실행한 ASP.NET Core 응용 프로그램을 실행하는 방법
13487정성태12/16/20231399개발 환경 구성: 696. C# - 리눅스용 AOT 빌드를 docker에서 수행 [1]
13486정성태12/15/20231223개발 환경 구성: 695. Nuget config 파일에 값 설정/삭제 방법
13485정성태12/15/20231224오류 유형: 883. dotnet build/restore - error : Root element is missing
13484정성태12/14/20231344개발 환경 구성: 694. Windows 디렉터리 경로를 WSL의 /mnt 포맷으로 구하는 방법
13483정성태12/14/20231503닷넷: 2184. C# - 하나의 resource 파일을 여러 프로그램에서 (AOT 시에도) 사용하는 방법파일 다운로드1
13482정성태12/13/20231847닷넷: 2183. C# - eFriend Expert OCX 예제를 .NET Core/5+ Console App에서 사용하는 방법 [2]파일 다운로드1
13481정성태12/13/20231551개발 환경 구성: 693. msbuild - .NET Core/5+ 프로젝트에서 resgen을 이용한 리소스 파일 생성 방법파일 다운로드1
13480정성태12/12/20231583개발 환경 구성: 692. Windows WSL 2 + Chrome 웹 브라우저 설치
13479정성태12/11/20231567개발 환경 구성: 691. WSL 2 (Ubuntu) + nginx 환경 설정
13477정성태12/8/20231724닷넷: 2182. C# - .NET 7부터 추가된 Int128, UInt128 [1]파일 다운로드1
13476정성태12/8/20231542닷넷: 2181. C# - .NET 8 JsonStringEnumConverter의 AOT를 위한 개선파일 다운로드1
13475정성태12/7/20231566닷넷: 2180. .NET 8 - 함수 포인터에 대한 Reflection 정보 조회파일 다운로드1
13474정성태12/6/20231470개발 환경 구성: 690. 닷넷 코어/5+ 버전의 ilasm/ildasm 실행 파일 구하는 방법 - 두 번째 이야기
13473정성태12/5/20231580닷넷: 2179. C# - 값 형식(Blittable)을 메모리 복사를 이용해 바이트 배열로 직렬화/역직렬화파일 다운로드1
13472정성태12/4/20231452C/C++: 164. Visual C++ - InterlockedCompareExchange128 사용 방법
13471정성태12/4/20231500Copilot - To enable GitHub Copilot, authorize this extension using GitHub's device flow
13470정성태12/2/20231702닷넷: 2178. C# - .NET 8부터 COM Interop에 대한 자동 소스 코드 생성 도입파일 다운로드1
13469정성태12/1/20231535닷넷: 2177. C# - (Interop DLL 없이) CoClass를 이용한 COM 개체 생성 방법파일 다운로드1
13468정성태12/1/20231473닷넷: 2176. C# - .NET Core/5+부터 달라진 RCW(Runtime Callable Wrapper) 대응 방식파일 다운로드1
13467정성태11/30/20231498오류 유형: 882. C# - Unhandled exception. System.Runtime.InteropServices.COMException (0x800080A5)파일 다운로드1
13466정성태11/29/20231630닷넷: 2175. C# - DllImport 메서드의 AOT 지원을 위한 LibraryImport 옵션
13465정성태11/28/20231457개발 환경 구성: 689. MSBuild - CopyToOutputDirectory가 "dotnet publish" 시에는 적용되지 않는 문제파일 다운로드1
13464정성태11/28/20231594닷넷: 2174. C# - .NET 7부터 UnmanagedCallersOnly 함수 export 기능을 AOT 빌드에 통합파일 다운로드1
1  2  3  [4]  5  6  7  8  9  10  11  12  13  14  15  ...