Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
(연관된 글이 1개 있습니다.)

P/Invoke의 성능을 높이기 위해 C++/CLI가 선택되려면?

예제 코드로 직접 설명해 볼까요? C#의 경우, 다음과 같이 P/Invoke 형식으로 Win32 API를 호출할 수 있는 반면,

class Program
{
    [DllImport("kernel32.dll")]
    static extern uint GetCurrentThreadId();

    static void Main(string[] args)
    {
        GetCurrentThreadId();
    }
}

C++/CLI의 경우에는 별다르게 P/Invoke 절차 없이 일반적인 C/C++에서 했던 것처럼 Win32 API를 곧바로 호출할 수가 있습니다.

#pragma once
#include <Windows.h>
using namespace System;

namespace TestLibrary {
    public ref class Class1
    {
    public:
        int GetId()
        {
            return ::GetCurrentThreadId();
        }
    };
}

C++/CLI의 활용예 중에 하나가, Managed 언어(C#,VB.NET,...)에서 P/Invoke를 이용하여 Win32 DLL에서 제공하는 API를 호출할 때 성능을 높이려는 방안이 하나 있습니다. 실제로 MSDN 문서에 보면 다음과 같은 이야기가 실려 있는데요.

Performance Considerations for Interop (C++)
; https://learn.microsoft.com/en-us/cpp/dotnet/performance-considerations-for-interop-cpp

C++ Interop uses the fastest possible method of data marshaling, whereas P/Invoke uses the most robust method. This means that C++ Interop (in a fashion typical for C++) provides optimal performance by default, and the programmer is responsible for addressing cases where this behavior is not safe or appropriate.


아울러, Managed 응용 프로그램에서 Native API를 호출하려면 다음과 같은 작업들이 필요하다고 되어 있습니다.

  • The function call arguments are marshaled from CLR to native types.
  • A managed-to-unmanaged thunk is executed.
  • The unmanaged function is called (using the native versions of the arguments).
  • An unmanaged-to-managed thunk is executed.
  • The return type and any "out" or "in,out" arguments are marshaled from native to CLR types.

여기서 우리가 정확하게 알아야 할 것은, C++/CLI 역시 Native API를 호출할 때에는 C#에서 PInvoke를 통해 호출했을 때처럼 managed-to-unmanaged thunk / unmanaged-to-managed thunk는 필요하다는 점입니다. 참고로, "thunk"에 대해서 낯설어 하시는 분들이 계실 텐데... 음... Visual Studio로 디버깅을 하다 보면 다음과 같은 "Call Stack"을 보는 경우가 있는데요.

pinvoke_perf_1.png

위에서 보이는 "[Managed to Native Transition]"에 해당하는 부분이 바로 "thunk"입니다. (물론, thunk라는 용어는 다양하게 쓰이는데, 일례로 WOW64에서도 64비트와 32비트 간의 변환을 위해 쓰이는 부분도 thunk라고 부릅니다.)

이렇게 따지면, C++/CLI에서 유일하게 성능을 높일 수 있는 부분은 바로 "data marshaling"입니다.




개인적으로, 이 부분에서 다소 궁금한 점이 생겼습니다. 그렇다면, 데이터 마샬링 부하 없이 실제로 어느 정도의 성능 차이가 있을까 하는 것입니다.

당연히... 이런 것은 테스트를 해봐야겠지요. ^^

그래서, 2개의 프로젝트를 준비하고,

  • ConsoleApplication1: C# Console EXE
  • TestLibrary: C++/CLI Library

C#에서 다음과 같이 PInvoke 호출을 하는 코드를 만든 후,

class Program
{
    [DllImport("kernel32.dll")]
    static extern uint GetCurrentThreadId();

    static void Main(string[] args)
    {
        int count = 100000;
        PInvokeTest(1); // JIT 컴파일 시간을 측정 시간에서 없애기 위해 미리 한번 호출

        Console.WriteLine("===================");

        PInvokeTest(count);
    }

    private static void PInvokeTest(int loopCount)
    {
        Stopwatch st = new Stopwatch();
        st.Start();

        for (int i = 0; i < loopCount; i++)
        {
            GetCurrentThreadId();
        }

        st.Stop();

        Console.WriteLine(st.ElapsedTicks);
    }
}

역시 C++/CLI에서도 위의 기능을 하는 코드를 만들어서,

#pragma once

#include <Windows.h>

using namespace System;

namespace TestLibrary {

    public ref class Class1
    {
    public:
        void GetId2(int count)
        {
            for (int i = 0; i < count; i ++)
            {
                ::GetCurrentThreadId();
            }
        }
    };
}

동일하게 시간을 측정할 수 있도록 C# Main 함수에 넣어두었습니다.

static void Main(string[] args)
{
    int count = 100000;
    PInvokeTest(1);
    Cppcli2Test(1);

    Console.WriteLine("===================");

    PInvokeTest(count);
    Cppcli2Test(count);
}

private static void Cppcli2Test(int count)
{
    TestLibrary.Class1 cl = new TestLibrary.Class1();

    Stopwatch st = new Stopwatch();
    st.Start();

    cl.GetId2(count);
    st.Stop();
    Console.WriteLine(st.ElapsedTicks);
}

다음은 3회 실행한 결과입니다.

P/Invoke: 12013, 9385, 11388
C++/CLI : 9346,  9330, 10504

보시는 것처럼 거의 차이가 나지 않습니다. 10만 번 수행에 저 정도 차이면, 추가된 C/C++ 프로젝트 관리나 그로 인한 x86/x64 DLL 파일의 유지/보수 노력을 감안했을 때 하지 않는 편이 더 낫습니다.

물론, 데이터 마샬링이 어느 정도 요구되는 상황에서는 분명히 C++/CLI의 장점이 있을 테지만, 우리가 일반적으로 만드는 C# 응용 프로그램에서는 사실상 P/Invoke의 성능을 높이기 위해 굳이 C++/CLI를 사용할 필요는 없다는 것을 잘 보여주고 있습니다.

웹에서 검색해 보니, 한 가지 실험 결과가 더 눈에 띄는데요.

PInvoke Performance
; http://www.codeproject.com/Articles/253444/PInvoke-Performance

위의 글에서 재미있는 결과를 볼 수 있는데, 바로 Native API의 속도가 눈에 띄게 높다는 점입니다.

아하~~~ 그렇다면, 제 결론은 이렇습니다.

그나마라도 성능이 아쉬운 상황이어서 어떻게라도 개선을 해야 한다면, C++/CLI를 사용하기보다는 아예 Win32 DLL(또는 COM 개체)을 만들어서 C/C++ 수준에서 성능을 높이는 것이 더 좋은 선택입니다!


* 첨부 파일은 다음의 3개 프로젝트를 포함하고 있습니다.

  • ConsoleApplication1: C# 콘솔 응용 프로그램
  • TestLibrary: C++/CLI 라이브러리
  • TestWin32DLL: C/C++ Win32 DLL




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 3/20/2023]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2022-01-24 12시11분
[이세연] 열심히 CLI 공부해서 쓰고 있는데, 그냥 무식하게 PInvoke를 쓰는 거랑 차이가 없다니 충격적이네요.
언급하셨던 것처럼 그냥 unmanaged만으로 이뤄진 api로 호출을 최소화 하는 방향이 좋은 걸까요?
항상 그렇지만 저한태는 C++ - C# bridge의 코스트가 항상 높다는게 아쉬운 대목이에요.
[guest]
2022-01-24 12시43분
PInvoke에서의 차이가 없는 것은, 인자로 넘어가는 데이터의 양에 따라 달라질 수 있습니다. 예제에서 든 것은 인자가 하나도 없는 GetCurrentThreadId이기 때문에 그런 결과가 나온 것입니다.

그건 그렇고, C++/C# 호출의 cost가 높다는 것은, 어떤 거랑 비교해서 그렇다는 것인가요? 아니면 그냥 높아서 아쉽다는 것인가요? 제 개인적인 의견으로는, managed와 native 간의 호출에서 저 정도 이상으로 최적화는 어렵지 않을까... 예상해 봅니다. 게다가, Win32 API를 DllImport만으로 간단하게 호출할 수 있는 장치도 마련돼 있으니 설령 호출 비용이 높아도 어렵지 않게 우회할 수 있습니다. (유사한 예로, JAVA의 경우 네이티브와 연동하기 위해 JNI를 따르도록 되어 있는데, 아마도 그걸 이용해 보시면 C#이 얼마나 단순하게 네이티브 연동을 지원하는지 체감하실 것입니다. ^^)
정성태
2022-01-24 11시52분
[이세연] 저는 하드웨어랑 통신하는 소프트웨어를 개발하고 있습니다.
세팅하는데 1MB정도의 크기를 갖는 데이터를 넘겨주고, 초당 3000번이 넘는 횟수로 1MB정도 되는 데이터를 매번 받고 있습니다.
CUDA로는 1000번이 넘는 횟수로 획득한 1MB데이터를 매번 계산해주고 있습니다.
데이터를 통신하는 쪽이나 처리하는 쪽은 모두 C++로 이뤄져 있습니다.
저도 이렇게 조사만 할게 아니라 직접 테스트해봐야겠네요.

비교한 건 사실 본문내용으로 알려주신 링크에서 볼 수 있었는데, 달린 댓글을 보니,
컴파일러가 아무래도 안쓰는 데이터 연산을 최적화한 것으로 보여서 정확한 결과값은 아닌 것 같아 더 찾아봤습니다.(그외 최적화를 위해 attribute로 뭔가 건들고 한 것 같습니다)
https://pknopf.com/post/2013-03-06-cpp-cli-vs-com/
결론적으로 CLI를 쓴게 오지게 느려진단 사실과 그래도 쓰고 싶다면 wrapper로 쓰라는 참교육적인 비교가 있었습니다.
[guest]
2022-01-24 01시32분
재미있는 프로젝트를 하시는군요. ^^

말씀해주신 그 테스트 결과에서도 마찬가지지만, 제가 본문에서 언급한 것처럼 C++/CLI도 처음 bridge 역할을 하는 ref class는 결국 managed이기 때문에, 거기서 native를 호출하는 것은 thunking 비용이 발생합니다. 따라서, C++/CLI로 성능을 높이고 싶다면, 실질적인 부하가 걸리는 것은 (루프 실행을 포함해) native 파트로 만들고 C++/CLI로는 제어 용도의 인수만 넘기는 것이 좋습니다.

아울러 아래의 글도 보시면 재미있을 것입니다. ^^

내가 만든 코드보다 OpenCV의 속도가 월등히 빠른 이유
; https://www.sysnet.pe.kr/2/0/11423

CUDA로 작성한 RGB2RGBA 성능
; https://www.sysnet.pe.kr/2/0/11471
정성태
2022-01-24 04시30분
[이세연] 조언 감사합니다. 꼭 읽어보겠습니다.
[guest]

... 61  62  63  64  65  66  67  68  69  70  71  [72]  73  74  75  ...
NoWriterDateCnt.TitleFile(s)
12010정성태8/27/201914615VS.NET IDE: 138. VSIX - DTE.ItemOperations.NewFile 메서드에서 템플릿 이름을 다국어로 설정하는 방법
12009정성태8/26/201915227.NET Framework: 858. C#/Windows - Clipboard(Ctrl+C, Ctrl+V)가 동작하지 않는다면?파일 다운로드1
12008정성태8/26/201915000.NET Framework: 857. UWP 앱에서 SQL Server 데이터베이스 연결 방법
12007정성태8/24/201913975.NET Framework: 856. .NET Framework 버전을 올렸을 때 오류가 발생할 수 있는 상황
12006정성태8/23/201917132디버깅 기술: 129. guidgen - Encountered an improper argument. 오류 해결 방법 (및 windbg 분석) [1]
12005정성태8/13/201915008.NET Framework: 855. 닷넷 (및 VM 계열 언어) 코드의 성능 측정 시 주의할 점 [2]파일 다운로드1
12004정성태8/12/201923101.NET Framework: 854. C# - 32feet.NET을 이용한 PC 간 Bluetooth 통신 예제 코드 [14]
12003정성태8/12/201915464오류 유형: 564. Visual C++ 컴파일 오류 - fatal error C1090: PDB API call failed, error code '3'
12002정성태8/12/201914590.NET Framework: 853. Excel Sheet를 WinForm에서 사용하는 방법 - 두 번째 이야기 [5]
12001정성태8/10/201919520.NET Framework: 852. WPF/WinForm에서 UWP의 기능을 이용해 Bluetooth 기기와 Pairing하는 방법 [1]
12000정성태8/9/201918546.NET Framework: 851. WinForm/WPF에서 Console 창을 띄워 출력하는 방법파일 다운로드1
11999정성태8/1/201913826오류 유형: 563. C# - .NET Core 2.0 이하의 Unix Domain Socket 사용 시 System.IndexOutOfRangeException 오류
11998정성태7/30/201915579오류 유형: 562. .NET Remoting에서 서비스 호출 시 SYN_SENT로 남는 현상파일 다운로드1
11997정성태7/30/201916769.NET Framework: 850. C# - Excel(을 비롯해 Office 제품군) COM 객체를 제어 후 Excel.exe 프로세스가 남아 있는 문제 [2]파일 다운로드1
11996정성태7/25/201919356.NET Framework: 849. C# - Socket의 TIME_WAIT 상태를 없애는 방법파일 다운로드1
11995정성태7/23/201922395.NET Framework: 848. C# - smtp.daum.net 서비스(Implicit SSL)를 이용해 메일 보내는 방법 [2]
11994정성태7/22/201917970개발 환경 구성: 454. Azure 가상 머신(VM)에서 SMTP 메일 전송하는 방법파일 다운로드1
11993정성태7/22/201912665오류 유형: 561. Dism.exe 수행 시 "Error: 2 - The system cannot find the file specified." 오류 발생
11992정성태7/22/201914707오류 유형: 560. 서비스 관리자 실행 시 "Windows was unable to open service control manager database on [...]. Error 5: Access is denied." 오류 발생
11991정성태7/18/201911804디버깅 기술: 128. windbg - x64 환경에서 닷넷 예외가 발생한 경우 인자를 확인할 수 없었던 사례
11990정성태7/18/201914354오류 유형: 559. Settings / Update & Security 화면 진입 시 프로그램 종료
11989정성태7/18/201913223Windows: 162. Windows Server 2019 빌드 17763부터 Alt + F4 입력시 곧바로 로그아웃하는 현상
11988정성태7/18/201914923개발 환경 구성: 453. 마이크로소프트가 지정한 모든 Root 인증서를 설치하는 방법
11987정성태7/17/201920424오류 유형: 558. 윈도우 - KMODE_EXCEPTION_NOT_HANDLED 블루스크린(BSOD) 문제 [1]
11986정성태7/17/201912356오류 유형: 557. 드라이브 문자를 할당하지 않은 파티션을 탐색기에서 드라이브 문자와 함께 보여주는 문제
11985정성태7/17/201912780개발 환경 구성: 452. msbuild - csproj에 환경 변수 조건 사용 [1]
... 61  62  63  64  65  66  67  68  69  70  71  [72]  73  74  75  ...