Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일

C# - CSharpCodeProvider로 컴파일한 메서드의 실행이 일반 메서드보다 더 빠르다?

최근에 아주 재미있는 글을 봤습니다. ^^

Compiling C# Code at Runtime
; http://www.codeproject.com/Tips/715891/Compiling-Csharp-Code-at-Runtime

이 코드에서는 동일한 작업을 수행하는 4가지 메서드의 호출 성능을 보여줍니다.

1. 원본 메서드 직접 호출

for (int i = 0; i < repetitions; i++)
{
    result = OriginalFunction(2, 3);
}

public static double OriginalFunction(double x, double y)
{
    return x + 2 * y;
}

2. 런타임 시에 컴파일한 메서드를 Reflection으로 호출

MethodInfo function = CreateFunction("x + 2 * y");

for (int i = 0; i < repetitions; i++)
{
    result = (double)function.Invoke(null, new object[] { 2, 3 });
}

public static MethodInfo CreateFunction(string function)
{
    string code = @"
        using System;
            
        namespace UserFunctions
        {                
            public class BinaryFunction
            {                
                public static double Function(double x, double y)
                {
                    return func_xy;
                }
            }
        }
    ";

    string finalCode = code.Replace("func_xy", function);

	CSharpCodeProvider provider = new CSharpCodeProvider();
	CompilerParameters options = new CompilerParameters();
	CompilerResults results = provider.CompileAssemblyFromSource(options, finalCode);

    Type binaryFunction = results.CompiledAssembly.GetType("UserFunctions.BinaryFunction");
    return binaryFunction.GetMethod("Function");
}

3. 위의 2번 메서드를 Reflection이 아닌 Delegate로 연결해서 호출

var betterFunction = (Func<double, double, double>)Delegate.CreateDelegate(typeof(Func<double, double, double>), function);

for (int i = 0; i < repetitions; i++)
{
    result = betterFunction(2, 3);
}

4. 람다식으로 호출

Func<double, double, double> lambda = (x, y) => x + 2 * y;

for (int i = 0; i < repetitions; i++)
{
    result = lambda(2, 3);
}

흥미로운 것은 이 4가지 호출에 대한 성능을 제시하고 있는데, 그 결과가 이렇습니다.

  1. Original - time: 92 ms
  2. Reflection - time: 3686 ms
  3. Delegate - time: 64 ms
  4. Lambda - time: 90 ms

실제로 저도 해보니 다음과 같은 결과를 얻을 수 있었습니다.

  1. Original - time: 22.0012 ms
  2. Reflection - time: 2685.1552 ms
  3. Delegate - time: 17.0013 ms
  4. Lambda - time: 25.0018 ms

아니... 상식적으로 도저히 이해가 안됩니다. 어떻게 동적으로 컴파일한 메서드를 Delegate로 연결했다고 원본 메서드의 호출 성능을 능가할 수 있다는 것인지...?

물론... 마법은 없습니다. ^^




왜냐하면, 테스트 조건이 Original과 Delegate의 경우에 대해 공정하지 않기 때문입니다. 가장 큰 불공정 요소는 바로 해당 프로젝트가 Debug 모드로 빌드되었다는 점입니다. 즉, Original 메서드는 디버그 모드로 동작하는 반면 CSharpCodeProvider.CompileAssemblyFromSource 메서드는 기본적으로 릴리스 모드로 빌드하기 때문에 대상 메서드의 코드 최적화 차이로 그런 불합리한 성능 결과가 나온 것입니다.

동일한 조건을 맞추기 위해 CompileAssemblyFromSource가 디버그 결과물을 내놓도록 다음과 같이 수정하면 어떨까요?

CSharpCodeProvider provider = new CSharpCodeProvider();
CompilerParameters options = new CompilerParameters();
options.IncludeDebugInformation = true;
CompilerResults results = provider.CompileAssemblyFromSource(options, finalCode);

이제 다시 측정을 하면 예상했던 그 결과를 얻을 수 있습니다.

  1. Original - time: 23.001 ms
  2. Reflection - time: 2712.1604 ms
  3. Delegate - time: 25.9992 ms
  4. Lambda - time: 25.0102 ms

반대로 조건을 릴리스로 맞추기 위해 "options.IncludeDebugInformation = true;" 코드를 삭제하고 전체 프로젝트를 릴리스로 빌드하면 이런 결과를 얻게 됩니다.

  1. Original - time: 1.9997 ms
  2. Reflection - time: 2685.1459 ms
  3. Delegate - time: 18.0013 ms
  4. Lambda - time: 14.0009 ms

이번엔 Delegate보다 Original 메서드의 성능이 급격하게 올라갔습니다. 이유는? Original 메서드에 대해서는 C# 컴파일러가 인라인 최적화를 할 수 있었기 때문입니다. 이번엔 Delegate와의 공정함을 맞추기 위해 Original 메서드 측에 인라인 금지 특성을 지정해야 합니다.

[MethodImpl(MethodImplOptions.NoInlining)]
public static double OriginalFunction(double x, double y)
{
    return x + 2 * y;
}

성능 비교 결과입니다.

  1. Original - time: 9.9999 ms
  2. Reflection - time: 2681.1545 ms
  3. Delegate - time: 18.001 ms
  4. Lambda - time: 14.0016 ms

그래도 Original 메서드가 Delegate에 비해 2배 이상 빠릅니다. 바로 이것이 ^^ "당연한 결과"입니다.




참고로 여기서 한 단계 더 나아가 JIT 컴파일로 인한 성능 간섭 문제를 없애기 위해 전체 메서드를 미리 한번씩 호출하는 작업을 해야 합니다. 이럴 경우 람다 호출에 대한 성능이 미약하나마 쪼끔 더 올라갑니다.

  1. Original - time: 9.0101 ms
  2. Reflection - time: 2647.1532 ms
  3. Delegate - time: 19.0008 ms
  4. Lambda - time: 12.0016 ms

어쨌든 변하지 않는 것은 원본 메서드의 성능이 가장 좋다는 것입니다.

(첨부 파일에는 제가 테스트한 환경의 코드가 담겨 있습니다.)




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 7/5/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2014-02-19 02시31분
[dsun] 역시 오리지날 입니다. ㅎㅎ
[guest]

1  2  3  4  5  [6]  7  8  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
13793정성태10/28/20245163C/C++: 183. C++ - 윈도우에서 한글(및 유니코드)을 포함한 콘솔 프로그램을 컴파일 및 실행하는 방법
13792정성태10/27/20244648Linux: 99. Linux - 프로세스의 실행 파일 경로 확인
13791정성태10/27/20244916Windows: 267. Win32 API의 A(ANSI) 버전은 DBCS를 사용할까요?파일 다운로드1
13790정성태10/27/20244632Linux: 98. Ubuntu 22.04 - 리눅스 커널 빌드 및 업그레이드
13789정성태10/27/20244944Linux: 97. menuconfig에 CONFIG_DEBUG_INFO_BTF, CONFIG_DEBUG_INFO_BTF_MODULES 옵션이 없는 경우
13788정성태10/26/20244470Linux: 96. eBPF (bpf2go) - fentry, fexit를 이용한 트레이스
13787정성태10/26/20244997개발 환경 구성: 730. github - Linux 커널 repo를 윈도우 환경에서 git clone하는 방법 [1]
13786정성태10/26/20245241Windows: 266. Windows - 대소문자 구분이 가능한 파일 시스템
13785정성태10/23/20244998C/C++: 182. 윈도우가 운영하는 2개의 Code Page파일 다운로드1
13784정성태10/23/20245264Linux: 95. eBPF - kprobe를 이용한 트레이스
13783정성태10/23/20244875Linux: 94. eBPF - vmlinux.h 헤더 포함하는 방법 (bpf2go에서 사용)
13782정성태10/23/20244638Linux: 93. Ubuntu 22.04 - 커널 이미지로부터 커널 함수 역어셈블
13781정성태10/22/20244819오류 유형: 930. WSL + eBPF: modprobe: FATAL: Module kheaders not found in directory
13780정성태10/22/20245568Linux: 92. WSL 2 - 커널 이미지로부터 커널 함수 역어셈블
13779정성태10/22/20244876개발 환경 구성: 729. WSL 2 - Mariner VM 커널 이미지 업데이트 방법
13778정성태10/21/20245702C/C++: 181. C/C++ - 소스코드 파일의 인코딩, 바이너리 모듈 상태의 인코딩
13777정성태10/20/20244960Windows: 265. Win32 API의 W(유니코드) 버전은 UCS-2일까요? UTF-16 인코딩일까요?
13776정성태10/19/20245299C/C++: 180. C++ - 고수준 FILE I/O 함수에서의 Unicode stream 모드(_O_WTEXT, _O_U16TEXT, _O_U8TEXT)파일 다운로드1
13775정성태10/19/20245509개발 환경 구성: 728. 윈도우 환경의 개발자를 위한 UTF-8 환경 설정
13774정성태10/18/20245203Linux: 91. Container 환경에서 출력하는 eBPF bpf_get_current_pid_tgid의 pid가 존재하지 않는 이유
13773정성태10/18/20244892Linux: 90. pid 네임스페이스 구성으로 본 WSL 2 + docker-desktop
13772정성태10/17/20245179Linux: 89. pid 네임스페이스 구성으로 본 WSL 2 배포본의 계층 관계
13771정성태10/17/20245081Linux: 88. WSL 2 리눅스 배포본 내에서의 pid 네임스페이스 구성
13770정성태10/17/20245358Linux: 87. ps + grep 조합에서 grep 명령어를 사용한 프로세스를 출력에서 제거하는 방법
13769정성태10/15/20246129Linux: 86. Golang + bpf2go를 사용한 eBPF 기본 예제파일 다운로드1
13768정성태10/15/20245415C/C++: 179. C++ - _O_WTEXT, _O_U16TEXT, _O_U8TEXT의 Unicode stream 모드파일 다운로드2
1  2  3  4  5  [6]  7  8  9  10  11  12  13  14  15  ...