Microsoft MVP성태의 닷넷 이야기
개발 환경 구성: 383. BenchmarkDotNet 사용 시 주의 사항 [링크 복사], [링크+제목 복사]
조회: 7158
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 

BenchmarkDotNet 사용 시 주의 사항

BenchmarkDotNet으로,

BenchmarkDotNet 라이브러리 소개
; https://www.sysnet.pe.kr/2/0/11547

struct 타입을 좀 더 테스트해봤습니다.

C# 7.2의 특징 - GC 및 메모리 복사 방지를 위한 struct 타입 개선
; https://www.sysnet.pe.kr/2/0/11546

성능 비교를 위해 다음의 타입들을 생성하고,

ClassVector                 : class로 구현
StructVector                : struct로 구현
InStructVector              : StructVector이고, op_Addition 메서드의 인자를 in 처리
ReadonlyInStructVector      : InStructVector이고, readonly struct로 정의
ReadonlyInlineStructVector  : ReadonlyInStructVector이고, op_Addition에 AggressiveInlining 특성 부여

각각의 타입에 대해 op_Addition을 테스트하는 코드만을 Benchmark에 추가했습니다.

public class VectorBenchmark
{
    [Benchmark]
    public void ClassVectorTest()
    {
        var player = new ClassVector(10.0, 20.0, 30.0);
        var speed = new ClassVector(10.0, 20.0, 30.0);
        var result = player + speed;
    }

    [Benchmark]
    public void StructVectorTest()
    {
        var player = new StructVector(10.0, 20.0, 30.0);
        var speed = new StructVector(10.0, 20.0, 30.0);
        var result = player + speed;
    }

    [Benchmark]
    public void InStructVectorTest()
    {
        var player = new InStructVector(10.0, 20.0, 30.0);
        var speed = new InStructVector(10.0, 20.0, 30.0);
        var result = player + speed;
    }

    [Benchmark]
    public void ReadonlyInStructVectorTest()
    {
        var player = new ReadonlyInStructVector(10.0, 20.0, 30.0);
        var speed = new ReadonlyInStructVector(10.0, 20.0, 30.0);
        var result = player + speed;
    }

    [Benchmark]
    public void ReadonlyInlineStructVectorTest()
    {
        var player = new ReadonlyInlineStructVector(10.0, 20.0, 30.0);
        var speed = new ReadonlyInlineStructVector(10.0, 20.0, 30.0);
        var result = player + speed;
    }
}

결과는 이렇습니다.

// * Summary *

BenchmarkDotNet=v0.10.14, OS=Windows 10.0.17134
Intel Core i5-4670 CPU 3.40GHz (Haswell), 1 CPU, 4 logical and 4 physical cores
  [Host]     : .NET Framework 4.7.1 (CLR 4.0.30319.42000), 64bit RyuJIT-v4.7.3101.0
  DefaultJob : .NET Framework 4.7.1 (CLR 4.0.30319.42000), 64bit RyuJIT-v4.7.3101.0


                             Method |       Mean |     Error |    StdDev |
----------------------------------- |-----------:|----------:|----------:|
                    ClassVectorTest | 13.7698 ns | 0.1722 ns | 0.1611 ns |
                   StructVectorTest |  2.5874 ns | 0.0320 ns | 0.0299 ns |
                 InStructVectorTest | 10.5442 ns | 0.0892 ns | 0.0834 ns |
         ReadonlyInStructVectorTest | 10.2489 ns | 0.0843 ns | 0.0788 ns |
     ReadonlyInlineStructVectorTest |  0.5599 ns | 0.0106 ns | 0.0099 ns |

메서드가 inline 처리된 StructVectorTest, ReadonlyInlineStructVectorTest의 성능이 우세한 것은 당연해 보이고, 또한 그 둘 중에서도 복사가 발생하지 않는 ReadonlyInlineStructVectorTest의 성능이 좀 더 높게 나옵니다.

이 상태에서 테스트 코드마다 GetHashCode 호출을 추가했더니,

public void ...VectorTest()
{
    var player = new ...Vector(10.0, 20.0, 30.0);
    var speed = new ...Vector(10.0, 20.0, 30.0);
    var result = player + speed;

    result.GetHashCode();
}

단지 하나의 코드를 추가했을 뿐인데 이제 결과가 완전히 달라집니다.

                             Method |       Mean |     Error |    StdDev |
----------------------------------- |-----------:|----------:|----------:|
                    ClassVectorTest | 34.8412 ns | 0.2300 ns | 0.2151 ns |
                   StructVectorTest | 47.8031 ns | 0.3171 ns | 0.2966 ns |
                 InStructVectorTest | 53.4127 ns | 1.2505 ns | 1.4401 ns |
         ReadonlyInStructVectorTest | 52.1917 ns | 0.3648 ns | 0.3412 ns |
     ReadonlyInlineStructVectorTest | 39.5150 ns | 0.2622 ns | 0.2452 ns |

확인은 해보지 않았지만, GetHashCode 시 값 형식에서 object.GetHashCode 호출로 인한 내부 박싱이 발생해 힙을 사용하도록 변경된 것이 아닌가 예상됩니다. 일단 그건 그렇다 치고, 문제는 모든 Vector 코드에 GetHashCode를 다음과 같이 직접 구현했을 때 발생합니다.

public override int GetHashCode()
{
    return (int)(_x + _y + _z);
}

그럼, 각각의 결과물들이 다음과 같이 바뀝니다.

// GetHashCode() 추가
                             Method |       Mean |     Error |    StdDev |
----------------------------------- |-----------:|----------:|----------:|
                    ClassVectorTest | 15.7360 ns | 0.1863 ns | 0.1651 ns |
                   StructVectorTest | 10.0317 ns | 0.0746 ns | 0.0623 ns |
                 InStructVectorTest | 12.0021 ns | 0.0687 ns | 0.0643 ns |
         ReadonlyInStructVectorTest | 11.8757 ns | 0.1092 ns | 0.1022 ns |
     ReadonlyInlineStructVectorTest |  0.0000 ns | 0.0000 ns | 0.0000 ns |

ReadonlyInlineStructVectorTest의 결과가 놀라운데요, 어떻게 저럴 수 있을까요? 저 때의 JIT 코드를 windbg로 살펴보면 다음과 같이 나옵니다.

0:000> !DumpMD /d 00007ffa11f47790
Method Name:  ConsoleApp1.VectorBenchmark.ReadonlyInlineStructVectorTest()
Class:        00007ffa11f54858
MethodTable:  00007ffa11f477a8
mdToken:      0000000006000007
Module:       00007ffa11f470d0
IsJitted:     yes
CodeAddr:     00007ffa11ea6450
Transparency: Critical

0:000> !U /d 00007ffa11ea6450
Normal JIT generated code
ConsoleApp1.VectorBenchmark.ReadonlyInlineStructVectorTest()
Begin 00007ffa11ea6450, size 1
>>> 00007ffa`11ea6450 c3              ret

보는 바와 같이 정상적인 테스트 코드를 생성하지 못하고 ret만 포함하는 메서드로 테스트하고 있는 것입니다. 따라서 BenchmarkDotNet으로 성능 측정을 할 때는 그 자체의 버그나 Release 모드에서의 최적화에 따른 의도치 않은 코드 삭제를 주의해야 합니다.

게다가 전통적인 Stopwatch를 이용할 때는 Visual Studio 내에서 disassembly 코드를 보며 곧바로 확인할 수 있는 여지가 있는데, BenchmarkDotNet으로 하게 되면 ConsoleApp1.exe의 자식 프로세스로 임시 exe 프로세스를 생성시켜 성능 측정을 하기 때문에 그런 부분을 파헤치기가 불편한 점도 있습니다.




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 6/14/2018]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




[1]  2  3  4  5  6  7  8  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
13238정성태1/31/202327.NET Framework: 2092. IIS 웹 사이트를 TLS 1.2 또는 TLS 1.3 프로토콜로만 운영하는 방법
13237정성태1/30/2023102.NET Framework: 2091. C# - 웹 사이트가 어떤 버전의 TLS/SSL을 지원하는지 확인하는 방법
13236정성태1/29/2023107개발 환경 구성: 663. openssl을 이용해 인트라넷 IIS 사이트의 SSL 인증서 생성
13235정성태1/29/202389개발 환경 구성: 662. openssl - 윈도우 환경의 명령행에서 SAN 적용하는 방법
13234정성태1/28/2023101개발 환경 구성: 661. dnSpy를 이용해 소스 코드가 없는 .NET 어셈블리의 코드를 변경하는 방법
13233정성태1/28/202388오류 유형: 840. C# - WebClient로 https 호출 시 "The request was aborted: Could not create SSL/TLS secure channel" 예외 발생
13232정성태1/27/202378스크립트: 43. uwsgi의 --processes와 --threads 옵션
13231정성태1/27/202380오류 유형: 839. python - TypeError: '...' object is not callable
13230정성태1/26/2023115개발 환경 구성: 660. WSL 2 내부로부터 호스트 측의 네트워크로 UDP 데이터가 1개의 패킷으로만 제한되는 문제
13229정성태1/25/2023167.NET Framework: 2090. C# - UDP Datagram의 최대 크기
13228정성태1/24/2023158.NET Framework: 2089. C# - WMI 논리 디스크가 속한 물리 디스크의 정보를 얻는 방법 [2]파일 다운로드1
13227정성태1/23/2023120개발 환경 구성: 659. Windows - IP MTU 값을 바꿀 수 있을까요?
13226정성태1/23/2023115.NET Framework: 2088. .NET 5부터 지원하는 GetRawSocketOption 사용 시 주의할 점
13225정성태1/21/2023144개발 환경 구성: 658. Windows에서 실행 중인 소켓 서버를 다른 PC 또는 WSL에서 접속할 수 없는 경우
13224정성태1/21/2023160Windows: 221. Windows - Private/Public/Domain이 아닌 네트워크 어댑터 단위로 방화벽을 on/off하는 방법
13223정성태1/20/2023121오류 유형: 838. RDP 연결 오류 - The two computers couldn't connect in the amount of time allotted
13222정성태1/20/2023114개발 환경 구성: 657. WSL - DockerDesktop.vhdx 파일 위치를 옮기는 방법
13221정성태1/19/2023162Linux: 57. C# - 리눅스 프로세스 메모리 정보파일 다운로드1
13220정성태1/19/2023117오류 유형: 837. NETSDK1045 The current .NET SDK does not support targeting .NET ...
13219정성태1/18/2023195Windows: 220. 네트워크의 인터넷 접속 가능 여부에 대한 판단 기준
13218정성태1/17/2023179VS.NET IDE: 178. Visual Studio 17.5 (Preview 2) - 포트 터널링을 이용한 웹 응용 프로그램의 외부 접근 허용
13217정성태1/13/2023212디버깅 기술: 185. windbg - 64비트 운영체제에서 작업 관리자로 뜬 32비트 프로세스의 덤프를 sos로 디버깅하는 방법
13216정성태1/12/2023161디버깅 기술: 184. windbg - 32비트 프로세스의 메모리 덤프인 경우 !peb 명령어로 나타나지 않는 환경 변수
13215정성태1/11/2023156Linux: 56. 리눅스 - /proc/pid/stat 정보를 이용해 프로세스의 CPU 사용량 구하는 방법
13214정성태1/10/2023274.NET Framework: 2087. .NET 6부터 SourceGenerator와 통합된 System.Text.Json [1]파일 다운로드1
[1]  2  3  4  5  6  7  8  9  10  11  12  13  14  15  ...