Microsoft MVP성태의 닷넷 이야기
.NET Framework: 2040. C# - ValueTask와 Task의 성능 비교 [링크 복사], [링크+제목 복사]
조회: 7321
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
(연관된 글이 1개 있습니다.)

C# - ValueTask와 Task의 성능 비교

지난 글에서,

 C# - Task와 비교해 본 ValueTask 사용법
; https://www.sysnet.pe.kr/2/0/13114

ValueTask를 알아봤는데요, 그렇다면 실제 성능은 어떨까요? 비교를 위해 각각 다음과 같은 Task/ValueTask 메서드를 만들어 두고,

static ValueTask<int> TestValueTask(int value)
{
    return new ValueTask<int>(value);
}

static Task<int> TestTask(int value)
{
    return Task.FromResult(value);
}

JIT 컴파일 시간을 고려해 (.NET Framework 4.8 환경에서) 성능 테스트를 해보면,

// .NET Framework 4.8 + Release 빌드
// Install-Package System.Threading.Tasks.Extensions
class Program
{
    static async Task<int> Main(string[] args)
    {
        Func<int, string, Func<int, int, Task>, int, Task> action = async (loopCount, title, work, delay) =>
        {
            Stopwatch st = new Stopwatch();
            st.Start();

            await work(loopCount, delay);

            st.Stop();

            Console.WriteLine(title + " : " + st.ElapsedMilliseconds);
        };

        await action(1, "ValueAsync for JIT", ValueAsync, 0);
        await action(1, "RefAsync for JIT", RefAsync, 0);

        Console.WriteLine();

        WriteCollectionCount();
        await action(1_000_000, "ValueAsync", ValueAsync, 0);
        WriteCollectionCount();
        await action(1_000_000, "RefAsync", RefAsync, 0);
        WriteCollectionCount();

        return 0;
    }

    static void WriteCollectionCount()
    {
        int gen0 = GC.CollectionCount(0);
        int gen1 = GC.CollectionCount(1);
        int gen2 = GC.CollectionCount(2);

        Console.WriteLine($"{gen0 + gen1 + gen2}, ({gen0}), ({gen1}), ({gen2})");
    }

    private static async Task ValueAsync(int loopCount, int value)
    {
        for (int i = 0; i < loopCount; i++)
        {
            await TestValueTask(value);
        }
    }

    private static async Task RefAsync(int loopCount, int value)
    {
        for (int i = 0; i < loopCount; i++)
        {
            await TestTask(value);
        }
    }

    // ...생략... - TestValueTask, TestTask
}

각각 이런 결과를 얻을 수 있습니다.

ValueAsync : 12
0, (0), (0), (0) // GC Count 모두 0, GC 수행을 하지 않았음을 의미
RefAsync : 4
8, (8), (0), (0) // 0 세대 GC Count만 8

보면, 오히려 ValueTask를 사용한 것보다 GC 오버헤드를 동반했음에도 불구하고 Task로 구현한 경우가 더 빠릅니다. (결과에 실망하신 분들은 조금만 더 읽어보시길 바랍니다. ^^)




제가 위에서, 예제 코드의 수행 환경을 .NET Framework 4.8이라고 명시했는데요, 왜냐하면 .NET Core의 경우에는 Task.FromResult의 구현이 다르기 때문입니다.

일례로 위의 코드를 .NET 6 환경에서 수행하면 다음과 같은 결과를 볼 수 있습니다.

// .NET 6 + Release 빌드

ValueAsync : 5
0, (0), (0), (0)
RefAsync : 1
0, (0), (0), (0) // .NET 6의 경우, 0을 전달한 Task.FromResult는 GC Heap을 사용하지 않음.

Task.FromResult의 호출에서도 GC가 발생하지 않고 있는데요, 그 원인을 .NET Framework 구현 코드를 통해 확인할 수 있습니다.

// https://github.com/microsoft/referencesource/blob/master/mscorlib/system/threading/Tasks/Task.cs
public static Task<TResult> FromResult<TResult>(TResult result)
{
    return new Task<TResult>(result);
}

보는 바와 같이 우리가 익히 알고 있던 대로 new Task를 해 참조 개체를 생성하고 있습니다. 반면, .NET 6는 int의 경우 -1 ~ 8 범위 내에서는 TaskCache.s_int32Tasks를 통해 미리 생성해 둔 Task 인스턴스를 재사용하기 때문에,

[MethodImpl(MethodImplOptions.AggressiveInlining)]
public static Task<TResult> FromResult<[Nullable(2)] TResult>(TResult result)
{
    if (result == null)
    {
        return Task<TResult>.s_defaultResultTask;
    }
    if (typeof(TResult).IsValueType)
    {
        if (typeof(TResult) == typeof(bool))
        {
            Task<bool> value = ((bool)((object)result)) ? TaskCache.s_trueTask : TaskCache.s_falseTask;
            return Unsafe.As<Task<TResult>>(value);
        }
        if (typeof(TResult) == typeof(int))
        {
            int num = (int)((object)result);
            if (num - -1 < 10)
            {
                Task<int> value2 = TaskCache.s_int32Tasks[num - -1];
                return Unsafe.As<Task<TResult>>(value2);
            }
        }
        else if ((typeof(TResult) == typeof(uint) && ...[생략]... && (UIntPtr)0 == (UIntPtr)((object)result)))
        {
            return Task<TResult>.s_defaultResultTask;
        }
    }
    return new Task<TResult>(result);
}

(예제 코드처럼) 0을 Task.FromResult에 넘겨주는 경우라면 GC Heap 할당이 없습니다. 그 외에 bool 형식도 true와 false에 따라 각각 TaskCache.s_trueTask, TaskCache.s_falseTask를 재사용하는 것과, 기타 다른 값 형식의 경우 0 초기화 상태라면 s_defaultResultTask를 재사용하는 식으로 최적화를 하고 있는 것이 눈에 띕니다.

그나저나, 눈치채셨는지 모르겠지만 동일한 소스 코드를 .NET Framework에서 .NET 6로만 빌드했을 뿐인데 각각 12 -> 5, 4 -> 1로 속도가 빨라졌습니다. ValueTask가 12에서 5로 빨라진 것은 .NET 6에서 관련 코드가 최적화가 더 잘 돼 있기 때문입니다. 반면 Task가 4에서 1로 빨라진 것은 단순히 GC 수행이 없기 때문일 것입니다.

자, 그렇다면 .NET 6에서 Task.FromResult를 0이 아닌, GC Heap을 사용하도록 다른 값을 넣어보면 어떨까요?

private static async Task ValueAsync(int loopCount, int value)
{
    for (int i = 0; i < loopCount; i++)
    {
        await TestValueTask(i); // 이렇게 바꿔도 ValueTask의 경우 참조 개체가 생성되지는 않음
    }
}

private static async Task RefAsync(int loopCount, int value)
{
    for (int i = 0; i < loopCount; i++)
    {
        await TestTask(i); // Task.FromResult가 참조 개체를 생성하도록 변경
    }
}

이제는 결과가 다음과 같이 바뀝니다.

// .NET 6 + Release 빌드

ValueAsync : 5
0, (0), (0), (0)
RefAsync : 8
4, (4), (0), (0)

이제서야, ValueTask를 사용한 예제가 Task를 사용했던 것보다 더 빨라졌습니다. ^^ 한 가지 좀 의아한 점이라면, .NET Framework의 경우 Task를 사용한 동일한 코드가 GC 8번을 수반해도 4ms 내에 끝냈던 것과는 달리 .NET 6에서는 GC 4번에 오히려 8ms까지 늘어났습니다.

(첨부 파일은 이 글의 예제 코드를 포함합니다.)




마치기 전에 부가 설명을 추가해 볼까요? ^^ 아래의 글을 보면,

C# Language / C# 7.0 Features / ValueTask
; https://riptutorial.com/csharp/example/28612/valuetask-t-

Performance를 언급하면서 예로 든 코드가 Task.Delay입니다.

async Task<int> TestTask(int d)
{
    await Task.Delay(d);
    return 10;
}

async ValueTask<int> TestValueTask(int d)
{
    await Task.Delay(d);
    return 10;
}

글쓴이가 이에 대해 언급하긴 하지만 (which it is not in this case because of the Task.Delay,...) 비-영어권 개발자들의 경우 제목과 코드만 본다면 자칫 오해를 불러일으킬 여지가 있습니다. Task.Delay는 그것을 포함한 메서드가 Task를 반환하든, ValueTask를 반환하든 내부에서 Task 개체를 생성하기 때문에 예제의 설명과는 다르게 2가지 모두 "Requires heap allocation"에 해당합니다.

즉, Task.Delay는 언제나 비동기를 수반하기 때문에 ValueTask로는 적당하지 않은 전형적인 사례입니다.

여기서 Task.Delay가 재미있는 것은, 이것 역시 최적화된 코드를 포함하고 있다는 점입니다. 일례로, Delay 인자에 0을 전달하면 이것은 비동기를 타지 않고 Task.CompletedTask를 곧바로 반환합니다.

private static Task Delay(uint millisecondsDelay, CancellationToken cancellationToken)
{
    if (cancellationToken.IsCancellationRequested)
    {
        return Task.FromCanceled(cancellationToken);
    }
    if (millisecondsDelay == 0U)
    {
        return Task.CompletedTask;
    }
    if (!cancellationToken.CanBeCanceled)
    {
        return new Task.DelayPromise(millisecondsDelay);
    }
    return new Task.DelayPromiseWithCancellation(millisecondsDelay, cancellationToken);
}

즉, 기존의 Thread.Sleep(0)과는 아예 다른 동작을 하는 것입니다.

"C# Language / C# 7.0 Features / ValueTask" 글의 제목과는 다르게 BarAsync에 대한 코드에서 재미있는 점이 하나 있습니다.

class SynchronousFoo<T> : IFoo<T>
{
    public ValueTask<T> BarAsync()
    {
        var value = default(T);
        return new ValueTask<T>(value);
    }
}

class AsynchronousFoo<T> : IFoo<T>
{
    public async ValueTask<T> BarAsync()
    {
        var value = default(T);
        await Task.Delay(1);
        return value;
    }
}

비동기의 경우 동기 코드와 맞추기 위해 반환값을 ValueTask<T>로 설정했지만, 정작 내부에서 사용하는 Task.Delay가 (Task<T>가 아닌) Task를 반환하는 유형이라서 서로 어울리지 않게 되었습니다. 이것은 예제 코드를 억지로 만들다 보니 생긴 부작용에 불과합니다.

즉, 현실적인 상황이라면 Task.Delay를 호출하는 메서드를 ValueTask<T>가 아닌 ValueTask 반환으로 했을 것입니다.

static ValueTask TestTask(int d)
{
    return new ValueTask(Task.Delay(d));
}

하지만, 예제 코드처럼 Task ==> Task<T>, ValueTask ==> ValueTask<T>처럼 변환해야 하는 상황이 실제 업무에서도 발생할 수 있습니다.

How to convert a Task into a Task<T>?
; https://stackoverflow.com/questions/47322977/how-to-convert-a-task-into-a-taskt

그런 경우라면 해당 예제 코드에서 했던 것처럼 "async" 메서드를 만들고 await을 하는 식으로 우회하면 됩니다. 혹은, Task.Run을 사용해 내부 코드를 감싸는 것도 나쁘진 않습니다.

static ValueTask<int> TestTask(int d)
{
    var task = Task.Run<int>(async () =>
    {
        await Task.Delay(d);
        return 0;
    });

    return new ValueTask<int>(task);
}




지난번 글과 함께 이 정도면... 대충 ValueTask에 대한 이해는 전부 되셨겠죠?!!!! ^^




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 8/3/2022]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2022-08-22 08시45분
[은기] 항상 좋은 글 감사합니다.
[guest]

1  2  3  4  5  6  7  8  9  10  11  12  13  14  [15]  ...
NoWriterDateCnt.TitleFile(s)
13212정성태1/8/20234301기타: 85. 단정도/배정도 부동 소수점의 정밀도(Precision)에 따른 형변환 손실
13211정성태1/6/20234320웹: 42. (https가 아닌) http 다운로드를 막는 웹 브라우저
13210정성태1/5/20233518Windows: 219. 윈도우 x64의 경우 0x00000000`7ffe0000 아래의 주소는 왜 사용하지 않을까요?
13209정성태1/4/20233323Windows: 218. 왜 윈도우에서 가상 메모리 공간은 64KB 정렬이 된 걸까요?
13208정성태1/3/20233307.NET Framework: 2086. C# - Windows 운영체제의 2MB Large 페이지 크기 할당 방법파일 다운로드1
13207정성태12/26/20223662.NET Framework: 2085. C# - gpedit.msc의 "User Rights Assignment" 특권을 코드로 설정/해제하는 방법파일 다운로드1
13206정성태12/24/20223871.NET Framework: 2084. C# - GetTokenInformation으로 사용자 SID(Security identifiers) 구하는 방법 [3]파일 다운로드1
13205정성태12/24/20224289.NET Framework: 2083. C# - C++과의 연동을 위한 구조체의 fixed 배열 필드 사용 (2)파일 다운로드1
13204정성태12/22/20223571.NET Framework: 2082. C# - (LSA_UNICODE_STRING 예제로) CustomMarshaler 사용법파일 다운로드1
13203정성태12/22/20223614.NET Framework: 2081. C# Interop 예제 - (LSA_UNICODE_STRING 예제로) 구조체를 C++에 전달하는 방법파일 다운로드1
13202정성태12/21/20223972기타: 84. 직렬화로 설명하는 Little/Big Endian파일 다운로드1
13201정성태12/20/20224553오류 유형: 835. PyCharm 사용 시 C 드라이브 용량 부족
13200정성태12/19/20223471오류 유형: 834. 이벤트 로그 - SSL Certificate Settings created by an admin process for endpoint
13199정성태12/19/20223731개발 환경 구성: 656. Internal Network 유형의 스위치로 공유한 Hyper-V의 VM과 호스트가 통신이 안 되는 경우
13198정성태12/18/20223676.NET Framework: 2080. C# - Microsoft.XmlSerializer.Generator 처리 없이 XmlSerializer 생성자를 예외 없이 사용하고 싶다면?파일 다운로드1
13197정성태12/17/20223579.NET Framework: 2079. .NET Core/5+ 환경에서 XmlSerializer 사용 시 System.IO.FileNotFoundException 예외 발생하는 경우파일 다운로드1
13196정성태12/16/20223719.NET Framework: 2078. .NET Core/5+를 위한 SGen(Microsoft.XmlSerializer.Generator) 사용법
13195정성태12/15/20224318개발 환경 구성: 655. docker - bridge 네트워크 모드에서 컨테이너 간 통신 시 --link 옵션 권장 이유
13194정성태12/14/20224275오류 유형: 833. warning C4747: Calling managed 'DllMain': Managed code may not be run under loader lock파일 다운로드1
13193정성태12/14/20224364오류 유형: 832. error C7681: two-phase name lookup is not supported for C++/CLI or C++/CX; use /Zc:twoPhase-
13192정성태12/13/20224325Linux: 55. 리눅스 - bash shell에서 실수 연산
13191정성태12/11/20225243.NET Framework: 2077. C# - 직접 만들어 보는 SynchronizationContext파일 다운로드1
13190정성태12/9/20225659.NET Framework: 2076. C# - SynchronizationContext 기본 사용법파일 다운로드1
13189정성태12/9/20225839오류 유형: 831. Visual Studio - Windows Forms 디자이너의 도구 상자에 컨트롤이 보이지 않는 문제
13188정성태12/9/20225136.NET Framework: 2075. C# - 직접 만들어 보는 TaskScheduler 실습 (SingleThreadTaskScheduler)파일 다운로드1
13187정성태12/8/20225011개발 환경 구성: 654. openssl - CA로부터 인증받은 새로운 인증서를 생성하는 방법 (2)
1  2  3  4  5  6  7  8  9  10  11  12  13  14  [15]  ...