C# - Task와 비교해 본 ValueTask 사용법
ValueTask에 대한 질문이 있었는데요,
ValueTask 질문입니다.
; https://www.sysnet.pe.kr/3/0/5698
그러고 보니, 제가 ValueTask를 직접적으로 다룬 적은 없고 단지
Task 이외의 타입을 사용자가 제공할 수 있다는 글을 쓰면서 잠깐 소개한 것만 있습니다.
C# - await을 Task 타입이 아닌 사용자 정의 타입에 적용하는 방법
; https://www.sysnet.pe.kr/2/0/11456
C# - async를 Task 타입이 아닌 사용자 정의 타입에 적용하는 방법
; https://www.sysnet.pe.kr/2/0/11484
C# 10 - (9) 비동기 메서드가 사용할 AsyncMethodBuilder 선택 가능
; https://www.sysnet.pe.kr/2/0/12807
이참에 ^^ 한번 썰을 풀어봐야겠군요.
자, 그럼 간단한 예제를 위해 (가우스의 이야기는 잠시 잊고) 합 계산을 수행하는 비동기 메서드를 다음과 같이 만들어 보겠습니다.
class Program
{
static async Task<int> Main(string[] args)
{
long result = await CalcAsync(100);
Console.WriteLine(result);
return 0;
}
static Task<long> CalcAsync(int n)
{
return Task.Run<long>(() =>
{
long sum = 0;
for (int i = 1; i <= n; i++)
{
sum += i;
}
return sum;
});
}
}
아주 전형적인 비동기 코드입니다. 그런데 이 메서드를 좀 더 빠르게 개선하는 방법으로 cache를 도입했다고 가정해보겠습니다. 가령 n을 지정한 값이 이전에도 한 번 계산한 적이 있다면 기존 값을 곧바로 반환하는 것입니다. 대충 이런 식으로 구현할 수 있을 것입니다.
class Program
{
static async Task<int> Main(string[] args)
{
long result = await Sum.CalcAsync(100);
Console.WriteLine(result);
result = await Sum.CalcAsync(100);
Console.WriteLine(result);
return 0;
}
}
public class Sum
{
static Dictionary<int, long> _cache = new Dictionary<int, long>();
public static Task<long> CalcAsync(int n)
{
if (_cache.ContainsKey(n) == true)
{
return Task.FromResult(_cache[n]);
}
return Task.Run<long>(() =>
{
long sum = 0;
for (int i = 1; i <= n; i++)
{
sum += i;
}
_cache[n] = sum;
return sum;
});
}
}
보는 바와 같이 cache된 결괏값을 반환하는 경우에도 CalcAsync의 반환 타입이 Task<long>이므로 (빈 Task 인스턴스를 생성하는) Task.FromResult를 이용해 Task 타입을 반환해야 합니다.
여기서 문제는, Task가 바로 참조 타입이라는 점입니다. cache를 구현하기 전의 CalcAsync 메서드라면 비동기 동작을 수행하므로 Task 인스턴스를 반환하는 것이 당연할 수 있지만, 비동기 동작 없이 곧바로 동기 반환을 할 수 있는 경우에도 Task.FromResult를 이용해 굳이 Task를 생성한 다음 반환하는 것은 GC Heap에 필요 없는 할당이 발생하게 되는 것입니다.
바로 이럴 때,
값 형식의 ValueTask를 사용하면 위의 문제를 수정할 수 있습니다.
public static ValueTask<long> CalcValueAsync(int n)
{
if (_cache.ContainsKey(n) == true)
{
return new ValueTask<long>(_cache[n]); // 값 형식이므로 여기서 return하면 GC Heap에 아무런 개체도 할당이 되지 않음.
}
Task<long> task = Task.Run<long>(() =>
{
long sum = 0;
for (int i = 1; i <= n; i++)
{
sum += i;
}
_cache[n] = sum;
return sum;
});
return new ValueTask<long>(task); // 기존에는 Task를 반환했지만 반환 타입이 ValueTask로 변경됐으므로 그걸로 래핑해서 반환
}
보는 바와 같이 2가지 변화가 있습니다. 1) 결과를 곧바로 반환, 즉 동기적으로 동작할 때는 GC Heap을 사용하지 않으므로 성능이 개선되는 반면, 2) 비동기 동작을 수행할 때는 기존엔 Task만 반환하면 됐지만, 이제는 ValueTask로 감싸서 반환해야 하는 추가 overhead가 있습니다. 즉, 비동기 동작인 경우 여전히 Task 개체가 생성된다는 사실에는 변함이 없습니다.
그러니까, ValueTask를 사용하는 것은 장점과 단점 모두 가지고 있는 것입니다. 이외에도 또 다른 단점들이 있습니다. 아래의 글들을 보면 이에 대한 설명을 하는데요,
How to use ValueTask in C#
; https://www.infoworld.com/article/3565433/how-to-use-valuetask-in-csharp.html
Task.WhenAll이나
Task.WhenAny와 같은 메서드는 인자 타입으로 Task를 요구하므로 ValueTask를 반환받은 경우에는
AsTask를 호출해 (엄밀히는 ValueTaskSourceAsTask) Task 타입으로 변경해야 하는 부가 코드를 수반하게 되는 것입니다.
실제로 await으로 실행하는 코드 자체는 아래의 글에 의하면,
Should every new asynchronous API return ValueTask / ValueTask?
; https://devblogs.microsoft.com/dotnet/understanding-the-whys-whats-and-whens-of-valuetask/#should-every-new-asynchronous-api-return-valuetask-valuetasktresult
... e.g. in microbenchmarks it’s a bit faster to await a Task<TResult> than it is to await a ValueTask<TResult>...
오히려 ValueTask보다 Task 쪽이 미세하게 빠릅니다. 왜냐하면 ValueTask는 값 형식으로 인해 스택에 값을 복사해야 하는데, ValueTask 자체의 필드가 3개가 있으므로 단순히 Task가 IntPtr.Size 만큼의 복사만 발생하는 것과 비교하면 부하가 더 있을 수밖에 없습니다. (물론, Task 쪽이 결국 GC Heap 할당으로 인해 나중에 GC 부하가 생기지만.)
정리해 보면, 결국 비동기로 항상 수행되는 메서드라면 ValueTask로 바꿔서 득이 되는 경우는 없고, 심지어 해당 메서드가 동기/비동기로 반환되는 비율에 따라서도 주의 깊게 선택해야 할 필요가 있는 것입니다.
이제 조금은 설명이 되었을까요? ^^ (다음 글에서는 위의 정리를 바탕으로 ValueTask와 Task의 성능 측정을 해보면서 좀 더 깊게 알아보겠습니다.)
(
첨부 파일은 이 글의 예제 코드를 포함합니다.)
[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]