C# - ParallelEnumerable을 이용한 IEnumerable에 대한 병렬 처리
그러고 보니, 한 번도 이에 대해 정리한 적이 없군요. 마침 관련 질문도 있었으니 소개를 해보겠습니다. ^^
간단하게 말해서 ParallelEnumerable은, 기존 Enumerable의 병렬 버전이라고 보시면 됩니다. 2개 모두 네임스페이스가 System.Linq로 동일한데요, 예를 들어, Enumerable.Range의 간단한 사용 예를 (억지로 만들어) 보면,
namespace ConsoleApp1;
internal class Program
{
static void Main(string[] args)
{
Enumerable.Range(1, 10).All(Program.WriteLine);
}
static bool WriteLine<T>(T text)
{
Console.WriteLine($"[{Thread.CurrentThread.ManagedThreadId}] {text}");
return true;
}
}
/* 실행 결과
[1] 1
[1] 2
[1] 3
[1] 4
[1] 5
[1] 6
[1] 7
[1] 8
[1] 9
[1] 10
*/
WriteLine의 실행이 1번 스레드에서 구동되는 반면, 이것을 ParallelEnumerable로 바꾸면,
ParallelEnumerable.Range(1, 10).All(Program.WriteLine);
/*
[10] 3
[12] 5
[15] 8
[11] 4
[13] 6
[4] 1
[17] 10
[16] 9
[7] 2
[14] 7
*/
Range로 생성된 요소들이 현재 시스템의 CPU/Core 수의 상황에 맞게 분산 처리되는 것을 확인할 수 있습니다. 간단하죠. ^^
익히 아시는 것처럼,
Enumerable 정적 타입은
IEnumerable에 대해 확장 메서드를 제공합니다. 그렇다면 동일하게 IEnumerable에 대해 병렬 처리를 수행하는 확장 메서드를 제공하는 것은 어땠을까요? 그렇게 하기에는 이름이 다소 겹친다는 문제점이 있습니다. 위의 예제만 해도 동일한 Range 이름을 쓰고 있는데요, 물론 Enumerable.Range와 Enumerable.ParallelRange라는 식으로 앞에 "Parallel" 등의 접미사를 붙이는 것도 가능했겠지만 너무 잡다해지는 면이 없지 않아 있습니다.
또한, 약간의 병렬 처리에 대한 설정도 있어야 하기 때문에
ParallelEnumerable은 기존의 IEnumerable이 아닌, 별도로 정의한
ParallelQuery에 대해 확장 메서드를 제공하고 있습니다.
재미있게도, 기존의 IEnumerable 타입에 대해 병렬 처리를 자연스럽게 제공하기 위해
AsParallel 확장 메서드가 제공되는데요, 따라서 다음과 같이 간단하게 병렬 처리로의 변환이 가능합니다.
Enumerable.Range(1, 10).AsParallel().All(Program.WriteLine);
// 또는 아래와 같이 명시적으로 ParallelEnumerable을 사용
ParallelEnumerable.Range(1, 10).All(Program.WriteLine);
AsParallel이 하는 유일한 일은, 현재의 IEnumerable 인스턴스에 대해 ParallelEnumerable의 확장 메서드를 사용할 수 있도록 ParallelQuery 타입을 반환하는 것뿐입니다. (실제로 ParallelQuery로부터 상속한 ParallelEnumerableWrapper 인스턴스를 반환합니다.)
기타, ParallelEnumerable 확장 메서드로 제공하는 모든 메서드는 대부분 Enumerable의 확장 메서드와 이름은 같지만 내부적으로 병렬 처리를 대행하는 코드를 호출하는 식입니다. (이러한 코드들은 System.Linq.Parallel 이하에 internal 타입으로 복잡하게 숨겨져 있습니다.)
ParallelEnumerable은 병렬 처리에 대한 일부 제어 옵션을 설정할 수 있는 확장 메서드도 함께 제공합니다.
var penum = Enumerable.Range(1, 10).AsParallel()
.WithDegreeOfParallelism(2)
.WithExecutionMode(ParallelExecutionMode.Default)
.WithMergeOptions(ParallelMergeOptions.Default)
.All(Program.WriteLine);
이 정도면 대충 감이 오시죠? ^^
[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]