C# - 박싱과 언박싱
일반적으로 박싱을 값 형식의 인스턴스를 참조 형식의 인스턴스로 변환하는 것이고, 그 반대를 언박싱이라 설명합니다. 그런데 "CLR via C#" 책을 보면 언박싱에 대해 좀 더 엄밀하게 다음과 같이 설명하고 있습니다.
Chapter 5: 130page
Unboxing is not the exact opposite of boxing. The unboxing operation is much less costly than boxing. Unboxing is really just the operation of obtaining a pointer to the raw value type (data fields) contained within an object. In effect, the pointer refers to the unboxed portion in the boxed instance. So, unlike boxing, unboxing doesn’t involve the copying of any bytes in memory. Having made this important clarification, it is important to note that an unboxing operation is typically followed by copying the fields.
설명과는 달리, C# 코드만 보면 언박싱은 정확히 박싱의 반대 과정이나 다름없습니다.
public struct MyStruct
{
public int n1;
public int n2;
}
class Program
{
static void Main(string[] args)
{
MyStruct ms = new MyStruct();
// 박싱
object obj = ms;
// 언박싱
MyStruct t1 = (MyStruct)obj;
}
}
하지만 이것을 IL 코드로 살펴보면 C#의 언박싱 코드가 실은 2개의 명령어로 나뉜 것을 확인할 수 있습니다.
.method private hidebysig static void Main(string[] args) cil managed
{
.entrypoint
.maxstack 1
.locals init (
[0] valuetype MyStruct struct2,
[1] object obj2,
[2] valuetype MyStruct struct3)
L_0000: nop
L_0001: ldloca.s struct2
L_0003: initobj MyStruct
L_0009: ldloc.0
L_000a: box MyStruct // 박싱
L_000f: stloc.1
L_0010: ldloc.1
L_0011: unbox.any MyStruct // 언박싱
L_0016: stloc.2 // 값 복사는 로컬 변수에 값을 대입하는 과정에서 발생
L_0017: ret
}
이에 대해서는 unbox 명령어에서도 잘 설명하고 있습니다.
OpCodes.Unbox Field
; https://learn.microsoft.com/en-us/dotnet/api/system.reflection.emit.opcodes.unbox?view=netframework-4.8
The unbox instruction converts the object reference (type O), the boxed representation of a value type, to a value type pointer (a managed pointer, type &), its unboxed form. The supplied value type (valType) is a metadata token indicating the type of value type contained within the boxed object.
Unlike Box, which is required to make a copy of a value type for use in the object, unbox is not required to copy the value type from the object. Typically it simply computes the address of the value type that is already present inside of the boxed object.
즉 unbox 연산자는 관리 힙에 있는 개체를 가리키는 "관리 포인터"를 구하는 작업만을 담당하며, 그렇게 구한 관리 포인터로부터 스택에 값을 복사하는 과정은 "stloc" 명령어에 의해 수행되는 것입니다. C# 코드로 이 과정을 재현해서 정리해 보면 다음과 같습니다.
public struct MyStruct
{
public int n1;
public int n2;
}
public class MyClass
{
public MyStruct st;
}
class Program
{
static void Main(string[] args)
{
MyStruct ms = new MyStruct();
// box 연산자는 아래의 2과정을 수행
MyClass mc = new MyClass(); // 컴파일을 위해 MyClass 타입을 만든 것일 뿐!
mc.st = ms; // 중요한 것은, 관리 힙에 객체가 들어가는 것으로 이해하면 됩니다.
// unbox 연산자는 관리 포인터만 얻어오고,
ref MyStruct t = ref mc.st;
// unbox 이후의 stloc에 의해 스택에 위치한 로컬 변수로 값 복사가 발생
MyStruct temp = t;
}
}
따라서 박싱 연산은 관리 힙 할당과 값 복사라는 부하가 있지만 언박싱 연산은 타입 정보로부터 관리 포인터만을 얻는 것이므로 부하가 거의 없습니다. 단지, 당연하게 따라오는 로컬 변수로의 대입으로 인해 값 복사 부하가 어쩔 수 없이 발생한다는 사실에는 변함이 없습니다.
[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]