Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 
(연관된 글이 1개 있습니다.)
(시리즈 글이 9개 있습니다.)
.NET Framework: 491. 닷넷 Generic 타입의 메타 데이터 토큰 값 알아내는 방법
; https://www.sysnet.pe.kr/2/0/1848

.NET Framework: 494. 값(struct) 형식의 제네릭(Generic) 타입이 박싱되는 경우의 메타데이터 토큰 값
; https://www.sysnet.pe.kr/2/0/1857

.NET Framework: 495. CorElementType의 요소 값 설명
; https://www.sysnet.pe.kr/2/0/1860

.NET Framework: 509. ELEMENT_TYPE_MODIFIER의 조합
; https://www.sysnet.pe.kr/2/0/2894

.NET Framework: 510. 제네릭(Generic) 인자에 대한 메타데이터 등록 확인
; https://www.sysnet.pe.kr/2/0/2907

.NET Framework: 844. C# - 박싱과 언박싱
; https://www.sysnet.pe.kr/2/0/11943

.NET Framework: 955.  .NET 메서드의 Signature 바이트 코드 분석
; https://www.sysnet.pe.kr/2/0/12379

.NET Framework: 1130. C# - ELEMENT_TYPE_INTERNAL 유형의 사용 예
; https://www.sysnet.pe.kr/2/0/12903

.NET Framework: 1174. C# - ELEMENT_TYPE_FNPTR 유형의 사용 예
; https://www.sysnet.pe.kr/2/0/12998




닷넷 Generic 타입의 메타 데이터 토큰 값 알아내는 방법

IL 코드로 프로그램을 하는 경우, 한 가지 문제가 있다면 Generic 타입으로 정의된 변수의 box 연산입니다. 이렇게 말하면 잘 이해가 안되므로 코드로 한번 살펴보겠습니다. ^^

public static object[] Arg2GenericMethod<T, V>(T arg1, V arg2)
{
    object[] objArray = new object[2];
	
	/*
    objArray[0] = arg1;
    objArray[1] = arg2;
	*/

    return objArray;
}

위와 같이 메서드가 정의되어 있을 때 주석으로 표시된 영역의 코드를 IL로 직접 만든다면 어떻게 해야 할까요?

아시는 것처럼, object 변수에 "값 타입(Value Type)"의 인스턴스를 넣는 경우 box 연산을 수행해야 하지만, "참조 타입(Reference Type)"의 인스턴스인 경우에는 box 연산이 필요 없습니다. 따라서 위의 메서드에서 T, V 제네릭 타입의 실제 구현체가 값 형식인지, 참조 형식인지 알아야만 box 연산이 필요한지 여부를 결정할 수 있는데 IL 코드 수준에서는 아직 JIT 컴파일되기 전이므로 그것을 알 수 없습니다.

마이크로소프트는, 이런 경우 무조건 box 연산자를 넣도록 정하고 있는데 실제로 위의 메서드를 주석 제거하고 컴파일 해보면 다음과 같이 IL 코드가 작성된 것을 볼 수 있습니다.

.method public hidebysig static object[] Arg2GenericMethod<T,V>(!!T arg1, !!V arg2) cil managed
// SIG: 10 02 02 1D 1C 1E 00 1E 01
{
  // Method begins at RVA 0x207c
  // Code size       32 (0x20)
  .maxstack  3
  .locals init ([0] object[] objArray,
                [1] object[] CS$1$0000)
  IL_0000:  /* 00   |                  */ nop
  IL_0001:  /* 18   |                  */ ldc.i4.2
  IL_0002:  /* 8D   | (01)000001       */ newarr     [mscorlib]System.Object
  IL_0007:  /* 0A   |                  */ stloc.0
  IL_0008:  /* 06   |                  */ ldloc.0
  IL_0009:  /* 16   |                  */ ldc.i4.0
  IL_000a:  /* 02   |                  */ ldarg.0
  IL_000b:  /* 8C   | (1B)000001       */ box        !!T
  IL_0010:  /* A2   |                  */ stelem.ref
  IL_0011:  /* 06   |                  */ ldloc.0
  IL_0012:  /* 17   |                  */ ldc.i4.1
  IL_0013:  /* 03   |                  */ ldarg.1
  IL_0014:  /* 8C   | (1B)000002       */ box        !!V
  IL_0019:  /* A2   |                  */ stelem.ref
  IL_001a:  /* 06   |                  */ ldloc.0
  IL_001b:  /* 0B   |                  */ stloc.1
  IL_001c:  /* 2B   | 00               */ br.s       IL_001e
  IL_001e:  /* 07   |                  */ ldloc.1
  IL_001f:  /* 2A   |                  */ ret
} // end of method Program::Arg2GenericMethod

IL 코드로 번역된,

box !!T

연산의 경우, 바이너리 코드로 보면 "8C 1B 00 00 01"에 해당합니다. 여기서 8C는 box IL 코드에 대한 값이고, 이후 0x1B000001, 0x1B000002는 해당 메서드의 Generic 변수 타입으로 지정된 T, V를 의미하는 메타데이터 토큰 값입니다. 이 중에서 "0x1b......"는 CorTokenType에 정의된 상위 토큰 구분자로써 다음과 같이 미리 정의된 값입니다.

//
// Token tags.
//
typedef enum CorTokenType
{
    mdtModule               = 0x00000000,       //
    mdtTypeRef              = 0x01000000,       //
    mdtTypeDef              = 0x02000000,       //
    mdtFieldDef             = 0x04000000,       //
    mdtMethodDef            = 0x06000000,       //
    mdtParamDef             = 0x08000000,       //
    mdtInterfaceImpl        = 0x09000000,       //
    mdtMemberRef            = 0x0a000000,       //
    mdtCustomAttribute      = 0x0c000000,       //
    mdtPermission           = 0x0e000000,       //
    mdtSignature            = 0x11000000,       //
    mdtEvent                = 0x14000000,       //
    mdtProperty             = 0x17000000,       //
    mdtModuleRef            = 0x1a000000,       //
    mdtTypeSpec             = 0x1b000000,       //
    mdtAssembly             = 0x20000000,       //
    mdtAssemblyRef          = 0x23000000,       //
    mdtFile                 = 0x26000000,       //
    mdtExportedType         = 0x27000000,       //
    mdtManifestResource     = 0x28000000,       //
    mdtGenericParam         = 0x2a000000,       //
    mdtMethodSpec           = 0x2b000000,       //
    mdtGenericParamConstraint = 0x2c000000,

    mdtString               = 0x70000000,       //
    mdtName                 = 0x71000000,       //
    mdtBaseType             = 0x72000000,       // Leave this on the high end value. This does not correspond to metadata table
} CorTokenType;

문제는, 해당 메서드의 signature로부터 메타데이터 토큰을 구할 수 있는 방법이 없다는 점입니다. 위의 코드에서 보면 SIG 값이 "10 02 02 1D 1C 1E 00 1E 01"로 되어 있는데, 이를 분석해 보면 다음과 같습니다.

10: IMAGE_CEE_CS_CALLCONV_GENERIC == 0x10임, 따라서 값 10과 IMAGE_CEE_CS_CALLCONV_GENERIC을 비트 AND 연산해서 true이므로 Generic 메서드
02: Generic 메서드인 경우 Generic 타입의 수
02: Generic 메서드인 경우 인자의 수
1D: 반환값의 타입 (0x1D == ELEMENT_TYPE_SZARRAY), 따라서 배열
1C: 앞의 sig 값의 의미가 배열이었으므로 이번엔 배열 요소의 타입 (0x1C == ELEMENT_TYPE_OBJECT), 따라서 배열 요소의 타입은 object
1E: 첫 번째 인자의 타입 (0x1E == ELEMENT_TYPE_MVAR), 따라서 타입은 제네릭
00: 앞의 sig 값의 의미가 제네릭이었으므로 이번엔 Generic 변수의 인덱스
1E: 두 번째 인자의 타입 (0x1E == ELEMENT_TYPE_MVAR), 따라서 타입은 제네릭
01: 앞의 sig 값의 의미가 제네릭이었으므로 이번엔 Generic 변수의 인덱스

그 외의 ELEMENT_TYPE_... 값은 CorElementType에 정의되어 있으므로 이를 참조하시면 됩니다.

typedef enum CorElementType
{
    ELEMENT_TYPE_END            = 0x00,
    ELEMENT_TYPE_VOID           = 0x01,
    ELEMENT_TYPE_BOOLEAN        = 0x02,
    ELEMENT_TYPE_CHAR           = 0x03,
    ELEMENT_TYPE_I1             = 0x04,
    ELEMENT_TYPE_U1             = 0x05,
    ELEMENT_TYPE_I2             = 0x06,
    ELEMENT_TYPE_U2             = 0x07,
    ELEMENT_TYPE_I4             = 0x08,
    ELEMENT_TYPE_U4             = 0x09,
    ELEMENT_TYPE_I8             = 0x0a,
    ELEMENT_TYPE_U8             = 0x0b,
    ELEMENT_TYPE_R4             = 0x0c,
    ELEMENT_TYPE_R8             = 0x0d,
    ELEMENT_TYPE_STRING         = 0x0e,

    // every type above PTR will be simple type
    ELEMENT_TYPE_PTR            = 0x0f,     // PTR <type>
    ELEMENT_TYPE_BYREF          = 0x10,     // BYREF <type>

    // Please use ELEMENT_TYPE_VALUETYPE. ELEMENT_TYPE_VALUECLASS is deprecated.
    ELEMENT_TYPE_VALUETYPE      = 0x11,     // VALUETYPE <class Token>
    ELEMENT_TYPE_CLASS          = 0x12,     // CLASS <class Token>
    ELEMENT_TYPE_VAR            = 0x13,     // a class type variable VAR <number>
    ELEMENT_TYPE_ARRAY          = 0x14,     // MDARRAY <type> <rank> <bcount> <bound1> ... <lbcount> <lb1> ...
    ELEMENT_TYPE_GENERICINST    = 0x15,     // GENERICINST <generic type> <argCnt> <arg1> ... <argn>
    ELEMENT_TYPE_TYPEDBYREF     = 0x16,     // TYPEDREF  (it takes no args) a typed referece to some other type

    ELEMENT_TYPE_I              = 0x18,     // native integer size
    ELEMENT_TYPE_U              = 0x19,     // native unsigned integer size
    ELEMENT_TYPE_FNPTR          = 0x1b,     // FNPTR <complete sig for the function including calling convention>
    ELEMENT_TYPE_OBJECT         = 0x1c,     // Shortcut for System.Object
    ELEMENT_TYPE_SZARRAY        = 0x1d,     // Shortcut for single dimension zero lower bound array
                                            // SZARRAY <type>
    ELEMENT_TYPE_MVAR           = 0x1e,     // a method type variable MVAR <number>

    // This is only for binding
    ELEMENT_TYPE_CMOD_REQD      = 0x1f,     // required C modifier : E_T_CMOD_REQD <mdTypeRef/mdTypeDef>
    ELEMENT_TYPE_CMOD_OPT       = 0x20,     // optional C modifier : E_T_CMOD_OPT <mdTypeRef/mdTypeDef>

    // This is for signatures generated internally (which will not be persisted in any way).
    ELEMENT_TYPE_INTERNAL       = 0x21,     // INTERNAL <typehandle>

    // Note that this is the max of base type excluding modifiers
    ELEMENT_TYPE_MAX            = 0x22,     // first invalid element type


    ELEMENT_TYPE_MODIFIER       = 0x40,
    ELEMENT_TYPE_SENTINEL       = 0x01 | ELEMENT_TYPE_MODIFIER, // sentinel for varargs
    ELEMENT_TYPE_PINNED         = 0x05 | ELEMENT_TYPE_MODIFIER,
    ELEMENT_TYPE_R4_HFA         = 0x06 | ELEMENT_TYPE_MODIFIER, // used only internally for R4 HFA types
    ELEMENT_TYPE_R8_HFA         = 0x07 | ELEMENT_TYPE_MODIFIER, // used only internally for R8 HFA types

} CorElementType;

어쨌든 여기서 중요한 것은! Generic 타입에 대해 얻을 수 있는 정보가 sginature에 명시된 "1e 00", "1e 01"이 전부인데, 도대체 이 정보로부터 어떻게 0x1B000001, 0x1B000002,... 값을 얻어낼 수 있느냐 하는 점입니다.

어떻게 보면, "1E 00", "1E 01"로 되어 있기 때문에 00, 01에 대해 0x1B000001을 각각 더하는 식으로 구할 수 있을 거라고 생각할 수도 있는데 이것은 완전히 틀린 가정입니다. 테스트를 해보면 메서드의 Signature가 "// SIG: 30 01 01 01 1E 00"와 같이 나올 수 있지만 내부 IL 코드에서 사용하고 있는 토큰 값은 0x1B000001가 아닌 0x1b000025와 같은 값이 나오는 경우가 있기 때문입니다. 즉, 1e 다음에 오는 숫자는 0x1b... 토큰의 값과는 완전히 무관합니다.

특이하게도, 이런 generic 타입은 "1e"를 시작으로 그다음 숫자까지를 포함해서 모두 TypeSpec 메타 데이터 테이블에 포함되어 있기 때문에 우선 모든 TypeSpec을 열람한 다음,

HCORENUM hCorEnum = 0;
DWORD cEnumResult = 0;
mdTypeSpec typeSpecs[1024];

while (true)
{
    HRESULT hr = pMetaDataImport->EnumTypeSpecs(&hCorEnum, typeSpecs, 1024, &cEnumResult);
    if (hr != S_OK || cEnumResult == 0)
    {
        break;
    }

    for (size_t i = 0; i < cEnumResult; i++)
    {
        // ... 개개 Type Spec 별로 signature를 알아냄.
    }
}

pMetaDataImport->CloseEnum(hCorEnum);

구해낸 Type Spec 하나마다 그것의 signature 값을 구해서 "1e 00", "1e 01" 등의 signature와 직접 비교해야 합니다.

// ...[생략]...
mdTypeSpec foundTypeSpec = 0;

while (true)
{
    // ...[생략]...

    for (size_t i = 0; i < cEnumResult; i++)
    {
        DWORD cbSig = 0;
        PCCOR_SIGNATURE pvSig;
        hr = pMetaDataImport->GetTypeSpecFromToken(typeSpecs[i], &pvSig, &cbSig);
        if (hr != S_OK)
        {
            break;
        }

        BYTE sigs[2] = { 0x1e, 0x00 };
        if (memcmp(pvSig, sigs, cbSig) == 0)
        {
            foundTypeSpec = typeSpecs[i];
            break;
        }
    }

    if (foundTypeSpec != 0)
    {
        break;
    }
}

pMetaDataImport->CloseEnum(hCorEnum);

이 분야로는 자료가 많지 않아서, 이것이 제가 찾아낸 최선의 방법인데 혹시 더 나은 방법을 알고 계신 분은 덧글 부탁드립니다. ^^

(2024-03-11: IMetaDataEmit::GetTokenFromTypeSpec을 이용하면 위와 같이 enum + GetTypeSpecFromToken 없이 곧바로 구할 수 있습니다.)




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 3/11/2024]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2015-02-06 07시54분
[Lyn] 닷넷 너무 어렵네요...
[guest]
2015-02-07 09시02분
이건 닷넷 계의 "어셈블리 언어"이야기라서 좀 어렵긴 합니다. ^^ 그래도 익숙해지면. ^^;
정성태

... 76  77  78  79  80  81  82  83  84  [85]  86  87  88  89  90  ...
NoWriterDateCnt.TitleFile(s)
11811정성태2/11/201920870오류 유형: 510. 서버 운영체제에 NVIDIA GeForce Experience 실행 시 wlanapi.dll 누락 문제
11810정성태2/11/201918503.NET Framework: 808. .NET Profiler - GAC 모듈에서 GAC 비-등록 모듈을 참조하는 경우의 문제
11809정성태2/11/201920691.NET Framework: 807. ClrMD를 이용해 메모리 덤프 파일로부터 특정 인스턴스를 참조하고 있는 소유자 확인
11808정성태2/8/201922019디버깅 기술: 123. windbg - 닷넷 응용 프로그램의 메모리 누수 분석
11807정성태1/29/201919912Windows: 156. 가상 디스크의 용량을 복구 파티션으로 인해 늘리지 못하는 경우 [4]
11806정성태1/29/201919557디버깅 기술: 122. windbg - 덤프 파일로부터 PID와 환경 변수 등의 정보를 구하는 방법
11805정성태1/28/201921714.NET Framework: 806. C# - int []와 object []의 차이로 이해하는 제네릭의 필요성 [4]파일 다운로드1
11804정성태1/24/201919559Windows: 155. diskpart - remove letter 이후 재부팅 시 다시 드라이브 문자가 할당되는 경우
11803정성태1/10/201918411디버깅 기술: 121. windbg - 닷넷 Finalizer 스레드가 멈춰있는 현상
11802정성태1/7/201920153.NET Framework: 805. 두 개의 윈도우를 각각 실행하는 방법(Windows Forms, WPF)파일 다운로드1
11801정성태1/1/201921459개발 환경 구성: 427. Netsh의 네트워크 모니터링 기능 [3]
11800정성태12/28/201820542오류 유형: 509. WCF 호출 오류 메시지 - System.ServiceModel.CommunicationException: Internal Server Error
11799정성태12/19/201822253.NET Framework: 804. WPF(또는 WinForm)에서 UWP UI 구성 요소 사용하는 방법 [3]파일 다운로드1
11798정성태12/19/201821090개발 환경 구성: 426. vcpkg - "Building vcpkg.exe failed. Please ensure you have installed Visual Studio with the Desktop C++ workload and the Windows SDK for Desktop C++"
11797정성태12/19/201817105개발 환경 구성: 425. vcpkg - CMake Error: Problem with archive_write_header(): Can't create '' 빌드 오류
11796정성태12/19/201817365개발 환경 구성: 424. vcpkg - "File does not have expected hash" 오류를 무시하는 방법
11795정성태12/19/201820658Windows: 154. PowerShell - Zone 별로 DNS 레코드 유형 정보 조회 [1]
11794정성태12/16/201816766오류 유형: 508. Get-AzureWebsite : Request to a downlevel service failed.
11793정성태12/16/201819314개발 환경 구성: 423. NuGet 패키지 제작 - Native와 Managed DLL을 분리하는 방법 [1]
11792정성태12/11/201819107Graphics: 34. .NET으로 구현하는 OpenGL (11) - Per-Pixel Lighting파일 다운로드1
11791정성태12/11/201819111VS.NET IDE: 130. C/C++ 프로젝트의 시작 프로그램으로 .NET Core EXE를 지정하는 경우 닷넷 디버깅이 안 되는 문제 [1]
11790정성태12/11/201817610오류 유형: 507. Could not save daemon configuration to C:\ProgramData\Docker\config\daemon.json: Access to the path 'C:\ProgramData\Docker\config' is denied.
11789정성태12/10/201831216Windows: 153. C# - USB 장치의 연결 및 해제 알림을 위한 WM_DEVICECHANGE 메시지 처리 [2]파일 다운로드2
11788정성태12/4/201817494오류 유형: 506. SqlClient - Value was either too large or too small for an Int32.Couldn't store <2151292191> in ... Column
11787정성태11/29/201821645Graphics: 33. .NET으로 구현하는 OpenGL (9), (10) - OBJ File Format, Loading 3D Models파일 다운로드1
11786정성태11/29/201818627오류 유형: 505. OpenGL.NET 예제 실행 시 "Managed Debugging Assistant 'CallbackOnCollectedDelegate'" 예외 발생
... 76  77  78  79  80  81  82  83  84  [85]  86  87  88  89  90  ...