Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일

(시리즈 글이 9개 있습니다.)
.NET Framework: 491. 닷넷 Generic 타입의 메타 데이터 토큰 값 알아내는 방법
; https://www.sysnet.pe.kr/2/0/1848

.NET Framework: 494. 값(struct) 형식의 제네릭(Generic) 타입이 박싱되는 경우의 메타데이터 토큰 값
; https://www.sysnet.pe.kr/2/0/1857

.NET Framework: 495. CorElementType의 요소 값 설명
; https://www.sysnet.pe.kr/2/0/1860

.NET Framework: 509. ELEMENT_TYPE_MODIFIER의 조합
; https://www.sysnet.pe.kr/2/0/2894

.NET Framework: 510. 제네릭(Generic) 인자에 대한 메타데이터 등록 확인
; https://www.sysnet.pe.kr/2/0/2907

.NET Framework: 844. C# - 박싱과 언박싱
; https://www.sysnet.pe.kr/2/0/11943

.NET Framework: 955.  .NET 메서드의 Signature 바이트 코드 분석
; https://www.sysnet.pe.kr/2/0/12379

.NET Framework: 1130. C# - ELEMENT_TYPE_INTERNAL 유형의 사용 예
; https://www.sysnet.pe.kr/2/0/12903

.NET Framework: 1174. C# - ELEMENT_TYPE_FNPTR 유형의 사용 예
; https://www.sysnet.pe.kr/2/0/12998




값(struct) 형식의 제네릭(Generic) 타입이 박싱되는 경우의 메타데이터 토큰 값

지난번 글에서 Generic 타입의 메타데이터 토큰에 대해 이야기했었는데요.

닷넷 Generic 타입의 메타 데이터 토큰 값 알아내는 방법
; https://www.sysnet.pe.kr/2/0/1848

box 연산자를 사용하려면 값 형식의 경우 해당 타입의 메타 데이터 토큰 값을 알아야 하는데, 그렇다면 값 형식의 제네릭 타입은 어떻게 되는 건지 한번 알아보겠습니다.

우선 다음과 같이 예제 코드를 만들고,

using System;

class Program
{
    static void Main(string[] args)
    {
        StructVarTest<int> t2 = new StructVarTest<int>();
        ToObject(t2);
    }

    private static void ToObject<T>(StructVarTest<T> t2)
    {
        object obj = t2;
        Console.WriteLine(obj);
    }
}

struct StructVarTest<T>
{
}

ToObject 메서드를 ildasm.exe로 확인해 보면 다음과 같이 메서드의 signature와 box에서의 제네릭 타입에 대한 메타데이터 토큰값을 알아낼 수 있습니다.

.method private hidebysig static void  ToObject<T>(valuetype StructVarTest`1<!!T> t2) cil managed
// SIG: 10 01 01 01 15 11 0C 01 1E 00
{
  // Method begins at RVA 0x2074
  // Code size       16 (0x10)
  .maxstack  1
  .locals init ([0] object obj)
  IL_0000:  /* 00   |                  */ nop
  IL_0001:  /* 02   |                  */ ldarg.0
  IL_0002:  /* 8C   | (1B)000002       */ box        valuetype StructVarTest`1<!!T>
  IL_0007:  /* 0A   |                  */ stloc.0
  IL_0008:  /* 06   |                  */ ldloc.0
  IL_0009:  /* 28   | (0A)000012       */ call       void [mscorlib]System.Console::WriteLine(object)
  IL_000e:  /* 00   |                  */ nop
  IL_000f:  /* 2A   |                  */ ret
} // end of method Program::ToObject

SIG 값을 분석해 보면 다음과 같습니다.

10: IMAGE_CEE_CS_CALLCONV_GENERIC
01: Generic 메서드인 경우 Generic 타입의 수
01: Generic 메서드인 경우 인자의 수
01: 반환값 타입 == ELEMENT_TYPE_VOID
15: ELEMENT_TYPE_GENERICINST
11: ELEMENT_TYPE_VALUETYPE
0C: StructVarTest 메타데이터 토큰(압축형)
01: 제네릭 타입 인자 수
1E 00: 'T' 메타데이터 토큰 인덱스 (참조: 닷넷 Generic 타입의 메타 데이터 토큰 값 알아내는 방법)

위의 결과에서 StructVarTest의 압축된 토큰값을 구하는 것이 흥미롭습니다. 0x0c가 압축형이라면 이를 풀면 0x2000003 값이 나옵니다. 실제로 해당 어셈블리의 TypeDef 메타데이터 테이블에서 3번째 인덱스 값을 구해보면 StructVarTest`1 타입이 정의된 것을 확인할 수 있습니다.

그런데, 역시 이번에도 "box 0x1b000002" 명령어의 0x1b000002 TypeSpec 메타데이터 토큰 값을 구해오기에는 SIG 값 자체만으로는 전혀 유추가 안되는 상황입니다. 지난 글(닷넷 Generic 타입의 메타 데이터 토큰 값 알아내는 방법)에서는 0x1e를 기점으로 메타데이터 토큰 값을 구할 수 있었지만, 이번에는 상황이 완전히 다릅니다. 왜냐하면 제네릭 인자의 타입이 중요한 것이 아니고 그것을 담고 있는 값 형식의 제네릭 타입에 대한 TypeSpec 토큰 값을 구해와야 하기 때문입니다.

일련의 조사를 해보면, 이 값은 "0x15 ... 0x1e 0x00" 까지의 signature 값으로 구해와야 함을 알 수 있습니다. 그래서 지난번 글의 코드에서 다음과 같이 변경될 수 있습니다.

// ...[생략]...
mdTypeSpec foundTypeSpec = 0;

while (true)
{
    // ...[생략]...

    for (size_t i = 0; i < cEnumResult; i++)
    {
        DWORD cbSig = 0;
        PCCOR_SIGNATURE pvSig;
        hr = pMetaDataImport->GetTypeSpecFromToken(typeSpecs[i], &pvSig, &cbSig);
        if (hr != S_OK)
        {
            break;
        }

        BYTE sigs[6] = { 0x15, 0x11, 0x0c, 0x01, 0x1e, 0x00 };
        if (memcmp(sigs, 6, cbSig) == 0)
        {
            foundTypeSpec = typeSpecs[i];
            break;
        }
    }

    if (foundTypeSpec != 0)
    {
        break;
    }
}

pMetaDataImport->CloseEnum(hCorEnum);




재미있는 사실은, TypeSpec에 등록되는 타입의 조건 역시 TypeRef와 동일하다는 점입니다.

TypeRef 메타테이블에 등록되는 타입의 조건
; https://www.sysnet.pe.kr/2/0/1856

따라서, 이 글의 예제 코드를 다음과 같이 변경하면,

using System;

class Program
{
    static void Main(string[] args)
    {
        StructVarTest<int> t2 = new StructVarTest<int>();
        ToObject(t2);
    }

    private static void ToObject<T>(StructVarTest<T> t2)
    {
        StructVarTest<T> t3 = t2;
        // object obj = t2;
    }
}

struct StructVarTest<T>
{
}

이때는 "{ 0x15, 0x11, 0x0c, 0x01, 0x1e, 0x00 }" 시그니처를 갖는 TypeSpec 토큰값이 (IL 코드에서 해당 토큰값이 사용된 적이 없으므로) 메타데이터 테이블에 저장되지 않습니다. 따라서, 위의 ToObject 메서드 내에 동적으로 "box [...t2인스턴스...]"와 같은 동작을 하는 코드를 넣고 싶어도 토큰값이 없으므로 이것이 불가능합니다.

이것을 가능하게 하려면 IMetaDataEmit 인터페이스의 힘을 빌려야 합니다.

IMetaDataEmit2 *pEmit2;
hr = pMetaDataImport->QueryInterface(IID_IMetaDataEmit2, (LPVOID *)&pEmit2);
if (hr == S_OK && pEmit2 != nullptr)
{
    mdTypeSpec foundTypeSpec = mdTokenNil;
    
    BYTE sigs[6] = { 0x15, 0x11, 0x0c, 0x01, 0x1e, 0x00 };

    pEmit2->GetTokenFromTypeSpec(sigs, 6, &foundTypeSpec);
    pEmit2->Release();
}

비록 이름은 "Get"으로 시작하는 GetTokenFromTypeSpec 메서드지만, 이 메서드를 이용하면 전달된 signature를 TypeSpec 메타데이터 테이블에 등록하고 마지막 인자로 그 토큰값을 반환해 줍니다. (물론, 이미 동일한 signature로 등록된 값이 있으면 기존의 토큰값을 반환해 줍니다.)

(이번 글에는 위의 코드를 테스트 해볼 수 있는 .NET Profiler 예제를 포함시켰습니다.)




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 1/6/2022]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




1  2  3  4  5  [6]  7  8  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
13793정성태10/28/20245148C/C++: 183. C++ - 윈도우에서 한글(및 유니코드)을 포함한 콘솔 프로그램을 컴파일 및 실행하는 방법
13792정성태10/27/20244633Linux: 99. Linux - 프로세스의 실행 파일 경로 확인
13791정성태10/27/20244901Windows: 267. Win32 API의 A(ANSI) 버전은 DBCS를 사용할까요?파일 다운로드1
13790정성태10/27/20244621Linux: 98. Ubuntu 22.04 - 리눅스 커널 빌드 및 업그레이드
13789정성태10/27/20244912Linux: 97. menuconfig에 CONFIG_DEBUG_INFO_BTF, CONFIG_DEBUG_INFO_BTF_MODULES 옵션이 없는 경우
13788정성태10/26/20244458Linux: 96. eBPF (bpf2go) - fentry, fexit를 이용한 트레이스
13787정성태10/26/20244968개발 환경 구성: 730. github - Linux 커널 repo를 윈도우 환경에서 git clone하는 방법 [1]
13786정성태10/26/20245217Windows: 266. Windows - 대소문자 구분이 가능한 파일 시스템
13785정성태10/23/20244984C/C++: 182. 윈도우가 운영하는 2개의 Code Page파일 다운로드1
13784정성태10/23/20245247Linux: 95. eBPF - kprobe를 이용한 트레이스
13783정성태10/23/20244859Linux: 94. eBPF - vmlinux.h 헤더 포함하는 방법 (bpf2go에서 사용)
13782정성태10/23/20244620Linux: 93. Ubuntu 22.04 - 커널 이미지로부터 커널 함수 역어셈블
13781정성태10/22/20244800오류 유형: 930. WSL + eBPF: modprobe: FATAL: Module kheaders not found in directory
13780정성태10/22/20245549Linux: 92. WSL 2 - 커널 이미지로부터 커널 함수 역어셈블
13779정성태10/22/20244841개발 환경 구성: 729. WSL 2 - Mariner VM 커널 이미지 업데이트 방법
13778정성태10/21/20245670C/C++: 181. C/C++ - 소스코드 파일의 인코딩, 바이너리 모듈 상태의 인코딩
13777정성태10/20/20244952Windows: 265. Win32 API의 W(유니코드) 버전은 UCS-2일까요? UTF-16 인코딩일까요?
13776정성태10/19/20245268C/C++: 180. C++ - 고수준 FILE I/O 함수에서의 Unicode stream 모드(_O_WTEXT, _O_U16TEXT, _O_U8TEXT)파일 다운로드1
13775정성태10/19/20245492개발 환경 구성: 728. 윈도우 환경의 개발자를 위한 UTF-8 환경 설정
13774정성태10/18/20245195Linux: 91. Container 환경에서 출력하는 eBPF bpf_get_current_pid_tgid의 pid가 존재하지 않는 이유
13773정성태10/18/20244883Linux: 90. pid 네임스페이스 구성으로 본 WSL 2 + docker-desktop
13772정성태10/17/20245159Linux: 89. pid 네임스페이스 구성으로 본 WSL 2 배포본의 계층 관계
13771정성태10/17/20245065Linux: 88. WSL 2 리눅스 배포본 내에서의 pid 네임스페이스 구성
13770정성태10/17/20245336Linux: 87. ps + grep 조합에서 grep 명령어를 사용한 프로세스를 출력에서 제거하는 방법
13769정성태10/15/20246114Linux: 86. Golang + bpf2go를 사용한 eBPF 기본 예제파일 다운로드1
13768정성태10/15/20245395C/C++: 179. C++ - _O_WTEXT, _O_U16TEXT, _O_U8TEXT의 Unicode stream 모드파일 다운로드2
1  2  3  4  5  [6]  7  8  9  10  11  12  13  14  15  ...