Microsoft MVP성태의 닷넷 이야기
닷넷: 2259. C# - decimal 저장소의 비트 구조 [링크 복사], [링크+제목 복사],
조회: 11424
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일

(시리즈 글이 8개 있습니다.)
.NET Framework: 539. C# - 부동 소수 계산 왜 이렇게 나오죠? (1)
; https://www.sysnet.pe.kr/2/0/10872

.NET Framework: 540. C# - 부동 소수 계산 왜 이렇게 나오죠? (2)
; https://www.sysnet.pe.kr/2/0/10873

.NET Framework: 608. double 값을 구할 때는 반드시 피연산자를 double로 형변환!
; https://www.sysnet.pe.kr/2/0/11055

개발 환경 구성: 440. C#, C++ - double의 Infinity, NaN 표현 방식
; https://www.sysnet.pe.kr/2/0/11896

기타: 85. 단정도/배정도 부동 소수점의 정밀도(Precision)에 따른 형변환 손실
; https://www.sysnet.pe.kr/2/0/13212

닷넷: 2257. C# - float (단정도 실수) 저장소의 비트 구조
; https://www.sysnet.pe.kr/2/0/13617

닷넷: 2258. C# - double (배정도 실수) 저장소의 비트 구조
; https://www.sysnet.pe.kr/2/0/13618

닷넷: 2259. C# - decimal 저장소의 비트 구조
; https://www.sysnet.pe.kr/2/0/13619




C# - decimal 저장소의 비트 구조

decimal의 경우 float/double과 내부적인 처리는 유사하지만,

C# - float (단정도 실수) 저장소의 비트 구조
; https://www.sysnet.pe.kr/2/0/13617

C# - double (배정도 실수) 저장소의 비트 구조
; https://www.sysnet.pe.kr/2/0/13618

그것들의 관계처럼 단순히 지수부와 가수부에 대한 비트 수만 확장한 것이 아니라, 지수부의 진법을 2가 아니라 10으로 취급한다는 점이 다릅니다. 마이크로소프트의 공식 문서는 (어딘가 있을 듯한데) 찾을 수 없었지만 아래의 글에 이에 대한 내용이 나옵니다.

Decimal floating point in .NET
; https://csharpindepth.com/articles/Decimal

결국, decimal은 16바이트이고 8바이트씩 나눠 다룰 수 있는데 이것을 bit mask로 표현하면 이렇게 구분할 수 있습니다.

[하위 8바이트(64비트)]
가수부 64비트: 1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111

[상위 8바이트(64비트)]
상위 가수부 32비트: 1111_1111_1111_1111_1111_1111_1111_1111_0000_0000_0000_0000_0000_0000_0000_0000
지수부 5비트:       0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0001_1111_0000_0000_0000_0000
Sign 1비트:        0000_0000_0000_0000_0000_0000_0000_0000_1000_0000_0000_0000_0000_0000_0000_0000

따라서, 가수부는 총 96비트, 즉 2의 96승을 다룰 수 있고, 지수부는 5비트로 32까지 다룰 수 있지만 실제로 사용하는 범위는 0~28까지라고 합니다. 그래서 지수부의 경우 1_1111 비트 마스크 중 사실상 0_1111로 처리해도 무방합니다.

예를 하나 들어볼까요? ^^

18_446_744_073_709_551_616m 숫자에 대해 각각의 부호 비트, 지수부, 가수부를 다음과 같은 코드로 구할 수 있습니다.

decimal m = 18_446_744_073_709_551_615m + 1m;

Console.WriteLine($"decimal value: {m}");
byte* pDecimal = (byte*)&m;
ParseDecimalFormat(pDecimal);

private static unsafe void ParseDecimalFormat(byte* pDecimal)
{
    // 1bit - signbit
    // 5bits - exponent (only valid 0~28), 10의 n 승
    // 96bits - mantissa

    // 하위 - 64bits mantissa
    // 1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111;
    // 0111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111;

    // 상위 - 64bits
    // 1111_1111_1111_1111_1111_1111_1111_1111_0000_0000_0000_0000_0000_0000_0000_0000; // 상위 32bits - 추가 mantissa
    // 0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0001_1111_0000_0000_0000_0000; // 5bits - exponent
    // 0000_0000_0000_0000_0000_0000_0000_0000_1000_0000_0000_0000_0000_0000_0000_0000; // 1bit - sign

    byte* hiPart = pDecimal;
    byte* loPart = pDecimal + 8;

    bool signBit = GetDecimalSignBit(hiPart);
    Console.WriteLine($"sign bit: {signBit}");

    ulong exponentBits = GetDecimalExponents(hiPart);
    Console.WriteLine($"10-exponent: {exponentBits}");

    BigInteger mantissaBits = GetMantissa(hiPart, loPart);
    Console.WriteLine($"Mantissa: {mantissaBits}");
}

private static unsafe bool GetDecimalSignBit(byte* hiPart)
{
    ulong hi = *(ulong*)hiPart;
    ulong signBit = hi & 0b_0000_0000_0000_0000_0000_0000_0000_0000_1000_0000_0000_0000_0000_0000_0000_0000;

    return signBit != 0;
}

private static unsafe ulong GetDecimalExponents(byte* hiPart)
{
    ulong hi = *(ulong*)hiPart;
    ulong exponentBits = hi & 0b_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0001_1111_0000_0000_0000_0000;
    return exponentBits >> 16;
}

private static unsafe BigInteger GetMantissa(byte* hiPart, byte* loPart)
{
    ulong lo = *(ulong*)loPart;
    BigInteger lower = new BigInteger(lo);

    ulong hi = *(ulong*)hiPart;
    ulong hiMantissa = hi & 0b_1111_1111_1111_1111_1111_1111_1111_1111_0000_0000_0000_0000_0000_0000_0000_0000;
    hiMantissa = (hiMantissa >> 32);

    BigInteger large = hiMantissa;
    large = large << 64;

    Console.WriteLine($"Low mantissa: {lo}");
    Console.WriteLine($"Hig mantissa: {large}");

    return large + lower;
}

실행 결과는 다음과 같습니다.

decimal value: 18446744073709551616
sign bit: False
10-exponent: 0
Low mantissa: 0
Hig mantissa: 18446744073709551616
Mantissa: 18446744073709551616

숫자에 소수점이 없어서 말 그대로 96비트의 숫자를 다루는 형태입니다. 반면 -0.01m으로 하면,

decimal m = -0.01m;

Console.WriteLine($"decimal value: {m}");
byte* pDecimal = (byte*)&m;
ParseDecimalFormat(pDecimal);

이런 출력 결과가 나옵니다.

decimal value: -0.01
sign bit: True
10-exponent: 2
Low mantissa: 1
Hig mantissa: 0
Mantissa: 1

보는 바와 같이 지수부의 숫자가 2인데요, float/double이 각각 127, 1023을 bias로 잡아 음의 지수, 양의 지수를 표현했던 것과는 달리 decimal은 무조건 음의 지수로 10의 -n 승을 의미합니다.

즉, 위의 경우에는 10의 -2승이 돼 원래의 숫자를 다음과 같은 공식으로 복원할 수 있습니다.

sign * mantissa / 10exponent

위의 공식에 분해한 숫자를 각각 대입하면 원래의 값이 나옵니다.

sign bit: True ==> -1
mantissa = 1
exponent = 2

-1 * 1 / 102 == -0.01

다시 말해, float/double이 2진수를 지수승으로 표기해 0.1 숫자를 제대로 표현할 수 없었던 한계를 decimal은 10의 n 승으로 지수를 계산하기 때문에 0.1에 대한 표현의 제약이 없어진 것입니다. (물론, 그만큼 연산 속도는 느립니다.)

자, 그럼 분해한 숫자를 기반으로 원래의 숫자를 복원하는 코드도 이렇게 간결하게 만들 수 있습니다. ^^

decimal m = -0.01m;

byte* pDecimal = (byte*)&m;
byte* hiPart = pDecimal;
byte* loPart = pDecimal + 8;

bool signBit = GetDecimalSignBit(hiPart);
ulong exponentBits = GetDecimalExponents(hiPart);
BigInteger mantissaBits = GetMantissa(hiPart, loPart);

{
    decimal orignalValue = (decimal)mantissaBits;
    decimal exponent = (decimal)Pow10(exponentBits);

    orignalValue = orignalValue / exponent;
    orignalValue = orignalValue * (signBit ? -1 : 1);

    Console.WriteLine(orignalValue); // 출력 결과: -0.01
}




한 가지 재미있는 점은, decimal의 경우 (float/double과는 다르게) 4바이트 int 배열로 그 구조를 반환하는 GetBits 메서드를 별도로 제공한다는 점입니다.

GetBits(Decimal)
; https://learn.microsoft.com/en-us/dotnet/api/system.decimal.getbits#System_Decimal_GetBits_System_Decimal_

이전에 설명했듯이 96비트가 int의 3개에 해당한다는 점, 그리고 부호/지수 비트의 영역이 남은 32비트에 있다는 점에서 GetBits는 가수부와 지수부/부호부를 어느 정도 분해해서 반환하는 효과를 갖습니다.

참고로, 검색하던 중에 아래와 같은 질문을 봤는데요,

How do check if a decimal has a fractional part in C#
; https://www.reddit.com/r/learnprogramming/comments/1g1f31/how_do_check_if_a_decimal_has_a_fractional_part/

즉, decimal의 값이 소수점을 포함하고 있는지를 확인하고 싶다는 건데, 이런 경우 GetBits를 이용하면 다음과 같이 구할 수 있고,

int[] bits = Decimal.GetBits(m);
bool hasFraction = (bits[3] & 0x7FFF_FFFF) != 0;

혹은 직접 포인터를 구해 저 영역의 값을 확인해도 됩니다.

decimal m = -0.01m;
byte* pDecimal = (byte*)&m;
ulong upper = *(ulong*)(pDecimal + 8);
bool checkFraction = (upper & 0x7FFF_FFFF) != 0;

(첨부 파일은 이 글의 예제 코드를 포함합니다.)




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 5/10/2024]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2025-05-17 10시36분
본문에서 상위 8바이트의 16비트가 사용되지 않는 것을 볼 수 있습니다. 이유가 뭘까요? 이에 대해 C/C++의 DECIMAL에서 흔적을 찾을 수가 있군요. ^^

What’s with the weird wReserved value at the start of the DECIMAL structure?
; https://devblogs.microsoft.com/oldnewthing/20250516-00/?p=111185

Win32 C/C++에서도 "wReserved"라는 필드로 16비트를 점유하고 있는데요,

typedef struct tagDEC {
  USHORT wReserved;
  union {
    struct {
      BYTE scale;
      BYTE sign;
    };
    USHORT signscale;
  };
  ULONG Hi32;
  union {
    struct {
      ULONG Lo32;
      ULONG Mid32;
    };
    ULONGLONG Lo64;
  };
} DECIMAL;

VARIANT의 vt 필드로 구조를 맞추기 위해서였다고 합니다. 즉, 마이크로소프트는 Windows 환경에 C/C++에서 정의한 VARIANT와 DECIMAL 구조체를 그대로 C#에 도입한 것입니다.

----------------------------------------

눈치채셨겠지만 ^^ 당연히 이러한 정의는 표준이 될 수 없습니다. 찾아보니까, IEEE 754 표준이 있긴 하지만,

Decimal data type - Standard formats
; https://en.wikipedia.org/wiki/Decimal_data_type#Standard_formats

(C#뿐만 아니라) 제각각 언어마다 구현을 달리하는 것 같습니다.

Decimal data type - Language support
; https://en.wikipedia.org/wiki/Decimal_data_type#Language_support
정성태
2025-08-01 10시42분
위의 덧글에서, DECIMAL 타입의 크기가 16바이트이고 그중 16비트가 VARIANT와의 호환으로 인해 사용되지 않는다고 했습니다. 비록 VARIANT를 고려해 16비트를 예약한 것이지만 그렇다고 해서 VARIANT의 vt 필드까지 대응하도록 decimal을 정의하지는 않아서 DECIMAL을 VARIANT에 대입할 때 순서가 중요하게 되었습니다.

A consequence of the weird wReserved value at the start of the DECIMAL structure
; https://devblogs.microsoft.com/oldnewthing/20250731-00/?p=111423

가령, 다음과 같이 vt 필드를 먼저 대입하면,

// Wrong
var.vt = VT_DECIMAL;
var.decVal = value;

16바이트 DECIMAL이 그대로 (decVal은 union이므로) var 16바이트를 덮어쓰게 돼 vt 필드도 초기화되므로 오동작을 하게 됩니다. 따라서 반드시 vt 필드를 나중에 설정하도록 주의를 기울여야 합니다.

// Better
var.decVal = value; // the wReserved overwrites var.vt
var.vt = VT_DECIMAL; // but we fix it up immediately

--------------------------------------------

위의 원문 덧글에 나온 내용도 재미있는데요, gcc 컴파일러의 경우 최적화 과정에서 vt 필드를 설정하는 코드를 없앨 수도 있다고 합니다. 분명히 소스 코드에서는 설정했는데, 실행하면 설정이 되지 않았으니... 정말 힘든 버그를 만날 수도 있겠군요. ^^;
정성태

... [31]  32  33  34  35  36  37  38  39  40  41  42  43  44  45  ...
NoWriterDateCnt.TitleFile(s)
13226정성태1/23/202314101.NET Framework: 2088. .NET 5부터 지원하는 GetRawSocketOption 사용 시 주의할 점
13225정성태1/21/202314545개발 환경 구성: 658. Windows에서 실행 중인 소켓 서버를 다른 PC 또는 WSL에서 접속할 수 없는 경우
13224정성태1/21/202314264Windows: 221. Windows - Private/Public/Domain이 아닌 네트워크 어댑터 단위로 방화벽을 on/off하는 방법
13223정성태1/20/202313636오류 유형: 838. RDP 연결 오류 - The two computers couldn't connect in the amount of time allotted
13222정성태1/20/202313806개발 환경 구성: 657. WSL - DockerDesktop.vhdx 파일 위치를 옮기는 방법
13221정성태1/19/202314504Linux: 57. C# - 리눅스 프로세스 메모리 정보파일 다운로드1
13220정성태1/19/202314958오류 유형: 837. NETSDK1045 The current .NET SDK does not support targeting .NET ...
13219정성태1/18/202313854Windows: 220. 네트워크의 인터넷 접속 가능 여부에 대한 판단 기준
13218정성태1/17/202313733VS.NET IDE: 178. Visual Studio 17.5 (Preview 2) - 포트 터널링을 이용한 웹 응용 프로그램의 외부 접근 허용
13217정성태1/13/202314578디버깅 기술: 185. windbg - 64비트 운영체제에서 작업 관리자로 뜬 32비트 프로세스의 덤프를 sos로 디버깅하는 방법
13216정성태1/12/202313408디버깅 기술: 184. windbg - 32비트 프로세스의 메모리 덤프인 경우 !peb 명령어로 나타나지 않는 환경 변수
13215정성태1/11/202317409Linux: 56. 리눅스 - /proc/pid/stat 정보를 이용해 프로세스의 CPU 사용량 구하는 방법 [1]
13214정성태1/10/202317142.NET Framework: 2087. .NET 6부터 SourceGenerator와 통합된 System.Text.Json [1]파일 다운로드1
13213정성태1/9/202313963오류 유형: 836. docker 이미지 빌드 시 "RUN apt install ..." 명령어가 실패하는 이유
13212정성태1/8/202316435기타: 85. 단정도/배정도 부동 소수점의 정밀도(Precision)에 따른 형변환 손실
13211정성태1/6/202316591웹: 42. (https가 아닌) http 다운로드를 막는 웹 브라우저
13210정성태1/5/202315253Windows: 219. 윈도우 x64의 경우 0x00000000`7ffe0000 아래의 주소는 왜 사용하지 않을까요?
13209정성태1/4/202313101Windows: 218. 왜 윈도우에서 가상 메모리 공간은 64KB 정렬이 된 걸까요?
13208정성태1/3/202315180.NET Framework: 2086. C# - Windows 운영체제의 2MB Large 페이지 크기 할당 방법파일 다운로드1
13207정성태12/26/202216069.NET Framework: 2085. C# - gpedit.msc의 "User Rights Assignment" 특권을 코드로 설정/해제하는 방법 [1]파일 다운로드1
13206정성태12/24/202216114.NET Framework: 2084. C# - GetTokenInformation으로 사용자 SID(Security identifiers) 구하는 방법 [4]파일 다운로드1
13205정성태12/24/202214160.NET Framework: 2083. C# - C++과의 연동을 위한 구조체의 fixed 배열 필드 사용 (2)파일 다운로드1
13204정성태12/22/202213333.NET Framework: 2082. C# - (LSA_UNICODE_STRING 예제로) CustomMarshaler 사용법파일 다운로드1
13203정성태12/22/202213376.NET Framework: 2081. C# Interop 예제 - (LSA_UNICODE_STRING 예제로) 구조체를 C++에 전달하는 방법파일 다운로드1
13202정성태12/21/202216237기타: 84. 직렬화로 설명하는 Little/Big Endian파일 다운로드1
13201정성태12/20/202217662오류 유형: 835. PyCharm 사용 시 C 드라이브 용량 부족
... [31]  32  33  34  35  36  37  38  39  40  41  42  43  44  45  ...