C# - decimal 저장소의 비트 구조
decimal의 경우 float/double과 내부적인 처리는 유사하지만,
C# - float (단정도 실수) 저장소의 비트 구조
; https://www.sysnet.pe.kr/2/0/13617
C# - double (배정도 실수) 저장소의 비트 구조
; https://www.sysnet.pe.kr/2/0/13618
그것들의 관계처럼 단순히 지수부와 가수부에 대한 비트 수만 확장한 것이 아니라, 지수부의 진법을 2가 아니라 10으로 취급한다는 점이 다릅니다. 마이크로소프트의 공식 문서는 (어딘가 있을 듯한데) 찾을 수 없었지만 아래의 글에 이에 대한 내용이 나옵니다.
Decimal floating point in .NET
; https://csharpindepth.com/articles/Decimal
결국, decimal은 16바이트이고 8바이트씩 나눠 다룰 수 있는데 이것을 bit mask로 표현하면 이렇게 구분할 수 있습니다.
[하위 8바이트(64비트)]
가수부 64비트: 1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111
[상위 8바이트(64비트)]
상위 가수부 32비트: 1111_1111_1111_1111_1111_1111_1111_1111_0000_0000_0000_0000_0000_0000_0000_0000
지수부 5비트: 0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0001_1111_0000_0000_0000_0000
Sign 1비트: 0000_0000_0000_0000_0000_0000_0000_0000_1000_0000_0000_0000_0000_0000_0000_0000
따라서, 가수부는 총 96비트, 즉 2의 96승을 다룰 수 있고, 지수부는 5비트로 32까지 다룰 수 있지만 실제로 사용하는 범위는 0~28까지라고 합니다. 그래서 지수부의 경우 1_1111 비트 마스크 중 사실상 0_1111로 처리해도 무방합니다.
예를 하나 들어볼까요? ^^
18_446_744_073_709_551_616m 숫자에 대해 각각의 부호 비트, 지수부, 가수부를 다음과 같은 코드로 구할 수 있습니다.
decimal m = 18_446_744_073_709_551_615m + 1m;
Console.WriteLine($"decimal value: {m}");
byte* pDecimal = (byte*)&m;
ParseDecimalFormat(pDecimal);
private static unsafe void ParseDecimalFormat(byte* pDecimal)
{
// 1bit - signbit
// 5bits - exponent (only valid 0~28), 10의 n 승
// 96bits - mantissa
// 하위 - 64bits mantissa
// 1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111;
// 0111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111;
// 상위 - 64bits
// 1111_1111_1111_1111_1111_1111_1111_1111_0000_0000_0000_0000_0000_0000_0000_0000; // 상위 32bits - 추가 mantissa
// 0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0001_1111_0000_0000_0000_0000; // 5bits - exponent
// 0000_0000_0000_0000_0000_0000_0000_0000_1000_0000_0000_0000_0000_0000_0000_0000; // 1bit - sign
byte* hiPart = pDecimal;
byte* loPart = pDecimal + 8;
bool signBit = GetDecimalSignBit(hiPart);
Console.WriteLine($"sign bit: {signBit}");
ulong exponentBits = GetDecimalExponents(hiPart);
Console.WriteLine($"10-exponent: {exponentBits}");
BigInteger mantissaBits = GetMantissa(hiPart, loPart);
Console.WriteLine($"Mantissa: {mantissaBits}");
}
private static unsafe bool GetDecimalSignBit(byte* hiPart)
{
ulong hi = *(ulong*)hiPart;
ulong signBit = hi & 0b_0000_0000_0000_0000_0000_0000_0000_0000_1000_0000_0000_0000_0000_0000_0000_0000;
return signBit != 0;
}
private static unsafe ulong GetDecimalExponents(byte* hiPart)
{
ulong hi = *(ulong*)hiPart;
ulong exponentBits = hi & 0b_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0001_1111_0000_0000_0000_0000;
return exponentBits >> 16;
}
private static unsafe BigInteger GetMantissa(byte* hiPart, byte* loPart)
{
ulong lo = *(ulong*)loPart;
BigInteger lower = new BigInteger(lo);
ulong hi = *(ulong*)hiPart;
ulong hiMantissa = hi & 0b_1111_1111_1111_1111_1111_1111_1111_1111_0000_0000_0000_0000_0000_0000_0000_0000;
hiMantissa = (hiMantissa >> 32);
BigInteger large = hiMantissa;
large = large << 64;
Console.WriteLine($"Low mantissa: {lo}");
Console.WriteLine($"Hig mantissa: {large}");
return large + lower;
}
실행 결과는 다음과 같습니다.
decimal value: 18446744073709551616
sign bit: False
10-exponent: 0
Low mantissa: 0
Hig mantissa: 18446744073709551616
Mantissa: 18446744073709551616
숫자에 소수점이 없어서 말 그대로 96비트의 숫자를 다루는 형태입니다. 반면 -0.01m으로 하면,
decimal m = -0.01m;
Console.WriteLine($"decimal value: {m}");
byte* pDecimal = (byte*)&m;
ParseDecimalFormat(pDecimal);
이런 출력 결과가 나옵니다.
decimal value: -0.01
sign bit: True
10-exponent: 2
Low mantissa: 1
Hig mantissa: 0
Mantissa: 1
보는 바와 같이 지수부의 숫자가 2인데요, float/double이 각각 127, 1023을 bias로 잡아 음의 지수, 양의 지수를 표현했던 것과는 달리 decimal은 무조건 음의 지수로 10의 -n 승을 의미합니다.
즉, 위의 경우에는 10의 -2승이 돼 원래의 숫자를 다음과 같은 공식으로 복원할 수 있습니다.
sign * mantissa / 10exponent
위의 공식에 분해한 숫자를 각각 대입하면 원래의 값이 나옵니다.
sign bit: True ==> -1
mantissa = 1
exponent = 2
-1 * 1 / 102 == -0.01
다시 말해, float/double이 2진수를 지수승으로 표기해 0.1 숫자를 제대로 표현할 수 없었던 한계를 decimal은 10의 n 승으로 지수를 계산하기 때문에 0.1에 대한 표현의 제약이 없어진 것입니다. (물론, 그만큼 연산 속도는 느립니다.)
자, 그럼 분해한 숫자를 기반으로 원래의 숫자를 복원하는 코드도 이렇게 간결하게 만들 수 있습니다. ^^
decimal m = -0.01m;
byte* pDecimal = (byte*)&m;
byte* hiPart = pDecimal;
byte* loPart = pDecimal + 8;
bool signBit = GetDecimalSignBit(hiPart);
ulong exponentBits = GetDecimalExponents(hiPart);
BigInteger mantissaBits = GetMantissa(hiPart, loPart);
{
decimal orignalValue = (decimal)mantissaBits;
decimal exponent = (decimal)Pow10(exponentBits);
orignalValue = orignalValue / exponent;
orignalValue = orignalValue * (signBit ? -1 : 1);
Console.WriteLine(orignalValue); // 출력 결과: -0.01
}
한 가지 재미있는 점은, decimal의 경우 (float/double과는 다르게) 4바이트 int 배열로 그 구조를 반환하는 GetBits 메서드를 별도로 제공한다는 점입니다.
GetBits(Decimal)
; https://learn.microsoft.com/en-us/dotnet/api/system.decimal.getbits#System_Decimal_GetBits_System_Decimal_
이전에 설명했듯이 96비트가 int의 3개에 해당한다는 점, 그리고 부호/지수 비트의 영역이 남은 32비트에 있다는 점에서 GetBits는 가수부와 지수부/부호부를 어느 정도 분해해서 반환하는 효과를 갖습니다.
참고로, 검색하던 중에 아래와 같은 질문을 봤는데요,
How do check if a decimal has a fractional part in C#
; https://www.reddit.com/r/learnprogramming/comments/1g1f31/how_do_check_if_a_decimal_has_a_fractional_part/
즉, decimal의 값이 소수점을 포함하고 있는지를 확인하고 싶다는 건데, 이런 경우 GetBits를 이용하면 다음과 같이 구할 수 있고,
int[] bits = Decimal.GetBits(m);
bool hasFraction = (bits[3] & 0x7FFF_FFFF) != 0;
혹은 직접 포인터를 구해 저 영역의 값을 확인해도 됩니다.
decimal m = -0.01m;
byte* pDecimal = (byte*)&m;
ulong upper = *(ulong*)(pDecimal + 8);
bool checkFraction = (upper & 0x7FFF_FFFF) != 0;
(
첨부 파일은 이 글의 예제 코드를 포함합니다.)
[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]