Microsoft MVP성태의 닷넷 이야기
닷넷: 2258. C# - double (배정도 실수) 저장소의 비트 구조 [링크 복사], [링크+제목 복사],
조회: 8860
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일

(시리즈 글이 8개 있습니다.)
.NET Framework: 539. C# - 부동 소수 계산 왜 이렇게 나오죠? (1)
; https://www.sysnet.pe.kr/2/0/10872

.NET Framework: 540. C# - 부동 소수 계산 왜 이렇게 나오죠? (2)
; https://www.sysnet.pe.kr/2/0/10873

.NET Framework: 608. double 값을 구할 때는 반드시 피연산자를 double로 형변환!
; https://www.sysnet.pe.kr/2/0/11055

개발 환경 구성: 440. C#, C++ - double의 Infinity, NaN 표현 방식
; https://www.sysnet.pe.kr/2/0/11896

기타: 85. 단정도/배정도 부동 소수점의 정밀도(Precision)에 따른 형변환 손실
; https://www.sysnet.pe.kr/2/0/13212

닷넷: 2257. C# - float (단정도 실수) 저장소의 비트 구조
; https://www.sysnet.pe.kr/2/0/13617

닷넷: 2258. C# - double (배정도 실수) 저장소의 비트 구조
; https://www.sysnet.pe.kr/2/0/13618

닷넷: 2259. C# - decimal 저장소의 비트 구조
; https://www.sysnet.pe.kr/2/0/13619




C# - double (배정도 실수) 저장소의 비트 구조

double의 경우 지난 글에서 다룬 float 방식과 거의 같습니다.

C# - float (단정도 실수) 저장소의 비트 구조
; https://www.sysnet.pe.kr/2/0/13617

단지, 지수부와 가수부를 위한 비트 수만 좀 더 확장한 유형인데요, 다음의 그림에 따라,

[배정도 실수 - 그림 출처: https://en.wikipedia.org/wiki/Double-precision_floating-point_format]
single_float_2.png

비트 구조만 맞춰서 masking만 잘하면 됩니다.

static unsafe void Main(string[] args)
{
    double d = -118.625;
    Console.WriteLine($"{d} (decimal: {(decimal)d}): sizeof(double): {sizeof(double)}");
    Console.WriteLine();

    byte* pDouble = (byte*)&d;
    PrintDoubleFormat(pDouble);
}

private static unsafe void PrintDoubleFormat(byte* pDouble)
{
    ulong data = *(ulong*)pDouble;

    ulong signBitMask = 0b_1000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000;
    ulong exponentMask = 0b_0111_1111_1111_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000;
    ulong fractionMask = 0b_0000_0000_0000_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111_1111;

    ulong signBit = (data & signBitMask);
    ulong exponentBits = (data & exponentMask);
    ulong fractionBits = (data & fractionMask);

    Console.WriteLine("signBit: \t" + Convert.ToString((long)signBit, 2).PadLeft(64, '0').Separator(4, '_'));
    Console.WriteLine("exponentBits: \t" + Convert.ToString((long)exponentBits, 2).PadLeft(64, '0').Separator(4, '_'));
    Console.WriteLine("fractionBits: \t" + Convert.ToString((long)fractionBits, 2).PadLeft(64, '0').Separator(4, '_'));
}

실행하면 다음과 같은 결과가 나오는데요,

-118.625 (decimal: -118.625): sizeof(double): 8

signBit:        1000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000
exponentBits:   0100_0000_0101_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000
fractionBits:   0000_0000_0000_1101_1010_1000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000

IEEE 754 표준에 따른 정규화 과정을 거쳐,

2진수 변환)
-118.625 ==> 1110110.101

지수 표현)
1110110.101 ==> 1.110110101 * 26
    지수부: 6
    가수부: 1.110110101

double의 경우 float와는 달리 exponentBits가 11비트로 늘었는데요, 따라서 0 ~ 2,047의 수를 표현할 수 있으니 bias 값이 1,023이 됩니다. 결국 지수부 6에 (float는 127을 더했지만) 1023을 더한 1029 값이 exponentBits(100 0000 0101)로 설정됩니다.

가수부의 처리도 비트만 52비트로 늘었을 뿐 float에서의 처리와 다르지 않습니다.




분해된 정보로부터 원래의 double 값을 복원하는 것도 float에서의 규칙과 같습니다. 가수부의 110110101에서 생략된 가장 상위의 1을 복원시키고,

1_1011_0101 ==> 11_1011_0101

그다음, 지수부의 1029를 원래의 지수로 만들어줍니다. (반대로 1023을 빼면 됩니다.)

6 = 1029 - 1023

이렇게 구한 값들을 통해 처음의 double 값으로 복원할 수 있습니다.

1.110110101 * 2E6

==> 1110110.101

10진수로 ==> 118.625

==> sign 비트 적용
-118.625

이 과정 역시 float의 코드를 조금만 바꾸면 double로 이렇게 만들 수 있고,

{
    bool minus = signBit != 0;
    ulong exponents = exponentBits >> 52;

    // 삭제된 1을 복원하고,
    ulong fractions = fractionBits | 0b_0000_0000_0001_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000;

    int shift = (int)exponents - 1023;

    // (삭제된 1로 인해 12비트가 아닌) 11비트만 shift 시키면 원래의 가수로 변환
    fractions = fractions << 11;
    string mantissa = Convert.ToString((long)fractions, 2).TrimEnd('0');
    Console.WriteLine($"{(minus ? "-" : "")}{mantissa} * 2E{shift}");

    mantissa = Convert.ToString((long)fractions, 2).TrimEnd('0');
    mantissa = MarkDecimalPoint(mantissa, shift);
    Console.WriteLine($"{(minus ? "-" : "")}{mantissa}");

    decimal value = Recomposite(mantissa) * (minus ? -1 : 1);
    Console.WriteLine($"{value}, (double: {(double)value})");
}

// ... 기타 코드는 float 예제와 동일 ...

이전 코드와 합쳐서 실행해 보면 이런 결과를 얻을 수 있습니다.

-118.625 (decimal: -118.625): sizeof(double): 8

signBit:        1000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000
exponentBits:   0100_0000_0101_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000
fractionBits:   0000_0000_0000_1101_1010_1000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000

-1110110101 * 2E6
-1110110.101
-118.625, (double: -118.625)

(첨부 파일은 이 글의 예제 코드를 포함합니다.)




참고로, NaN과 infinity 처리도 있는데 이에 대해서는 전에 설명한 적이 있습니다.

C#, C++ - double의 Infinity, NaN 표현 방식
; https://www.sysnet.pe.kr/2/0/11896

그런데 저렇게 장황하게 설명한 것보다 아래의 글에 도표로 잘 정리된 것이 있군요. ^^

Binary floating point and .NET
; https://csharpindepth.com/Articles/FloatingPoint

float_nan_infinity_1.png




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 5/10/2024]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




... 61  62  63  64  65  66  67  68  69  70  [71]  72  73  74  75  ...
NoWriterDateCnt.TitleFile(s)
12162정성태2/26/202021859디버깅 기술: 166. C#에서 만든 COM 객체를 C/C++로 P/Invoke Interop 시 메모리 누수(Memory Leak) 발생 [6]파일 다운로드2
12161정성태2/26/202017917오류 유형: 597. manifest - The value "x64" of attribute "processorArchitecture" in element "assemblyIdentity" is invalid.
12160정성태2/26/202018264개발 환경 구성: 469. Reg-free COM 개체 사용을 위한 manifest 파일 생성 도구 - COMRegFreeManifest
12159정성태2/26/202015363오류 유형: 596. Visual Studio - The project needs to include ATL support
12158정성태2/25/202017949디버깅 기술: 165. C# - Marshal.GetIUnknownForObject/GetIDispatchForObject 사용 시 메모리 누수(Memory Leak) 발생파일 다운로드1
12157정성태2/25/202017982디버깅 기술: 164. C# - Marshal.GetNativeVariantForObject 사용 시 메모리 누수(Memory Leak) 발생 및 해결 방법파일 다운로드1
12156정성태2/25/202016563오류 유형: 595. LINK : warning LNK4098: defaultlib 'nafxcw.lib' conflicts with use of other libs; use /NODEFAULTLIB:library
12155정성태2/25/202016014오류 유형: 594. Warning NU1701 - This package may not be fully compatible with your project
12154정성태2/25/202015396오류 유형: 593. warning LNK4070: /OUT:... directive in .EXP differs from output filename
12153정성태2/23/202019517.NET Framework: 898. Trampoline을 이용한 후킹의 한계파일 다운로드1
12152정성태2/23/202018571.NET Framework: 897. 실행 시에 메서드 가로채기 - CLR Injection: Runtime Method Replacer 개선 - 세 번째 이야기(Trampoline 후킹)파일 다운로드1
12151정성태2/22/202019370.NET Framework: 896. C# - Win32 API를 Trampoline 기법을 이용해 C# 메서드로 가로채는 방법 - 두 번째 이야기 (원본 함수 호출)파일 다운로드1
12150정성태2/21/202019619.NET Framework: 895. C# - Win32 API를 Trampoline 기법을 이용해 C# 메서드로 가로채는 방법 [1]파일 다운로드1
12149정성태2/20/202018418.NET Framework: 894. eBEST C# XingAPI 래퍼 - 연속 조회 처리 방법 [1]
12148정성태2/19/202020949디버깅 기술: 163. x64 환경에서 구현하는 다양한 Trampoline 기법 [1]
12147정성태2/19/202018625디버깅 기술: 162. x86/x64의 기계어 코드 최대 길이
12146정성태2/18/202019379.NET Framework: 893. eBEST C# XingAPI 래퍼 - 로그인 처리파일 다운로드1
12145정성태2/18/202019244.NET Framework: 892. eBEST C# XingAPI 래퍼 - Sqlite 지원 추가파일 다운로드1
12144정성태2/13/202019442.NET Framework: 891. 실행 시에 메서드 가로채기 - CLR Injection: Runtime Method Replacer 개선 - 두 번째 이야기파일 다운로드1
12143정성태2/13/202016000.NET Framework: 890. 상황별 GetFunctionPointer 반환값 정리 - x64파일 다운로드1
12142정성태2/12/202018366.NET Framework: 889. C# 코드로 접근하는 MethodDesc, MethodTable파일 다운로드1
12141정성태2/10/202017395.NET Framework: 888. C# - ASP.NET Core 웹 응용 프로그램의 출력 가로채기 [2]파일 다운로드1
12140정성태2/10/202017942.NET Framework: 887. C# - ASP.NET 웹 응용 프로그램의 출력 가로채기파일 다운로드1
12139정성태2/9/202019197.NET Framework: 886. C# - Console 응용 프로그램에서 UI 스레드 구현 방법
12138정성태2/9/202023221.NET Framework: 885. C# - 닷넷 응용 프로그램에서 SQLite 사용 [6]파일 다운로드1
12137정성태2/9/202016444오류 유형: 592. [AhnLab] 경고 - 디버거 실행을 탐지했습니다.
... 61  62  63  64  65  66  67  68  69  70  [71]  72  73  74  75  ...