Microsoft MVP성태의 닷넷 이야기
닷넷: 2257. C# - float (단정도 실수) 저장소의 비트 구조 [링크 복사], [링크+제목 복사],
조회: 9774
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일

(시리즈 글이 8개 있습니다.)
.NET Framework: 539. C# - 부동 소수 계산 왜 이렇게 나오죠? (1)
; https://www.sysnet.pe.kr/2/0/10872

.NET Framework: 540. C# - 부동 소수 계산 왜 이렇게 나오죠? (2)
; https://www.sysnet.pe.kr/2/0/10873

.NET Framework: 608. double 값을 구할 때는 반드시 피연산자를 double로 형변환!
; https://www.sysnet.pe.kr/2/0/11055

개발 환경 구성: 440. C#, C++ - double의 Infinity, NaN 표현 방식
; https://www.sysnet.pe.kr/2/0/11896

기타: 85. 단정도/배정도 부동 소수점의 정밀도(Precision)에 따른 형변환 손실
; https://www.sysnet.pe.kr/2/0/13212

닷넷: 2257. C# - float (단정도 실수) 저장소의 비트 구조
; https://www.sysnet.pe.kr/2/0/13617

닷넷: 2258. C# - double (배정도 실수) 저장소의 비트 구조
; https://www.sysnet.pe.kr/2/0/13618

닷넷: 2259. C# - decimal 저장소의 비트 구조
; https://www.sysnet.pe.kr/2/0/13619




C# - float (단정도 실수) 저장소의 비트 구조

예전 글에서,

단정도/배정도 부동 소수점의 정밀도(Precision)에 따른 형변환 손실
; https://www.sysnet.pe.kr/2/0/13212

그림으로만 float (단정도 실수), double (배정도 실수)를 설명하고 지나갔는데요, 실제로 코드를 사용해서 이것을 들여다보겠습니다. ^^

우선, 단정도 실수의 분해는 다음의 그림에 따라,

[단정도 실수 - 그림 출처: https://ko.wikipedia.org/wiki/IEEE_754]
single_float_1.png

C# 7.0부터 리터럴에 "_" 밑줄 구분자를 임의의 위치에 추가할 수 있다는 점과 C# 7.2에 추가된 숫자 리터럴의 선행 밑줄을 통해 다음과 같은 표현으로 쉽게 분해할 수 있습니다.

namespace ConsoleApp1;

internal class Program
{
    static unsafe void Main(string[] args)
    {
        float f = -118.625f;

        Console.WriteLine($"{f}: sizeof(float): {sizeof(float)}");
        Console.WriteLine();

        byte* pFloat = (byte*)&f;
        PrintFloatFormat(pFloat);
    }

    private static unsafe void PrintFloatFormat(byte* pFloat)
    {
        uint data = *(uint*)pFloat;

        uint signBitMask  = 0b_1000_0000_0000_0000_0000_0000_0000_0000; // C# 7.2부터 컴파일 가능
        uint exponentMask = 0b_0111_1111_1000_0000_0000_0000_0000_0000;
        uint fractionMask = 0b_0000_0000_0111_1111_1111_1111_1111_1111;

        uint signBit = (data & signBitMask);
        uint exponentBits = (data & exponentMask);
        uint fractionBits = (data & fractionMask);

        Console.WriteLine(Convert.ToString((long)signBit, 2).PadLeft(32, '0').Separator(4, '_'));
        Console.WriteLine(Convert.ToString((long)exponentBits, 2).PadLeft(32, '0').Separator(4, '_'));
        Console.WriteLine(Convert.ToString((long)fractionBits, 2).PadLeft(32, '0').Separator(4, '_'));
    }
}

public static class StringExtension
{
    // ...[생략: 첨부 소스코드 참조]...
}

실행하면 다음과 같은 결과가 나오는데요,

-118.625: sizeof(float): 4

signBit:        1000_0000_0000_0000_0000_0000_0000_0000
exponentBits:   0100_0010_1000_0000_0000_0000_0000_0000
fractionBits:   0000_0000_0110_1101_0100_0000_0000_0000

왜 저런 결과가 나왔는지를 이해하기 위해서는 먼저 IEEE 754 표준에 따라 거치는 정규화 과정을 알아야 합니다. 즉, 위의 경우 "-118.625"는 다음과 같은 정규화 과정을 거칩니다.

2진수 변환)
-118.625 ==> 1110110.101

지수 표현)
1110110.101 ==> 1.110110101 * 26
    지수부: 6
    가수부: 1.110110101

그런데, 이상하군요? ^^ 위에서 지수 6은 2진수로 표현하면 0110인데, 어떻게 코드에서 출력한 exponentBits(100_0010_1), 즉 133이 되었을까요? 그것은 지수부를 표현하는 8비트를 절반 나누어 음의 지수와 양의 지수로 쓰기 때문입니다. 8비트니까, 0 ~ 255까지의 값을 표현할 수 있는데요, 중간인 127을 2의 0승으로 두고 그것보다 작으면 음, 크면 양의 제곱으로 처리를 하는 방식입니다. 따라서 여기서 지수는 6이므로 +127을 해서 133을 exponentBits에 저장한 것이고 그래서 100_0010_1 값이 나온 것입니다.

가수부의 처리도 재미있습니다. 위의 경우 보존해야 할 값은 1110110101이지만 정규화했을 때 언제나 앞자리 하나는 1이므로 (비트를 절약하기 위해) 그 부분은 절삭하고 (1)110110101의 110110101 값만 가수로 저장합니다.

대충 이해가 되시죠? ^^




그렇다면, 위와 같이 분해된 정보로부터 원래의 실숫값을 복원하는 것도 가능합니다.

우선, 가수부의 110110101에서 생략된 가장 상위의 1을 복원시켜줍니다.

1_1011_0101 ==> 11_1011_0101

그다음, 지수부의 133을 원래의 지수로 만들어줍니다. 이를 위해 (반대로) 127을 빼주면 됩니다.

6 = 133 - 127

이렇게 구한 값들을 통해 처음의 float 값으로 복원할 수 있습니다.

1.110110101 * 2E6

==> 1110110.101

10진수로 ==> 118.625

==> sign 비트 적용
-118.625

(118.625의 2진수 값이 실제로 1110110.101인지 진법 계산을 해보면 나오겠지만, 간편하게 온라인 진법 계산기를 사용해 확인할 수도 있습니다.)

이 과정을 코드로 표현하면 대충 다음과 같이 만들 수 있습니다. ^^

{
    bool minus = signBit != 0;
    uint exponents = exponentBits >> 23;

    // 삭제된 1을 복원하고,
    uint fractions = fractionBits | 0b_0000_0000_1000_0000_0000_0000_0000_0000;

    int shift = (int)exponents - 127;

    // (삭제된 1비트의 복원으로 9비트가 아닌) 8비트만 shift 시키면 원래의 가수로 변환
    fractions = fractions << 8;
    string mantissa = Convert.ToString(fractions, 2).TrimEnd('0');
    Console.WriteLine($"{(minus ? "-" : "")}{mantissa} * 2E{shift}");

    mantissa = Convert.ToString(fractions, 2).TrimEnd('0');
    mantissa = MarkDecimalPoint(mantissa, shift);
    Console.WriteLine($"{(minus ? "-" : "")}{mantissa}");

    decimal value = Recomposite(mantissa) * (minus ? -1 : 1);
    Console.WriteLine($"{value}, (float: {(float)value})");
}

private static decimal Recomposite(string mantissa)
{
    int pos = mantissa.IndexOf('.');

    string left = mantissa;
    string right = "";

    if (pos != -1)
    {
        left = mantissa[0..pos];
        right = mantissa[(pos + 1)..];
    }

    decimal integer = parseInteger(left);
    decimal decimalPart = parseDecimalPart(right);

    return integer + decimalPart;
}

private static decimal parseInteger(string left)
{
    decimal result = 0;
    decimal pow2 = 1;

    foreach (char ch in left.Reverse())
    {
        result = result + ((ch == '1') ? 1 : 0) * pow2;
        pow2 *= 2;
    }

    return result;
}

private static decimal parseDecimalPart(string right)
{
    decimal result = 0;
    decimal pow2 = 1m / 2m;

    foreach (char ch in right)
    {
        result = result + ((ch == '1') ? 1 : 0) * pow2;
        pow2 /= 2m;
    }

    return result;
}

private static string MarkDecimalPoint(string mantissa, int shift)
{
    if (shift >= 0)
    {
        shift++;
        mantissa = mantissa.PadRight(shift, '0');
    }
    else
    {
        string decimalPart = new string('0', -shift - 1);
        mantissa = "0." + decimalPart + mantissa;
        return mantissa;
    }

    if (mantissa.Length == shift)
    {
        return mantissa;
    }

    string left = mantissa[0..shift];
    string right = mantissa[shift..];

    return $"{left}.{right}";
}

이전 코드와 합쳐서 실행해 보면 이런 결과를 얻을 수 있습니다.

-118.625 (decimal: -118.625): sizeof(float): 4

signBit:        1000_0000_0000_0000_0000_0000_0000_0000
exponentBits:   0100_0010_1000_0000_0000_0000_0000_0000
fractionBits:   0000_0000_0110_1101_0100_0000_0000_0000

-1110110101 * 2E6
-1110110.101
-118.625, (float: -118.625)

잘 복원이 되었죠? ^^

(첨부 파일은 이 글의 예제 코드를 포함>합니다.)




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 5/6/2024]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




... 61  62  63  64  65  66  67  68  69  70  71  72  73  74  [75]  ...
NoWriterDateCnt.TitleFile(s)
12062정성태11/21/201919039디버깅 기술: 133. windbg - CoTaskMemFree/FreeCoTaskMem에서 발생한 덤프 분석 사례 - 두 번째 이야기
12061정성태11/20/201919448Windows: 167. CoTaskMemAlloc/CoTaskMemFree과 윈도우 Heap의 관계
12060정성태11/20/201921095디버깅 기술: 132. windbg/Visual Studio - HeapFree x64의 동작 분석
12059정성태11/20/201920368디버깅 기술: 131. windbg/Visual Studio - HeapFree x86의 동작 분석
12058정성태11/19/201920939디버깅 기술: 130. windbg - CoTaskMemFree/FreeCoTaskMem에서 발생한 덤프 분석 사례
12057정성태11/18/201916778오류 유형: 579. Visual Studio - Memory 창에서 유효한 주소 영역임에도 "Unable to evaluate the expression." 오류 출력
12056정성태11/18/201922468개발 환경 구성: 464. "Microsoft Visual Studio Installer Projects" 프로젝트로 EXE 서명 및 MSI 파일 서명 방법파일 다운로드1
12055정성태11/17/201916613개발 환경 구성: 463. Visual Studio의 Ctrl + Alt + M, 1 (Memory 1) 등의 단축키가 동작하지 않는 경우
12054정성태11/15/201918275.NET Framework: 869. C# - 일부러 GC Heap을 깨뜨려 GC 수행 시 비정상 종료시키는 예제
12053정성태11/15/201919859Windows: 166. 윈도우 10 - 명령행 창(cmd.exe) 속성에 (DotumChe, GulimChe, GungsuhChe 등의) 한글 폰트가 없는 경우
12052정성태11/15/201918693오류 유형: 578. Azure - 일정(schedule)에 등록한 runbook이 1년 후 실행이 안 되는 문제(Reason - The key used is expired.)
12051정성태11/14/201922246개발 환경 구성: 462. 시작하자마자 비정상 종료하는 프로세스의 메모리 덤프 - procdump [1]
12050정성태11/14/201919814Windows: 165. AcLayers의 API 후킹과 FaultTolerantHeap
12049정성태11/13/201920269.NET Framework: 868. (닷넷 프로세스를 대상으로) 디버거 방식이 아닌 CLR Profiler를 이용해 procdump.exe 기능 구현
12048정성태11/12/201920387Windows: 164. GUID 이름의 볼륨에 해당하는 파티션을 찾는 방법
12047정성태11/12/201922730Windows: 163. 안전하게 eject시킨 USB 장치를 물리적인 재연결 없이 다시 인식시키는 방법
12046정성태10/29/201917239오류 유형: 577. windbg - The call to LoadLibrary(...\sos.dll) failed, Win32 error 0n193
12045정성태10/27/201917171오류 유형: 576. mstest.exe 실행 시 "Visual Studio Enterprise is required to execute the test." 오류 - 두 번째 이야기
12044정성태10/27/201916761오류 유형: 575. mstest.exe - System.Resources.MissingSatelliteAssemblyException: The satellite assembly named "Microsoft.VisualStudio.ProductKeyDialog.resources.dll, ..."
12043정성태10/27/201918314오류 유형: 574. Windows 10 설치 시 오류 - 0xC1900101 - 0x4001E
12042정성태10/26/201918029오류 유형: 573. OneDrive 하위에 위치한 Documents, Desktop 폴더에 대한 권한 변경 시 "Unable to display current owner"
12041정성태10/23/201918957오류 유형: 572. mstest.exe - The load test results database could not be opened.
12040정성태10/23/201919362오류 유형: 571. Unhandled Exception: System.Net.Mail.SmtpException: Transaction failed. The server response was: 5.2.0 STOREDRV.Submission.Exception:SendAsDeniedException.MapiExceptionSendAsDenied
12039정성태10/22/201916839스크립트: 16. cmd.exe의 for 문에서는 ERRORLEVEL이 설정되지 않는 문제
12038정성태10/17/201916916오류 유형: 570. SQL Server 2019 RC1 - SQL Client Connectivity SDK 설치 오류
12037정성태10/15/201924427.NET Framework: 867. C# - Encoding.Default 값을 바꿀 수 있을까요?파일 다운로드1
... 61  62  63  64  65  66  67  68  69  70  71  72  73  74  [75]  ...