Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 

(시리즈 글이 8개 있습니다.)
.NET Framework: 539. C# - 부동 소수 계산 왜 이렇게 나오죠? (1)
; https://www.sysnet.pe.kr/2/0/10872

.NET Framework: 540. C# - 부동 소수 계산 왜 이렇게 나오죠? (2)
; https://www.sysnet.pe.kr/2/0/10873

.NET Framework: 608. double 값을 구할 때는 반드시 피연산자를 double로 형변환!
; https://www.sysnet.pe.kr/2/0/11055

개발 환경 구성: 440. C#, C++ - double의 Infinity, NaN 표현 방식
; https://www.sysnet.pe.kr/2/0/11896

기타: 85. 단정도/배정도 부동 소수점의 정밀도(Precision)에 따른 형변환 손실
; https://www.sysnet.pe.kr/2/0/13212

닷넷: 2257. C# - float (단정도 실수) 저장소의 비트 구조
; https://www.sysnet.pe.kr/2/0/13617

닷넷: 2258. C# - double (배정도 실수) 저장소의 비트 구조
; https://www.sysnet.pe.kr/2/0/13618

닷넷: 2259. C# - decimal 저장소의 비트 구조
; https://www.sysnet.pe.kr/2/0/13619




단정도/배정도 부동 소수점의 정밀도(Precision)에 따른 형변환 손실

명백히, 아래의 실수 2개는 다른 값입니다.

1129115336.790
1129115376.400

하지만, 이러한 다름은 8바이트 배정도 실수일 때 그런 것이지, 4바이트 단정도 실수일 때는 값이 같습니다.

// C# 11 + .NET 7

static void Main(string[] args)
{
    float old = 1129115336.790f;
    Console.WriteLine($"{old:F10}");

    float current = 1129115376.400f;
    Console.WriteLine($"{current:F10}");
}

/* 출력 결과
1129115392.0000000000
1129115392.0000000000
*/

그리고 이건 IEEE 754 부동 소수점 포맷을 따르는 모든 언어에서 같습니다. 에를 들어 Go 언어에서도 동일한 출력을 확인할 수 있습니다.

// Go 1.19.4

func main() {
    var old float32 = 1129115336.790
    var current float32 = 1129115376.400

    fmt.Printf("%.10f\n", old)
    fmt.Printf("%.10f\n", current)
}

/* 출력 결과
1129115392.0000000000
1129115392.0000000000
*/

이런 현상이 발생하는 원인은, 배정도 실수의 경우 가수 부분으로 52비트를 할당한 반면, 단정도 실수는 23비트라는 (어쩔 수 없었겠지만) 짧은 정밀도를 가진 탓에 있습니다.

[단정도 실수 - 그림 출처: https://ko.wikipedia.org/wiki/IEEE_754]
single_float_1.png

[배정도 실수 - 그림 출처: https://en.wikipedia.org/wiki/Double-precision_floating-point_format]
single_float_2.png

실제로 우리가 테스트했던 10진수 숫자를 2진수로 바꾸면 다음과 같은데요,

// 1129115336.790
0100 0011 0100 1100 1110 1110 1100 1000.1100 1010 0011 1101 0111

// 1129115376.400
0100 0011 0100 1100 1110 1110 1111 0000.0110 0110 0110 0110 0110

앞자리를 1로 놓고 지수를 결정하는 식으로 정규화를 하기 때문에 다음과 같이 23비트에 해당하는 가수가 각각 선택됩니다.

// 1129115336.790
    _100 0011 0100 1100 1110 1110 1...
==> 마지막 자리가 1이므로 반올림
    _100 0011 0100 1100 1110 1111

// 1129115376.400
    _100 0011 0100 1100 1110 1110 1...
==> 마지막 자리가 1이므로 반올림
    _100 0011 0100 1100 1110 1111

결국, 정수 영역에 해당하는 것조차 23비트 가수 영역으로는 부족한 상태이므로 소수점 영역은 아예 전부 잘려나갔습니다. 이처럼 float32로 표현되면 그 숫자 값이 1129115376이 되어 값이 같아진 것입니다.

그리고 원래의 값과 비교했을 때, 10진수의 보존된 값은 앞에서 6자리입니다.




위에서 제가 "6자리"의 숫자가 보존되었다고 했는데요, C#의 실수 표현 문서를 보면,

Floating-point numeric types (C# reference)
; https://learn.microsoft.com/en-us/dotnet/csharp/language-reference/builtin-types/floating-point-numeric-types

single_float_3.png

float(32비트)의 경우 Precision이 "~6-9 digits"라는 문구를 볼 수 있는데, 위에서 테스트한 6자리는 그 기준에 부합합니다. 지수를 생각하지 않는다면 가수부의 23비트는 액면 그대로 10진수 7자리에 해당하기 때문에 아마도 일반적인 경우 6~9자리의 10진수 정도에 해당하는 정밀도가 있다고 하는 것 같습니다. (혹시, 정확하게 이때의 정밀도에 대해 설명해 주실 분이 계실까요? ^^ 덧글 부탁드립니다.) 하지만 가수와 지수를 구분해서 보관한다는 실수 표현의 성격상, 가수에 해당하는 비트만 보관할 수 있다면 경우에 따라 전체 숫자 값이 그대로 보존될 수 있는 여지가 있습니다.

가령 위에서 예로 든 "1,129,115,336.790" 값의 정수 부분과 정확히 자릿수가 일치하는 "2,147,483,648" 값은 숫자가 더 큼에도 불구하고 float32로 잘 보존이 됩니다.

float t2 = 2147483648f;
Console.WriteLine($"{t2:F10}"); // 출력 결과: 2147483648.0000000000

왜냐하면 해당 숫자는 2진수로 이렇고,

1000 0000 0000 0000 0000 0000 0000 0000

따라서, 단 1비트만 보관할 수 있어도 나머지는 지수로 감당하므로 숫자가 그대로 보존된 것입니다. 따라서 이런 경우에는 10진수 숫자의 모든 값이 잘 보존되었으므로 정밀도는 10이 된 것입니다.

물론, 23비트만 만족한다면, 더 큰 숫자도 보존할 수 있습니다.

4,784,511,654,127,730,688
==> 0100 0010 0110 0110 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

가수부에 보존할 값 23비트
.100 0010 0110 0110 0000 0000

실제로 직접 C# 코딩으로 테스트해도 결과가 잘 나옵니다.

BigInteger b = BigInteger.Parse("4784511654127730688");
float t3 = (float)b;
Console.WriteLine($"{t3:F10}");

// 출력 결과: 4784511654127730688.0000000000

저렇게 되면 정밀도는 19가 되는 건가요? ^^

반대로, 10진수로는 0.1인 단순한 값조차도 2진수로는 표현할 수 없다는 한계로 인해 부동 소수에서는 제대로 값을 표현하지 못하는 문제도 있습니다.

// 10진수 0.1
//  2진수 0.0001100110011001100...[1100 반복]....
float f1 = 0.1f;
Console.WriteLine($"{f1:F70}");

double f2 = 0.1;
Console.WriteLine($"{f2:F70}");

/* 출력 결과
0.1000000014901161193847656250000000000000000000000000000000000000000000
0.1000000000000000055511151231257827021181583404541015625000000000000000
*/




이처럼, 가수부와 지수부에 대한 독립적인 역할로 인해 부동 소수점 데이터 타입의 경우에는 (정수와는 달리) 작은 숫자 범위에서는 형변환 손실이 없을 거라는, 또는 그 반대로 큰 숫자 범위에서는 반드시 형변환 손실이 있을 거라는 가정을 해서는 안 됩니다.

암튼, 이런저런 부동 소수점의 특성 때문에 이렇게나 많은 글들을 쓰게 되는군요. ^^

C# - 부동 소수 계산 왜 이렇게 나오죠? (1)
; https://www.sysnet.pe.kr/2/0/10872

C# - 부동 소수 계산 왜 이렇게 나오죠? (2)
; https://www.sysnet.pe.kr/2/0/10873

double 값을 구할 때는 반드시 피연산자를 double로 형변환!
; https://www.sysnet.pe.kr/2/0/11055

C#, C++ - double의 Infinity, NaN 표현 방식
; https://www.sysnet.pe.kr/2/0/11896




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 1/8/2023]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




... 61  62  63  64  65  66  67  68  [69]  70  71  72  73  74  75  ...
NoWriterDateCnt.TitleFile(s)
12211정성태4/27/202019264개발 환경 구성: 486. WSL에서 Makefile로 공개된 리눅스 환경의 C/C++ 소스 코드 빌드
12210정성태4/20/202020708.NET Framework: 903. .NET Framework의 Strong-named 어셈블리 바인딩 (1) - app.config을 이용한 바인딩 리디렉션 [1]파일 다운로드1
12209정성태4/13/202017414오류 유형: 614. 리눅스 환경에서 C/C++ 프로그램이 Segmentation fault 에러가 발생한 경우 (2)
12208정성태4/12/202015977Linux: 29. 리눅스 환경에서 C/C++ 프로그램이 Segmentation fault 에러가 발생한 경우
12207정성태4/2/202015828스크립트: 19. Windows PowerShell의 NonInteractive 모드
12206정성태4/2/202018445오류 유형: 613. 파일 잠금이 바로 안 풀린다면? - The process cannot access the file '...' because it is being used by another process.
12205정성태4/2/202015105스크립트: 18. Powershell에서는 cmd.exe의 명령어를 지원하진 않습니다.
12204정성태4/1/202015105스크립트: 17. Powershell 명령어에 ';' (semi-colon) 문자가 포함된 경우
12203정성태3/18/202017951오류 유형: 612. warning: 'C:\ProgramData/Git/config' has a dubious owner: '...'.
12202정성태3/18/202021208개발 환경 구성: 486. .NET Framework 프로젝트를 위한 GitLab CI/CD Runner 구성
12201정성태3/18/202018438오류 유형: 611. git-credential-manager.exe: Using credentials for username "Personal Access Token". [1]
12200정성태3/18/202018530VS.NET IDE: 145. NuGet + Github 라이브러리 디버깅 관련 옵션 3가지 - "Enable Just My Code" / "Enable Source Link support" / "Suppress JIT optimization on module load (Managed only)"
12199정성태3/17/202016172오류 유형: 610. C# - CodeDomProvider 사용 시 Unhandled Exception: System.IO.DirectoryNotFoundException: Could not find a part of the path '...\f2_6uod0.tmp'.
12198정성태3/17/202019532오류 유형: 609. SQL 서버 접속 시 "Cannot open user default database. Login failed."
12197정성태3/17/202018829VS.NET IDE: 144. .NET Core 콘솔 응용 프로그램을 배포(publish) 시 docker image 자동 생성 - 두 번째 이야기 [1]
12196정성태3/17/202015949오류 유형: 608. The ServicedComponent being invoked is not correctly configured (Use regsvcs to re-register).
12195정성태3/16/202018268.NET Framework: 902. C# - 프로세스의 모든 핸들을 열람 - 세 번째 이야기
12194정성태3/16/202020999오류 유형: 607. PostgreSQL - Npgsql.NpgsqlException: sorry, too many clients already
12193정성태3/16/202017916개발 환경 구성: 485. docker - SAP Adaptive Server Enterprise 컨테이너 실행 [1]
12192정성태3/14/202019939개발 환경 구성: 484. docker - Sybase Anywhere 16 컨테이너 실행
12191정성태3/14/202021048개발 환경 구성: 483. docker - OracleXE 컨테이너 실행 [1]
12190정성태3/14/202015628오류 유형: 606. Docker Desktop 업그레이드 시 "The process cannot access the file 'C:\Program Files\Docker\Docker\resources\dockerd.exe' because it is being used by another process."
12189정성태3/13/202021231개발 환경 구성: 482. Facebook OAuth 처리 시 상태 정보 전달 방법과 "유효한 OAuth 리디렉션 URI" 설정 규칙
12188정성태3/13/202026023Windows: 169. 부팅 시점에 실행되는 chkdsk 결과를 확인하는 방법
12187정성태3/12/202015598오류 유형: 605. NtpClient was unable to set a manual peer to use as a time source because of duplicate error on '...'.
12186정성태3/12/202017402오류 유형: 604. The SysVol Permissions for one or more GPOs on this domain controller and not in sync with the permissions for the GPOs on the Baseline domain controller.
... 61  62  63  64  65  66  67  68  [69]  70  71  72  73  74  75  ...