C++ 숫자형 값이 범위를 벗어나는 경우의 출력 사례 모음
다음과 같은 질문이 있군요. ^^
질문있습니다.
; http://social.msdn.microsoft.com/Forums/ko-KR/2eaf476f-53ae-4a55-8867-799fdaaabec6?forum=visualcplusko
질문자의 코드로,
short i = 32768; unsigned short j = 65537;
float x = 1e39; float y = 1.23456e-46;
float fv = 1234567890.1234567890;
double dv = 1234567890.1234567890;
printf("i = %d j = %d \n", i, j);
printf("x = %e y = %e \n", x, y);
printf("fv = %30.25f \n", fv);
printf("dv = %30.25f \n", dv);
실행해 보면 다음과 같은 결과가 나옵니다.
i = -32768 j = 1
x = 1.#INF00e+000 y = 0.000000e+000
fv = 1234567936.0000000000000000000000000
dv = 1234567890.1234567000000000000000000
하나씩 따져볼까요?
의문 1) short 32768의 출력값이 왜 -32768일까?
C++에서 short형은 signed 타입으로 -32,768 ~ +32,767까지의 범위를 갖습니다. 그런데 그 범위를 넘어서는 32768을 대입했는데요. 32768은 2진수로 "1000 0000 0000 0000"인데, 이것이 2의 보수 표현으로는 -32,768값이 됩니다.
의문 2) unsigned short 65537의 출력값이 왜 1일까?
C++에서 unsigned short형은 0 ~ 65,535까지의 범위를 갖습니다. 그런데 그 범위를 넘어서는 65537을 대입했는데요. 65537은 2진수로 "1 0000 0000 0000 0001"인데, 16비트를 넘어서는 최상위 1비트가 절삭되어 결국 1의 값이 된 것입니다.
의문 3) float 1e39의 출력값이 왜 1.#INF00e+000일까?
(Visual) C++에서
float 형은 최대 3.402823466 E+38까지의 값을 표현할 수 있습니다. 그런데 그 범위를 넘어서는 1e39를 대입했는데요.
1e39의 숫자는 float 범위를 넘어서기 때문에 지수부가 이에 대해 0xff로 정해지므로 INF(inity)로 양의 무한을 나타내게 됩니다. 마찬가지로 -1e39값을 대입해 보면 역시 지수부가 0xff로 정해지고 INF(inity)로 음의 무한을 표현하게 됩니다.
의문 4) float 1.23456e-46의 출력값이 왜 0.000000e+000일까?
MSDN의 "
Type float" 문서에 따르면 float형이 표현 가능한 최소 수는 1.175494351 E-38까지라고 하는데 직접 테스트 해본 결과 mantissa = 0x01, exponent = 0, sign = 0으로 설정된 수로 1.401298e-45까지 표현이 되었습니다. 그 이후로 넘어가는 수는 더 이상 표현이 불가능하므로 (즉, 그 이하의 값을 표현하기 위해서는 mantissa 값을 최종적으로 0으로 내려야 하기 때문에) 결과적으로 0에 수렴이 된 것입니다.
의문 5) float 1234567890.1234567890의 출력값이 왜 1234567936.0000000000000000000000000일까?
일단 소수점 이상의 수만으로도 mantissa 23비트가 표현할 수 있는 범위의 정밀도를 넘어서므로 소수점 이하의 수는 버리고 설명해 보겠습니다.
"1234567890."의 값을 2진수로 표현하면 "1001001100101100000001011010010"이 됩니다. 여기서 정규화를 하면 다음과 같이 됩니다.
(+1) * 1001001100101100000001011010010
==> (+1) * 1.001001100101100000001011010010 * (2 ^ 30)
==> sign == 0 (0이면 +, 1이면 -)
mantissa = 001001100101100000001011010010 (당연히 있는 최상위 1비트는 생략하고 표현)
exponent = 30
==> sign == 0
mantissa = 00100110010110000000101 1010010 (23비트이후 분리)
exponent = 30 + 127(bias) == 157
==> sign == 0
mantissa = 00100110010110000000101 == 0x132c05 (23비트이후 절삭)
exponent = 157 == 0x9d
하지만
실제로 Visual C++ 2013에서 확인해 보면 mantissa가 0x132c06이 나옵니다.
#include "stdafx.h"
union Float_t
{
int i;
float f;
struct
{
unsigned int mantissa : 23;
unsigned int exponent : 8;
unsigned int sign : 1;
} parts;
};
int _tmain(int argc, _TCHAR* argv[])
{
float fv = 1234567890.;
Float_t t;
t.f = fv;
printf("t.parts.mantissa == %d(== 0x%x)\n", t.parts.mantissa);
printf("t.parts.exponent == %d\n", t.parts.exponent);
printf("t.parts.sign == %d\n", t.parts.sign);
return 0;
}
// 출력결과
t.parts.mantissa == 1256454(== 0x132c06)
t.parts.exponent == 157
t.parts.sign == 0
이건 순전히 가정이지만, 절삭되는 바로 하위 바이트가 1이기 때문에 아마도 반올림 식으로 해서 "00100110010110000000110"이 되어 0x132c06으로 되는 것이 아닌가 생각됩니다.
이를 확인하기 위해 반올림이 되지 않도록 바로 하위 바이트를 "100100110010110000000101 0010010"으로 숫자를 역구성해서 1234567826 값을 float로 나타내 보았습니다. 그랬더니 Visual C++에서도 이번에는 mantissa값이 0x132c05로 나타났습니다. 아무래도 23비트 이후의 값을 절삭만 하는 것이 아니라 반올림까지 하는 것으로 보입니다. (문서상으로 있을 듯 싶은데 찾지 못했습니다.)
어쨌든 1234567890.1234567890 실수값이 정규화를 거치면 sign == 1, mantissa == 00100110010110000000110, exponent == 157로 바뀝니다. 그럼 다시 이 값을 복원하면 어떻게 될까요?
mantissa = 00100110010110000000110
==> mantissa = 100100110010110000000110 (최상위 1비트를 추가하고)
==> mantissa = 1.00100110010110000000110 (소수점 표현으로 복원하고)
==> mantissa = 1001001100101100000001100000000 (지수부 30승을 하면)
==> 1234567936
이렇게 값이 복원되는 것입니다. 이 원칙을 이해한다면 "double dv = 1234567890.1234567890;" 값이 "1234567890.1234567000000000000000000" 로 출력되는 것도 계산해낼 수 있습니다. double형에는 mantissa로 52비트가 할당되므로 "1234567890.123456"까지 표현할 수 있었던 것입니다.
이 정도면... 대충 이해가 되셨을 것 같군요. ^^
[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]