Microsoft MVP성태의 닷넷 이야기
.NET Framework: 540. C# - 부동 소수 계산 왜 이렇게 나오죠? (2) [링크 복사], [링크+제목 복사],
조회: 25494
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
(연관된 글이 1개 있습니다.)
(시리즈 글이 8개 있습니다.)
.NET Framework: 539. C# - 부동 소수 계산 왜 이렇게 나오죠? (1)
; https://www.sysnet.pe.kr/2/0/10872

.NET Framework: 540. C# - 부동 소수 계산 왜 이렇게 나오죠? (2)
; https://www.sysnet.pe.kr/2/0/10873

.NET Framework: 608. double 값을 구할 때는 반드시 피연산자를 double로 형변환!
; https://www.sysnet.pe.kr/2/0/11055

개발 환경 구성: 440. C#, C++ - double의 Infinity, NaN 표현 방식
; https://www.sysnet.pe.kr/2/0/11896

기타: 85. 단정도/배정도 부동 소수점의 정밀도(Precision)에 따른 형변환 손실
; https://www.sysnet.pe.kr/2/0/13212

닷넷: 2257. C# - float (단정도 실수) 저장소의 비트 구조
; https://www.sysnet.pe.kr/2/0/13617

닷넷: 2258. C# - double (배정도 실수) 저장소의 비트 구조
; https://www.sysnet.pe.kr/2/0/13618

닷넷: 2259. C# - decimal 저장소의 비트 구조
; https://www.sysnet.pe.kr/2/0/13619




C# - 부동 소수 계산 왜 이렇게 나오죠? (2)

지난번 글에서,

C# - 부동 소수 계산 왜 이렇게 나오죠? (1)
; https://www.sysnet.pe.kr/2/0/10872

약간 부족한 점이 있습니다. 그렇다면 왜 C++ (범위를 좁히겠습니다. Visual Studio 2015의 Visual C++)에서는 2개의 코드 결과값이 모두 13으로 나오느냐는 것입니다.

사실, 이것도 Visual C++로 코드 작성하고 disassembly 창을 통해 생성된 기계어를 보면 알 수 있습니다. 현재 Visual Studio 2015의 C++ 컴파일러는 다음과 같은 기계어를 생성합니다.

    float a = 10.0f;
008B17BE  movss       xmm0,dword ptr ds:[8B6B38h]  
008B17C6  movss       dword ptr [a],xmm0  
    float b = 1.3f;
008B17CB  movss       xmm0,dword ptr ds:[8B6B34h]  
008B17D3  movss       dword ptr [b],xmm0  

    int c = (int)(a * b);
008B17D8  movss       xmm0,dword ptr [a]  

    int c = (int)(a * b);
008B17DD  mulss       xmm0,dword ptr [b]  
008B17E2  cvttss2si   eax,xmm0  
008B17E6  mov         dword ptr [c],eax  

    float a = 10.0f;
00CC167E  movss       xmm0,dword ptr ds:[0CC6B34h]  
00CC1686  movss       dword ptr [a],xmm0  
    float b = 1.3f;
00CC168B  movss       xmm0,dword ptr ds:[0CC6B30h]  
00CC1693  movss       dword ptr [b],xmm0  

    int c3 = (int)(float)(a * b);
00CC1698  movss       xmm0,dword ptr [a]  

    int c3 = (int)(float)(a * b);
00CC169D  mulss       xmm0,dword ptr [b]  
00CC16A2  cvttss2si   eax,xmm0  
00CC16A6  mov         dword ptr [c3],eax  

오호... 명령어 셋이 틀리군요. 그건 둘째치고, 보니까 (float) 형변환 했을 때의 기계어와 하지 않았을 때의 기계어가 다르지 않습니다. 일단 이것으로 동일한 결과를 내는 이유가 설명됩니다. C++에서는 (float) 형변환 연산자는 무시해 버리는 것입니다.

하지만 그렇게 해도 괜찮은 이유가 있습니다. 128비트 xmm0 레지스터에 movss 명령어를 통해 4바이트 float 단정도 부동 소수점의 값을 넣고 있는데, 이런 경우 128비트 xmm0 레지스터는 4개의 32비트로 나뉘어 movss에서 지정한 4바이트 메모리 영역으로부터 직접 값을 받아들입니다. 애당초 4바이트로 끝내고 있기 때문에 (float) 형변환 연산자를 굳이 적용해야 할 필요가 없었던 것입니다.

그럼, C#도... 아니 닷넷 JIT 컴파일러도 이렇게 해줬어야 하는 거 아니냐는 의견이 나올 수 있습니다.

여기서 제가 ... ^^; CLR 개발자 측에 실망스러운 것이 하나 발견되었는데요. 원래 CLR의 장점 중 하나가 런타임 시에 해당 컴퓨팅 환경을 보고 그에 맞는 최적의 CPU 기계어를 생성해 준다고 했기 때문입니다.

위의 Visual C++에서 출력된 movss/mulss 명령은 새롭게 SSE(Streaming SIMD Extensions)를 구현한 CPU에서만 지원되는 명령어입니다. 즉, Visual C++는 이것을 적용한 기계어가 생성된 것이고, 반면 닷넷 JIT 컴파일러는 예전의 구형 기계어 명령을 이용한 결과를 출력한 것입니다.

이에 대해서는 몇 가지 더 재미있는 점이 있습니다.

닷넷 JIT 컴파일러는 x86과 x64가 다른데요. 일반적으로 x64가 더 최적화된 결과를 내주는 것으로 알려져 있습니다. 실제로, 문제가 되었던 이번 예제를 x64로 빌드해서 실행해 보면 동일하게 모두 13 값이 나오고 기계어 코드 역시 다음에서 보는 것처럼 SSE를 이용하는 코드를 생성해 줍니다.

// x64 닷넷 JIT 컴파일러가 출력한 기계어
            float a = 10f;
00007FF8144F04B6  vmovss      xmm0,dword ptr [7FF8144F0518h]  
00007FF8144F04BF  vmovss      dword ptr [rbp+34h],xmm0  
            float b = 1.3f;
00007FF8144F04C5  vmovss      xmm0,dword ptr [7FF8144F051Ch]  
00007FF8144F04CE  vmovss      dword ptr [rbp+30h],xmm0  

            int c = (int)(a * b);  // c == 13
00007FF8144F04D4  vmovss      xmm0,dword ptr [rbp+34h]  
00007FF8144F04DA  vmovss      xmm1,dword ptr [rbp+30h]  
00007FF8144F04E0  vmulss      xmm0,xmm0,xmm1  
00007FF8144F04E5  vcvttss2si  ecx,xmm0  
00007FF8144F04EA  mov         dword ptr [rbp+2Ch],ecx  

            int c3 = (int)(float)(a * b);   // c3 == 13
00007FF8144F04ED  vmovss      xmm0,dword ptr [rbp+34h]  
00007FF8144F04F3  vmovss      xmm1,dword ptr [rbp+30h]  
00007FF8144F04F9  vmulss      xmm0,xmm0,xmm1  
00007FF8144F04FE  vcvttss2si  ecx,xmm0  
00007FF8144F0503  mov         dword ptr [rbp+28h],ecx  

결과는 Visual C++과 차이가 나지 않습니다.

이런 차이점은 Visual C++에서도 발생합니다. 프로젝트 속성창에서 다음과 같이 SSE를 사용하지 않겠다고 하면,

cs_float_sse_1.png

x86 C#에서의 결과와 마찬가지로 12, 13의 값이 나오는 기계어 코드가 생성됩니다.

// Visual C++ - 옵션 설정 No Enhanced Instructions (/arch:IA32)

    float a = 10.0f;
009F167E  fld         dword ptr ds:[9F6B34h]  
009F1684  fstp        dword ptr [a]  
    float b = 1.3f;
009F1687  fld         dword ptr ds:[9F6B30h]  
009F168D  fstp        dword ptr [b]  

    int c = (int)(a * b); // c == 12
009F1690  fld         dword ptr [a]  
009F1693  fmul        dword ptr [b]  
009F1696  call        __ftol2_sse (09F1334h)  
009F169B  mov         dword ptr [c],eax  

    int c3 = (int)(float)(a * b); // c3 == 13
009F169E  fld         dword ptr [a]  
009F16A1  fmul        dword ptr [b]  
009F16A4  fstp        dword ptr [ebp-0F4h]  
009F16AA  fld         dword ptr [ebp-0F4h]  
009F16B0  call        __ftol2_sse (09F1334h)  
009F16B5  mov         dword ptr [c3],eax  

그러니까, 부동 소수점 계산은 CPU에 전적으로 의존적이므로 같은 소스코드라도 어떻게 출력될지는 아무도 장담할 수 없습니다.




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 3/22/2023]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2015-11-25 03시11분
[spowner] 좋은 글 감사합니다. 식상할 수도 있는 내용을 이렇게 상세히 풀어주시니 다시한번 존경의 마음이 올라오는군요.
파주가 너무 멀어 얼굴 뵙고 싶어도 쉽지가 않은데... 영업한다고 하고 한번 다녀와야겠습니다 ^^
[guest]
2015-11-25 08시40분
^^ 파주가 겨울이면 더욱 스산한데요, 쉽게 오실 수도 없으니 기왕이면 봄이 좋을 듯합니다.
정성태
2017-11-17 12시10분
부동소수점(float, double) 가지고 놀기
; http://projecteoe.egloos.com/4427399
정성태

... 136  137  138  139  140  141  142  143  [144]  145  146  147  148  149  150  ...
NoWriterDateCnt.TitleFile(s)
1455정성태6/1/201328326.NET Framework: 369. ThreadPool.QueueUserWorkItem의 실행 지연 [4]파일 다운로드1
1454정성태5/31/201326335Java: 15. Java 7 Control Panel 실행시키는 방법
1453정성태5/22/201325359기타: 32. Microsoft FTP 사이트에 접속하는 방법
1452정성태5/21/201333084Windows: 73. TabProcGrowth 값 삭제 후 IE를 실행시키면 다시 복원되는 경우 [3]
1451정성태5/17/201331988Windows: 72. 윈도우 서버 2012 기초 사용법
1450정성태5/16/201322761오류 유형: 176. SQL10007N Message "0" could not be retrieved. Reason code: "3"
1449정성태5/15/201329849오류 유형: 175. SpeechRecognitionEngine 사용 시 오류 유형 2가지
1448정성태5/14/201324843VC++: 68. #pragma warning(disable: ...)로 오류 제어가 안된다면?
1447정성태5/3/201326547개발 환경 구성: 191. Debugging Tools for Windows 독립 설치 버전 [1]
1446정성태4/30/201327349.NET Framework: 368. Encoding 타입의 대체(fallback) 메카니즘 [1]
1445정성태4/26/201325563디버깅 기술: 54. NT 서비스의 Main 메서드 안에서 Process.GetProcessesByName 호출 시 멈춤 현상 [1]
1444정성태4/26/201329574기타: 31. Internet Explorer: 자바스크립트로 숨겨진 파일 다운로드 경로를 알아내는 방법 [1]
1443정성태4/24/201325257개발 환경 구성: 190. Azure PaaS 웹 응용 프로그램 배포 후 SMTP 서버 구성 [2]
1442정성태4/21/201328833기타: 30. 마이크로소프트 워드의 CPU 점유 현상으로 글자 입력이 느려졌다면? [1]
1441정성태4/21/201335421.NET Framework: 367. LargeAddressAware 옵션이 적용된 닷넷 32비트 프로세스의 가용 메모리 [14]
1440정성태4/19/201324170오류 유형: 174. dumpbin.exe 실행시 mspdb110.dll 로드 오류
1439정성태4/18/201328034VS.NET IDE: 76. Visual Studio 2012와 Itanium 빌드 옵션 [2]
1438정성태4/17/201327452.NET Framework: 366. 다른 프로세스에 환경 변수 설정하는 방법 - 두 번째 이야기 [1]파일 다운로드1
1437정성태4/17/201327684VC++: 67. CRT(C Runtime DLL: msvcr...dll)에 대한 의존성 제거
1436정성태4/17/201333069.NET Framework: 365. Local SYSTEM 권한으로 코드를 실행하는 방법파일 다운로드1
1435정성태4/15/201341950Windows: 71. ad-hoc 보다 더 편리한 "가상 Wifi" 를 이용한 인터넷 공유 [2]
1434정성태4/9/201323233오류 유형: 173. TFS 서버의 이벤트 로그 오류 - WebHost failed to process a request. Parameter name: certificate
1433정성태4/9/201323538개발 환경 구성: 189. TFS에 설치된 SharePoint 의 PowerShell 콘솔 띄우는 방법
1432정성태4/5/201324556오류 유형: 172. System.Web.PipelineModuleStepContainer.GetEventCount 에서 NullReferenceException 이 발생한다면?
1431정성태4/5/201325163기타: 29. 부팅 가능한 (외장) HDD를 기존 부팅 메뉴에 추가하는 방법
1430정성태4/4/201327047제니퍼 .NET: 23. 모바일용 웹 사이트에서 발생하는 응답 시간 지연 현상 [5]파일 다운로드1
... 136  137  138  139  140  141  142  143  [144]  145  146  147  148  149  150  ...