아이태니엄(IA64: Itanium)에서 겪은 C++ 포인터 연산 문제
제니퍼 닷넷의 C++ 프로젝트를 IA64로 포팅하면서 겪게 된 사연을 적어봅니다. ^^
문제는, 그 C++ 프로젝트에서만 발생하는 것 같은데 일단 Win32 콘솔 유형으로 간단하게 그 부분의 코드를 옮겨오면 다음과 같습니다.
#include "stdafx.h"
#include <Windows.h>
int _tmain(int argc, _TCHAR* argv[])
{
__int64 nSize = 1;
LPCBYTE pSize = (LPCBYTE)&nSize;
int tSize1 = *( (int *)pSize );
int tSize2 = *( (int *)(pSize + 4) );
printf("tSize1 == %d, tSize2 == %d\r\n", tSize1, tSize2);
return 0;
}
위의 코드에서 "*( (int *)(pSize + 4) )"와 같은 표현을 가진 C++ 코드가 아이태니엄에서 실행되면 그것을 실행하는 스레드 자체가 죽어버렸습니다. 문제를 더욱 복잡하게 만든 것이 있다면, 그 코드를 포함한 함수의 앞뒤로 CriticalSection을 잡아두는 바람에 다른 스레드들이 EnterCriticalSection에서 모두 대기하는 사태가 발생한 것입니다.
안전을 위해 다음과 같이 코드를 바꾸었고,
__try
{
EnterCS...
...[함수 호출]...
}
__finally
{
LeaveCS...
}
이렇게 함으로써 hang 상태는 벗어났지만, 응용 프로그램이 제대로 동작하지는 않았습니다. 사실... 문제의 심각성으로 보면, hang이나 비정상 동작이나 별다르게 차이가 없다고 봐야 할 수준입니다.
IA64를 마이크로소프트에서 지원을 포기하다 보니, 문제 파악이 많이 힘들었습니다.
원격 디버깅 도구가 ia64 버전이 있었지만, 실제로 "Attach to Process"를 하면 BreakPoint까지는 잘 잡히는데... 음... ^^; 잡히기만 할 뿐 실행이 되어도 멈추지를 않았습니다.
Windbg도 설치해서 마찬가지로 해당 프로세스에 붙여보았으나, "kb"와 같은 결과만 나올 뿐 "!locks" 명령어들은 동작하지 않았습니다.
결국, 문제를 분할 정복 방식으로 쪼개서 "printf" 문으로 일일이 확인해 가며 디버깅하는 수밖에 없었습니다. 어쨌든, 위와 같은 문제를 발견했을 때... 해결 방법 때문에 다시 고민이 되었습니다. 도대체... 저 코드를 어떻게 고쳐야 할까 아무리 생각해도 답이 안 나오는데, 혹시나 싶어서... 정말 설마 하는 마음으로 다음과 같이 고쳐보았습니다.
// int tSize2 = *( (int *)(pSize + 4) );
memcpy(&tSize2, pSize + 4, 4);
printf("tSize1 == %d, tSize2 == %d\r\n", tSize1, tSize2);
문제 해결! (위의 소스 코드로는 재현이 안됩니다.)
그나저나, 저 2가지 코드의 차이점이 IA64에서 어떤 영향을 주었길래 문제가 발생한 것일까요? 혹시 아시는 분이 계시다면 덧글 부탁드립니다.
[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]