Microsoft MVP성태의 닷넷 이야기
C/C++: 164. Visual C++ - InterlockedCompareExchange128 사용 방법 [링크 복사], [링크+제목 복사],
조회: 11220
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 
(연관된 글이 1개 있습니다.)

Visual C++ - InterlockedCompareExchange128 사용 방법

윈도우 개발 문서에서 볼 수 있는 InterlockedCompareExchange128 함수는,

InterlockedCompareExchange128 function (winnt.h)
; https://learn.microsoft.com/en-us/windows/win32/api/winnt/nf-winnt-interlockedcompareexchange128

Why does Windows even have Interlocked functions when we have std::atomic?
; https://devblogs.microsoft.com/oldnewthing/20250612-00/?p=111265

사실 Visual C++ 내에서 Compiler Intrinsic으로 구현했기 때문에,

_InterlockedCompareExchange128 intrinsic functions
; https://learn.microsoft.com/en-us/cpp/intrinsics/interlockedcompareexchange128

일반적인 Win32 DLL과 무관하게 사용할 수 있습니다. 대충 예제는 다음과 같이 구현할 수 있는데요,

#include <windows.h>
#include <iostream>

typedef struct _LARGE_INTEGER_128 {
    __int64 Int[2];
} LARGE_INTEGER_128, * PLARGE_INTEGER_128;

int main()
{
    LARGE_INTEGER_128 value = { 0, 0 };

    LARGE_INTEGER_128 newValue = { 1, 0 };

    LARGE_INTEGER_128 comparand = { 0, 0 };

    BOOLEAN result = InterlockedCompareExchange128((LONG64*)&value,
        newValue.Int[1], newValue.Int[0], (LONG64*)&comparand);
    if (result == TRUE)
    {
        std::cout << "a = " << value.Int[1] << "," << value.Int[0] << std::endl;
    }

    return 0;
}

그런데, 위의 예제를 실행해 보면 (아마도 확률적으로, 제 경우에는 100%) 비정상 종료를 하게 될 것입니다. 또는, Visual Studio 디버거 내에서 실행하면 이런 오류를 만나게 될 텐데요,

Exception thrown: read access violation.
value.**Int** was 0xFFFFFFFFFFFFFFFF.

이에 대한 단서를 문서에서 찾을 수 있습니다.

The parameters for this function must be aligned on a 16-byte boundary; otherwise, the function will behave unpredictably on x64 systems. See _aligned_malloc.


실제로 문제가 발생했을 때의 value 변수 또는 comparand의 주소를 보면 이런 식일 것입니다. (이후 테스트 결과로 보면, comparand는 8바이트 정렬 주소여도 문제가 없습니다.)

+       value   {Int=0x000000a39abaf918 {0, 0} }    _LARGE_INTEGER_128
+       comparand   {Int=0x000000a39abaf978 {0, 0} }    _LARGE_INTEGER_128

즉, 8바이트 정렬을 하고 있는 것입니다. 이를 해결하기 위해서는 명시적으로 16바이트 정렬을 하라고 지정하는 방법이 있습니다.

typedef struct _LARGE_INTEGER_128 {
    __declspec(align(16)) __int64 Int[2];
} LARGE_INTEGER_128, * PLARGE_INTEGER_128;

이후 정상적으로 실행하는 것을 확인할 수 있습니다.




한 가지 재미있는 점은, Visual Studio 편집기에서 해당 변수에 대해 다음과 같은 경고를 보여준다는 점입니다.

cmp_exch_aligned_1.png

C28113: Accessing a local variable value via an interlocked function: This is an unusual usage which could be reconsidered.

로컬 변수를 사용하는 것이 부적절할 수 있다는 것인데요, 문서를 보면 Device Driver 환경에 대한 경고로 보이는 메시지를 담고 있는데, 그럼에도 로컬 변수가 아닌 전역 변수로 바꿔보면 비정상 종료를 하지 않게 됩니다.

LARGE_INTEGER_128 g_value = { 0, 0 };

int main()
{
    // ...[생략]...

    BOOLEAN result = InterlockedCompareExchange128((LONG64*)&g_value,
        newValue.Int[1], newValue.Int[0], (LONG64*)&comparand);
    // ...[생략]...

    return 0;
}

그리고 이때의 주소를 보면,

+       g_value {Int=0x00007ff663e9e1b0 {0, 0} }    _LARGE_INTEGER_128

당연하게도 16바이트 정렬이 된 위치에 변수가 있습니다. Visual C++ 컴파일러는 이것을 언제나 보장하는 것일까요? (혹시 아시는 분은 덧글 부탁드립니다.) 그래도 은근히 걱정되니 ^^ 저라면 __declspec(align(16)) 옵션을 꼭 지정할 것 같습니다.




참고로, 전역 변수의 경우 일부러 8바이트 정렬로 만들어 테스트를 해보면,

typedef struct _LARGE_INTEGER_128 {
    __int64 Int[4]; // 넉넉하게 잡고
} LARGE_INTEGER_128, * PLARGE_INTEGER_128;

// g_value == 전역 변수
LONG64* ptr = (LONG64*)(((BYTE*)&g_value) + 8); // 뒤로 8바이트를 밀어 16바이트 정렬을 깬 다음

// ...[생략]...

BOOLEAN result = InterlockedCompareExchange128(ptr,
    newValue.Int[1], newValue.Int[0], (LONG64*)&comparand);

예상한 대로 비정상 종료가 됩니다. 또한, 반대로 로컬 변수를 사용한 경우 일부러 16바이트 정렬을 시켜 테스트를 하면,

typedef struct _LARGE_INTEGER_128 {
    __int64 Int[4]; // 넉넉하게 잡고
} LARGE_INTEGER_128, * PLARGE_INTEGER_128;

LARGE_INTEGER_128 value = { 0, 0 }; // 로컬 변수

// ...[생략]...

LONG64* ptr = (LONG64*)(((BYTE*)&value) + 8); // 뒤로 8바이트를 밀어 일부러 16바이트로 정렬

BOOLEAN result = InterlockedCompareExchange128(ptr,
    newValue.Int[1], newValue.Int[0], (LONG64*)&comparand);

정상적으로 실행이 됩니다. 결국, 첫 번째 인자만 128비트 정렬을 만족하면 해당 함수는 정상적으로 동작합니다.




마치기 전에 테스트할 것이 하나 더 생각나는군요. ^^ InterlockedCompareExchange64의 경우 (요즘의 컴퓨터에서) 로컬 변수로 해도 저런 align 문제는 없습니다. 예를 들어, 다음과 같이 일부러 align을 4바이트 경계로 바꿔도,

#include <windows.h>
#include <iostream>

int main()
{
    __int64 value[2] = { 0, 0 };
    __int64 *ptr = (__int64*)(((BYTE*)value) + 4); // 4바이트 경계로 이동

    __int64 newValue = 1;

    __int64 comperand = 0;

    __int64 result = InterlockedCompareExchange64(ptr, newValue, comperand);
    std::cout << "result = " << result << ", value == " << value[0] << ", " << value[1] << std::endl; // 출력 결과: result = 0, value == 4294967296, 0

    return 0;
}

crash 없이 정상적으로 실행이 됩니다. 문서에 보면,

The variables for this function must be aligned on a 64-bit boundary; otherwise, this function will behave unpredictably on multiprocessor x86 systems and any non-x86 systems. See _aligned_malloc.


64비트 경계가 지켜져야 한다고는 하지만, (x64가 아닌) 32비트 시스템인 x86인 경우에만 문제가 된다고 나옵니다. (요즘에는 재현하기조차 힘든 상황이 되었습니다.)




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 6/13/2025]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




1  2  3  4  5  6  7  [8]  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
13779정성태10/22/20245598개발 환경 구성: 729. WSL 2 - Mariner VM 커널 이미지 업데이트 방법
13778정성태10/21/20247121C/C++: 181. C/C++ - 소스코드 파일의 인코딩, 바이너리 모듈 상태의 인코딩
13777정성태10/20/20245554Windows: 265. Win32 API의 W(유니코드) 버전은 UCS-2일까요? UTF-16 인코딩일까요?
13776정성태10/19/20246584C/C++: 180. C++ - 고수준 FILE I/O 함수에서의 Unicode stream 모드(_O_WTEXT, _O_U16TEXT, _O_U8TEXT)파일 다운로드1
13775정성태10/19/20246617개발 환경 구성: 728. 윈도우 환경의 개발자를 위한 UTF-8 환경 설정
13774정성태10/18/20246181Linux: 91. Container 환경에서 출력하는 eBPF bpf_get_current_pid_tgid의 pid가 존재하지 않는 이유
13773정성태10/18/20245969Linux: 90. pid 네임스페이스 구성으로 본 WSL 2 + docker-desktop
13772정성태10/17/20246192Linux: 89. pid 네임스페이스 구성으로 본 WSL 2 배포본의 계층 관계
13771정성태10/17/20245932Linux: 88. WSL 2 리눅스 배포본 내에서의 pid 네임스페이스 구성
13770정성태10/17/20246397Linux: 87. ps + grep 조합에서 grep 명령어를 사용한 프로세스를 출력에서 제거하는 방법
13769정성태10/15/20247515Linux: 86. Golang + bpf2go를 사용한 eBPF 기본 예제파일 다운로드1
13768정성태10/15/20246789C/C++: 179. C++ - _O_WTEXT, _O_U16TEXT, _O_U8TEXT의 Unicode stream 모드파일 다운로드2
13767정성태10/14/20245699오류 유형: 929. bpftrace 수행 시 "ERROR: Could not resolve symbol: /proc/self/exe:BEGIN_trigger"
13766정성태10/14/20245174C/C++: 178. C++ - 파일에 대한 Text 모드의 "translated" 동작파일 다운로드1
13765정성태10/12/20246426오류 유형: 928. go build 시 "package maps is not in GOROOT" 오류
13764정성태10/11/20247007Linux: 85. Ubuntu - 원하는 golang 버전 설치
13763정성태10/11/20245926Linux: 84. WSL / Ubuntu 20.04 - bpftool 설치
13762정성태10/11/20246092Linux: 83. WSL / Ubuntu 22.04 - bpftool 설치
13761정성태10/11/20245791오류 유형: 927. WSL / Ubuntu - /usr/include/linux/types.h:5:10: fatal error: 'asm/types.h' file not found
13760정성태10/11/20246921Linux: 82. Ubuntu - clang 최신(stable) 버전 설치
13759정성태10/10/20247944C/C++: 177. C++ - 자유 함수(free function) 및 주소 지정 가능한 함수(addressable function) [6]
13758정성태10/8/20246633오류 유형: 926. dotnet tools를 sudo로 실행하는 경우 command not found
13757정성태10/8/20246921닷넷: 2306. Linux - dotnet tool의 설치 디렉터리가 PATH 환경변수에 자동 등록이 되는 이유
13756정성태10/8/20247110오류 유형: 925. ssh로 docker 접근을 할 때 "... malformed HTTP status code ..." 오류 발생
13755정성태10/7/20247679닷넷: 2305. C# 13 - (9) 메서드 바인딩의 우선순위를 지정하는 OverloadResolutionPriority 특성 도입 (Overload resolution priority)파일 다운로드1
13754정성태10/4/20246768닷넷: 2304. C# 13 - (8) 부분 메서드 정의를 속성 및 인덱서에도 확대파일 다운로드1
1  2  3  4  5  6  7  [8]  9  10  11  12  13  14  15  ...