Microsoft MVP성태의 닷넷 이야기
VC++: 80. 내 컴퓨터에서 C++ AMP 코드가 실행이 될까요? [링크 복사], [링크+제목 복사],
조회: 24450
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 

내 컴퓨터에서 C++ AMP 코드가 실행이 될까요?

공식 홈페이지를 보면,

C++ AMP Overview
; https://docs.microsoft.com/en-us/cpp/parallel/amp/cpp-amp-overview

시스템 요구 사항이 다음과 같이 나옵니다.

  • Windows 7, Windows 8, Windows Server 2008 R2, or Windows Server 2012
  • DirectX 11 Feature Level 11.0 or later hardware
  • For debugging on the software emulator, Windows 8 or Windows Server 2012 is required. For debugging on the hardware, you must install the drivers for your graphics card.

이런 거 보고 바로 알 수 있으면 좋겠지만 역시나 그냥 프로그램 돌려서 되냐 안되냐를 알 수 있는 것이 속편합니다. ^^ 이에 대해서는 다음의 글에 나오는 "VerifyAmpDevices" 유틸리티를 쓰시면 됩니다.

Can I Run C++ AMP on My Device?
; http://blogs.msdn.com/b/nativeconcurrency/archive/2011/09/22/can-i-run-c-amp-on-my-device.aspx

VerifyAmpDevices 유틸리티는 아래의 글에 포함된 list_all_accelerators() 함수를 이용해 쉽게 만들 수 있습니다.

Using accelerator and accelerator_view Objects
; https://docs.microsoft.com/en-us/cpp/parallel/amp/using-accelerator-and-accelerator-view-objects

뭐 대충 이런 식입니다.

#include "stdafx.h"

#include <amp.h>
#include <vector>
#include <amprt.h>

#include <iostream>

using namespace Concurrency;

// https://docs.microsoft.com/en-us/cpp/parallel/amp/using-accelerator-and-accelerator-view-objects
void list_all_accelerators();

int _tmain(int argc, _TCHAR* argv[])
{
    list_all_accelerators();

    return 0;
}

void list_all_accelerators()
{
    std::vector<accelerator> accs = accelerator::get_all();

    for (int i = 0; i < accs.size(); i++) {
        std::wcout << accs[i].device_path << ", desc = ";
        std::wcout << accs[i].description << ", has_display = ";
        std::wcout << accs[i].get_has_display() << ", is_emulated = ";
        std::wcout << accs[i].is_emulated << "\n";

        //std::wcout << accs[i].dedicated_memory << "\n";
        //std::wcout << (accs[i].supports_cpu_shared_memory ?
        //  "CPU shared memory: true" : "CPU shared memory: false") << "\n";
        //std::wcout << (accs[i].supports_double_precision ?
        //  "double precision: true" : "double precision: false") << "\n";
        //std::wcout << (accs[i].supports_limited_double_precision ?
        //  "limited double precision: true" : "limited double precision: false") << "\n\n";
    }
}

제 컴퓨터에서 위의 코드를 실행하면 다음과 같은 출력 결과가 나옵니다.

PCI\...[장치경로]..., desc = NVIDIA GeForce GTX 660  , has_display = 1, is_emulated = 0
direct3d\warp, desc = Microsoft Basic Render Driver, has_display = 0, is_emulated = 1
direct3d\ref, desc = Software Adapter, has_display = 1, is_emulated = 1
cpu, desc = CPU accelerator, has_display = 0, is_emulated = 1

당연히 is_emulated = 0인 값의 장치가 가장 성능이 우수할 것입니다. 또한 has_display는 현재 모니터 장치와 연결된 것을 의미한다고 하는데, direct3d\ref가 has_display = 1을 갖는 의미가 뭔지는 해석이 안되는군요. ^^

참고로, 중간의 warp와 ref에 대해서는 다음의 글에 약간의 설명이 나옵니다.

concurrency::accelerator 
; http://www.danielmoth.com/Blog/concurrencyaccelerator.aspx

  • accelerator::direct3d_ref represents the reference rasterizer emulator that simulates a direct3d device on the CPU (in a very slow manner). This emulator is available on systems with Visual Studio installed and is useful for debugging. More on debugging in general in future posts. Example: accelerator acc(accelerator::direct3d_ref);
  • accelerator::direct3d_warp represents WARP which is the current CPU fallback. Example: accelerator acc(accelerator::direct3d_warp);

ref는 Visual Studio가 설치된 경우에 있으며 디버깅이 쉽다는 장점이 있다고 하니, 그렇다면 일반적인 컴퓨터라면 GPU 하나와 direct3d\ref, cpu 정도만 AMP 장치로 검색될 것입니다.

아래의 글도 읽어보면 좋을 듯 싶군요. ^^

Server environments and C++ AMP
; http://blogs.msdn.com/b/nativeconcurrency/archive/2012/06/21/server-environments-and-c-amp.aspx





[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 7/17/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2022-05-04 04시52분
VS2022부터 C++ AMP 공식 지원중단
; https://blog.naver.com/drvoss/222653027219
정성태

1  2  3  4  5  [6]  7  8  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
13793정성태10/28/20245150C/C++: 183. C++ - 윈도우에서 한글(및 유니코드)을 포함한 콘솔 프로그램을 컴파일 및 실행하는 방법
13792정성태10/27/20244643Linux: 99. Linux - 프로세스의 실행 파일 경로 확인
13791정성태10/27/20244903Windows: 267. Win32 API의 A(ANSI) 버전은 DBCS를 사용할까요?파일 다운로드1
13790정성태10/27/20244621Linux: 98. Ubuntu 22.04 - 리눅스 커널 빌드 및 업그레이드
13789정성태10/27/20244918Linux: 97. menuconfig에 CONFIG_DEBUG_INFO_BTF, CONFIG_DEBUG_INFO_BTF_MODULES 옵션이 없는 경우
13788정성태10/26/20244459Linux: 96. eBPF (bpf2go) - fentry, fexit를 이용한 트레이스
13787정성태10/26/20244980개발 환경 구성: 730. github - Linux 커널 repo를 윈도우 환경에서 git clone하는 방법 [1]
13786정성태10/26/20245221Windows: 266. Windows - 대소문자 구분이 가능한 파일 시스템
13785정성태10/23/20244985C/C++: 182. 윈도우가 운영하는 2개의 Code Page파일 다운로드1
13784정성태10/23/20245256Linux: 95. eBPF - kprobe를 이용한 트레이스
13783정성태10/23/20244864Linux: 94. eBPF - vmlinux.h 헤더 포함하는 방법 (bpf2go에서 사용)
13782정성태10/23/20244622Linux: 93. Ubuntu 22.04 - 커널 이미지로부터 커널 함수 역어셈블
13781정성태10/22/20244804오류 유형: 930. WSL + eBPF: modprobe: FATAL: Module kheaders not found in directory
13780정성태10/22/20245556Linux: 92. WSL 2 - 커널 이미지로부터 커널 함수 역어셈블
13779정성태10/22/20244851개발 환경 구성: 729. WSL 2 - Mariner VM 커널 이미지 업데이트 방법
13778정성태10/21/20245679C/C++: 181. C/C++ - 소스코드 파일의 인코딩, 바이너리 모듈 상태의 인코딩
13777정성태10/20/20244954Windows: 265. Win32 API의 W(유니코드) 버전은 UCS-2일까요? UTF-16 인코딩일까요?
13776정성태10/19/20245273C/C++: 180. C++ - 고수준 FILE I/O 함수에서의 Unicode stream 모드(_O_WTEXT, _O_U16TEXT, _O_U8TEXT)파일 다운로드1
13775정성태10/19/20245493개발 환경 구성: 728. 윈도우 환경의 개발자를 위한 UTF-8 환경 설정
13774정성태10/18/20245197Linux: 91. Container 환경에서 출력하는 eBPF bpf_get_current_pid_tgid의 pid가 존재하지 않는 이유
13773정성태10/18/20244884Linux: 90. pid 네임스페이스 구성으로 본 WSL 2 + docker-desktop
13772정성태10/17/20245162Linux: 89. pid 네임스페이스 구성으로 본 WSL 2 배포본의 계층 관계
13771정성태10/17/20245066Linux: 88. WSL 2 리눅스 배포본 내에서의 pid 네임스페이스 구성
13770정성태10/17/20245354Linux: 87. ps + grep 조합에서 grep 명령어를 사용한 프로세스를 출력에서 제거하는 방법
13769정성태10/15/20246120Linux: 86. Golang + bpf2go를 사용한 eBPF 기본 예제파일 다운로드1
13768정성태10/15/20245407C/C++: 179. C++ - _O_WTEXT, _O_U16TEXT, _O_U8TEXT의 Unicode stream 모드파일 다운로드2
1  2  3  4  5  [6]  7  8  9  10  11  12  13  14  15  ...