Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (seongtaejeong at gmail.com)
홈페이지
첨부 파일
 

Microsoft.ML.OnnxRuntimeGenAI 패키지 사용 시 "cublasLt64_12.dll" which is missing. (Error 126: "The specified module could not be found.") 오류

아래의 예제처럼,

C# - 카카오 카나나 모델 + Microsoft.ML.OnnxRuntimeGenAI 예제
; https://www.sysnet.pe.kr/2/0/13976

Microsoft.ML.OnnxRuntimeGenAI 패키지를 사용하는 경우 로컬 머신에 CUDA Toolkit과 cuDNN 라이브러리가 설치돼 있어야 합니다.

CUDA Toolkit Download
; https://developer.nvidia.com/cuda-toolkit

NVIDIA cuDNN
; https://developer.nvidia.com/cudnn

현재(2025-08-09) CUDA Toolkit은 13.0, cuDNNdms 9.12.0 버전이 최신인데요, 여기서 유의할 점은 OnnxRuntimeGenAI 패키지가 지원하는 CUDA 버전은 12.x 버전이라는 점입니다. 그래서 13.0 버전이 설치된 경우에는 이런 오류가 발생합니다.

Loading model from C:\foundry_cache\Microsoft\gpt-oss-20b-cuda-gpu\v1...Unhandled exception. Microsoft.ML.OnnxRuntimeGenAI.OnnxRuntimeGenAIException: D:\a\_work\1\s\onnxruntime\core\session\provider_bridge_ort.cc:1778 onnxruntime::ProviderLibrary::Get [ONNXRuntimeError] : 1 : FAIL : Error loading "c:\temp\builds\ConsoleApp2\AnyCPU\Debug\runtimes\win-x64\native\onnxruntime_providers_cuda.dll" which depends on "cublasLt64_12.dll" which is missing. (Error 126: "The specified module could not be found.")


이유는 알 수 없지만, cublasLt64_12.dll 파일은 12.x 버전에만 있습니다. 어쨌든, 아래의 링크를 방문해 12.x 버전을 다운로드하면 되는데 그 버전대의 마지막인 12.9 버전을 사용할 수 있습니다.

CUDA Toolkit 12.9 Downloads
; https://developer.nvidia.com/cuda-12-9-0-download-archive

CUDA Toolkit Archive
; https://developer.nvidia.com/cuda-toolkit-archive




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 8/13/2025]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




1  [2]  3  4  5  6  7  8  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
13975정성태7/23/20251691닷넷: 2347. C# 14 - (3) 형식 인자가 없는 제네릭 타입의 nameof 지원파일 다운로드1
13974정성태7/22/20251743닷넷: 2346. C# 14 - (2) Span 타입과 배열 간의 암시적 형변환파일 다운로드1
13973정성태7/21/20251544닷넷: 2345. C# - 배열 및 Span의 공변성파일 다운로드1
13972정성태7/21/20251501닷넷: 2344. C#의 Identity conversion 의미파일 다운로드1
13971정성태7/17/20251561닷넷: 2343. C# 14 - (1) 속성 구문에서 문맥 키워드로 추가되는 field 예약어파일 다운로드1
13970정성태7/17/20251510닷넷: 2342. C# 14 - (취소된 글)
13969정성태7/17/20251574닷넷: 2341. snap으로 설치한 .NET 리눅스 실행 환경
13968정성태7/16/20251428오류 유형: 969. lddtree - TypeError: 'type' object is not subscriptable
13967정성태7/16/20252075오류 유형: 968. snap으로 설치한 "dotnet run" 실행 시 "undefined symbol: _dl_audit_symbind_alt, version GLIBC_PRIVATE" 오류
13966정성태7/15/20252600디버깅 기술: 223. WinDbg - .kframes 명령어
13965정성태7/11/20251840오류 유형: 967. 디버깅 모드로 실행 시 "Could not find file 'C:\Program Files\IIS Express\Oracle.DataAccess.Common.Configuration.Section.xsd'" 예외
13964정성태7/10/20252913닷넷: 2340. C# - Win32 Multimedia Timer 주기파일 다운로드1
13963정성태7/8/20252407VS.NET IDE: 202. Visual Studio 2022 + Copilot 기본 사용법
13962정성태7/7/20252213스크립트: 79. 파이썬 - onnxruntime_genai에서 지원하지 않는 모델 사용
13961정성태7/5/20251914디버깅 기술: 222. WinDbg 분석 사례 - IISreset 시점에 w3wp.exe의 crash 발생
13960정성태7/3/20253267개발 환경 구성: 752. ProcDump - C/C++ 예외 코드 필터를 지정한 덤프 생성 [2]
13959정성태6/25/20252146오류 유형: 966. Ubuntu - ping: connect: Network is unreachable
13958정성태6/21/20252902닷넷: 2339. C# - Phi-4-multimodal 모델의 GPU 가속 방법 (ORT 사용)파일 다운로드1
13957정성태6/20/20253411닷넷: 2338. C# / Foundry Local - Phi-4-multimodal 모델을 사용하는 방법 [1]
13956정성태6/19/20253255개발 환경 구성: 751. Triton Inference Server의 Python Backend 프로세스
13955정성태6/18/20253173오류 유형: 965. Hugging Face 모델 다운로드 시 "requests.exceptions.HTTPError: 401 Client Error: Unauthorized for url: ..." 오류
13954정성태6/18/20252526닷넷: 2337. C# - Hugging Face에 공개된 LLM 모델을 Foundry Local에서 사용하는 방법파일 다운로드1
13953정성태6/16/20252463스크립트: 78. 파이썬 - 소스 코드의 파일 경로를 지정한 모듈 로드
13952정성태6/15/20252832닷넷: 2336. C# - IValueTaskSource로 인해 주의가 필요한 ValueTask 호출파일 다운로드1
13951정성태6/15/20252791오류 유형: 964. Outlook - 일정이 "You cannot make changes to contents of this read-only folder." 오류 메시지로 삭제가 안 되는 경우
13950정성태6/12/20253731닷넷: 2335. C# - 간단하게 구현해 보는 IValueTaskSource 예제파일 다운로드1
1  [2]  3  4  5  6  7  8  9  10  11  12  13  14  15  ...