Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 

linux - lldb를 이용한 .NET Core 응용 프로그램의 메모리 덤프 분석 방법

리눅스에서 닷넷 프로세스의 메모리 덤프를 떴으면,

.NET Core 응용 프로그램을 위한 메모리 덤프 방법
; https://www.sysnet.pe.kr/2/0/12078

이제 분석을 해야 하는데요. 리눅스 용 덤프 파일은, 리눅스 운영체제 상에서 lldb를 이용해 분석할 수 있습니다.

Debugging .NET Core on Linux with LLDB
; https://www.raydbg.com/2018/Debugging-Net-Core-on-Linux-with-LLDB/

lldb + sos 확장 명령어 관련한 기본적인 사용법은 이미 아래의 글을 통해 설명해 두었고.

Linux - lldb 환경에서 sos 확장 명령어를 이용한 닷넷 프로세스 디버깅
; https://www.sysnet.pe.kr/2/0/12075

Linux - lldb 환경에서 sos 확장 명령어를 이용한 닷넷 프로세스 디버깅 - 배포 방법에 따른 차이
; https://www.sysnet.pe.kr/2/0/12076




유형을 나눠서, 우선 덤프 파일을 뜬 그 PC에서 분석을 해보겠습니다. lldb 실행 후,

[Centos 8]
$ /usr/local/bin/lldb-3.9.1 

[Ubuntu 18.04]
$ lldb-3.9

libsosplugin.so 플러그인을 로드하는 것과 setclrpath를 지정하는 것은 지난 글(1, 2)에서 설명한 규칙과 동일합니다.

(lldb) plugin load /usr/share/dotnet/shared/Microsoft.NETCore.App/2.2.7/libsosplugin.so

(lldb) setclrpath /home/tusr/corecorelin
Set load path for sos/dac/dbi to '/home/tusr/corecorelin/'

단지, 실행 중인 프로세스를 attach하는 것이 아닌, 덤프 파일을 여는 것이기 때문에 "target create"로 명령어만 바꿔 실행하면 됩니다.

(lldb) target create -c dotnet_time_2019-12-09_16:44:23.55130




하지만 현실적으로 봤을 때, 일반적으로 덤프 파일은 운영 서버에서 뜨고 개발자 PC로 복사한 후 분석하는 식이기 때문에 .NET Framework 때와 마찬가지로,

windbg 의 mscordacwks DLL 로드 문제 - 세 번째 이야기
; https://www.sysnet.pe.kr/2/0/11231

덤프 파일을 뜬 그 환경에 있는 libmscordaccore.so, libsos.so 파일을 함께 복사해야 합니다. 또한, 리눅스의 경우 libsos.so와 lldb의 교각 역할을 하는 libsosplugin.so도 필요하기 때문에 이것도 복사해야 하는데 (지난 글에 설명한 이유로 인해) 안전하게 .NET SDK가 설치된 폴더의 것들도 함께 복사하는 것이 좋습니다. (혹은 해당 버전의 .NET SDK를 lldb 분석을 수행할 PC에 설치합니다.)

따라서, 기본적인 덤프 분석을 위해서는 다음의 파일들이 있어야 합니다.

덤프 파일 (예: dotnet_time_2019-12-09_16:44:23.55130)
libmscordaccore.so
libsosplugin.so
libsos.so

다른 컴퓨터에서 분석한다는 점으로 인해 또 하나 고려해야 할 사항이 있는데요, 같은 PC에서 분석하는 거라면 덤프 파일 로드를 lldb의 "target create"로 하게 되지만, 이것을 다른 PC에서 수행하는 경우라면,

$ /usr/local/bin/lldb-3.9.1 
(lldb) target create -c test.dmp
Core file '/home/tusr/temp/test.dmp' (x86_64) was loaded.

(lldb) plugin load libsosplugin.so

(lldb)  setclrpath .
Set load path for sos/dac/dbi to './'

sos 확장 명령어 수행 시 다음과 같은 식의 오류가 발생할 수 있습니다.

(lldb) clrstack
Failed to load data access DLL, 0x80004005
Can not load or initialize libmscordaccore.so. The target runtime may not be initialized.
ClrStack  failed

말 그대로 현재 로드된 덤프 파일로부터는 .NET 런타임을 알 수 없다는 건데 실제로 이미지 목록을 보면,

(lldb) image list
[  0] 50089E85-080B-EEA9-7A2C-01E8CBBB7723-31C8B461                    /usr/share/dotnet/dotnet 

정상적으로 모듈 정보를 구하지 못하고 있습니다. 비교를 위해 덤프를 뜬 PC에서 "image list" 명령을 수행하면 해당 프로세스 공간에 로드된 모듈 정보를 이렇게 확인할 수 있습니다.

(lldb) image list
[  0] 46BD32F2-D61A-2A48-2BDB-4A2B0787F8DF-39ECF703                    /usr/share/dotnet/dotnet 
[  1] D1AA3951-3462-B997-B990-85F995A37B71-714B8370 0x00007ffca1366000 [vdso] (0x00007ffca1366000)
[  2] D1AA3951-3462-B997-B990-85F995A37B71-714B8370 0x00007ffca1366000 linux-vdso.so.1 (0x00007ffca1366000)
...[생략]...
[ 73] 4B80C543-356E-E0AF-9039-EFE7C9EA1CC1-F74C426A                    /usr/lib/x86_64-linux-gnu/libhx509.so.5 
[ 74] A609DB07-7BDC-3B54-A8C6-4BBCF82C2B7B-D1CC8B98                    /usr/lib/x86_64-linux-gnu/libsqlite3.so.0 
[ 75] 810686AF-0D5F-D350-A4FB-1CC4B5AFF44A-05C102CB                    /lib/x86_64-linux-gnu/libcrypt.so.1 
      /usr/lib/debug/lib/x86_64-linux-gnu/libcrypt-2.27.so

이 문제를 해결하려면, 덤프를 뜬 PC에서 해당 프로세스의 실행 파일도 함께 복사해 와야 합니다. 그리고 그 프로세스 이미지 파일을 "target create" 명령어에 전달해야 합니다.

$ /usr/local/bin/lldb-3.9.1 

(lldb) target create "dotnet" --core "test.dmp"
Core file '/home/tusr/temp/test.dmp' (x86_64) was loaded.

정상적으로 lldb가 덤프 파일을 로드했다면 "image list" 명령어도 잘 동작하고, 이후의 libsosplugin.so, setclrpath 명령어와 함께 일련의 sos 확장 명령어가 정상적으로 실행이 됩니다.

(lldb) plugin load libsosplugin.so

(lldb)  setclrpath .
Set load path for sos/dac/dbi to './'


(lldb) clrstack
OS Thread Id: 0x2691 (1)
        Child SP               IP Call Site
00007FFCA12E0F20 00007faf7ee479f3 [GCFrame: 00007ffca12e0f20] 
00007FFCA12E1010 00007faf7ee479f3 [HelperMethodFrame_1OBJ: 00007ffca12e1010] System.Threading.Monitor.ObjWait(Boolean, Int32, System.Object)
00007FFCA12E1140 00007FAF0628646D Error: Fail to initialize CoreCLR 80004005
System.Threading.ManualResetEventSlim.Wait(Int32, System.Threading.CancellationToken)
00007FFCA12E11D0 00007FAF06285E4C System.Threading.Tasks.Task.SpinThenBlockingWait(Int32, System.Threading.CancellationToken)
00007FFCA12E1230 00007FAF06285BEC System.Threading.Tasks.Task.InternalWait(Int32, System.Threading.CancellationToken)
00007FFCA12E12F0 00007FAF062859D9 System.Runtime.CompilerServices.TaskAwaiter.HandleNonSuccessAndDebuggerNotification(System.Threading.Tasks.Task)
00007FFCA12E1320 00007FAF0625721D Microsoft.AspNetCore.Hosting.WebHostExtensions.Run(Microsoft.AspNetCore.Hosting.IWebHost)
00007FFCA12E1340 00007FAF043504A0 CoreCoreLin.Program.Main(System.String[])
00007FFCA12E1630 00007faf7d47a307 [GCFrame: 00007ffca12e1630] 
00007FFCA12E1A40 00007faf7d47a307 [GCFrame: 00007ffca12e1a40] 




정리해 보면, 다른 PC에서 덤프 뜬 것을 분석하고 싶다면 안전하게 다음과 같은 파일들을 함께 복사해 와야 합니다.

1) dump file

2) libsosplugin.so
    - dotnet ...: /usr/share/dotnet/shared/Microsoft.NETCore.App/...[version].../libsosplugin.so
    - standalone: /...배포 폴더.../libsosplugin.so

3) libmscordaccore.so
    - /...배포 폴더.../libmscordaccore.so

4) libsos.so
    - /...배포 폴더.../libsos.so

5) executable binary
    - dotnet으로 실행한 경우: /usr/share/dotnet/dotnet
    - standalone인 경우: /...[배포 폴더].../...[실행 파일]...

6) libcoreclr.so
    - /...배포 폴더.../libcoreclr.so

^^; 좀 복잡한데요. 가능하면 이런 파일들을 그냥 압축해 주는 shell 스크립트나 프로그램을 하나 만들어 두는 것이 속 편할 것입니다.




현재(2019-12-17) procdump로 뜬 덤프 파일에 대해 lldb의 "target create" 명령 시 아무런 동작을 하지 않습니다. 이에 관해서는 .NET Core 2.1 관련 이슈가 있는데요,

LLDB hangs in Linux when opening a dotnet core 2.1 dump #79
; https://github.com/dotnet/diagnostics/issues/79

이 때문에라도 procdump보다는 createdump를 사용하는 것이 좋습니다.

$ sudo $(find /usr/share/dotnet -name createdump) -u 19234
Writing full dump to file /tmp/coredump.27581
Written 22551396352 bytes (5505712 pages) to core file

위의 스크립트에서 좀 더 하드 코딩을 없애고 싶다면!

$ readlink -f $(which dotnet)
/usr/share/dotnet/dotnet

$ dirname $(readlink -f $(which dotnet))
/usr/share/dotnet

$ find $(dirname $(readlink -f $(which dotnet))) -name createdump
/usr/share/dotnet/shared/Microsoft.NETCore.App/2.2.5/createdump

$ $(find $(dirname $(readlink -f $(which dotnet))) -name createdump) -u 19234




참고로, 간혹 (저처럼 ^^) 덤프 파일 로드하는 것을 깜빡 잊고 sos 확장 명령어를 수행했다가,

$ lldb-3.9

(lldb) plugin load /usr/share/dotnet/shared/Microsoft.NETCore.App/2.2.7/libsosplugin.so

(lldb) setclrpath /home/tusr/corecorelin
Set load path for sos/dac/dbi to '/home/tusr/corecorelin/'

(lldb) clrstack
Failed to load data access DLL, 0x80004005
Can not load or initialize libmscordaccore.so. The target runtime may not be initialized.
ClrStack  failed

0x80004005가 왜 발생하는 지 이해가 안 돼 헤맬 수도 있을 것입니다.




마지막으로, (Windows 10 SDK에 포함된 최신 버전의) windbg는 리눅스에서 생성한 덤프 파일을 열면 다음과 같은 오류가 발생하지만,

Could not find the c:\temp\dotnet_time_2019-12-06_16_23_19.29310 Dump File, Win32 error 0n87

The parameter is incorrect.

Windbg Preview 버전으로는 이렇게 열립니다.

Microsoft (R) Windows Debugger Version 10.0.19494.1001 AMD64
Copyright (c) Microsoft Corporation. All rights reserved.


Loading Dump File [c:\temp\dotnet_time_2019-12-06_16_23_19.29310]
64-bit machine not using 64-bit API

************* Path validation summary **************
Response                         Time (ms)     Location
Deferred                                       srv*
OK                                             c:\symbols2
Deferred                                       SRV*c:\Symbols*https://msdl.microsoft.com/download/symbols
Symbol search path is: srv*;c:\symbols2;SRV*c:\Symbols*https://msdl.microsoft.com/download/symbols
Executable search path is: 
Generic Unix Version 0 UP Free x64
Machine Name:
System Uptime: not available
Process Uptime: not available
................................................................
................................................................

00007f85`18d679f3 ??              ???

심지어 lm과 같은 명령어도 통하는 걸로 봐서,

0:000> lm
start             end                 module name
00000000`00600000 00000000`00611000   dotnet     (deferred)             
00007f7f`e3fe4000 00007f7f`e3fee000   libcrypt_2_27   (deferred)             
00007f7f`e421c000 00007f7f`e4324000   libsqlite3_so_0_8   (deferred)             
00007f7f`e4525000 00007f7f`e456e000   libhx509_so_5_0   (deferred)             
...[생략]...
00007f85`16f20000 00007f85`16f2d000   libunwind_so_8_0   (deferred)             
00007f85`1713b000 00007f85`17143000   librt_2_27   (deferred)             
00007f85`17143000 00007f85`1782b000   libcoreclr   (deferred)             
00007f85`17a5c000 00007f85`17b26000   libhostpolicy   (deferred)             
00007f85`17d26000 00007f85`17dcf000   libhostfxr   (deferred)             
00007f85`17fcf000 00007f85`181bc000   libc_2_27   (deferred)             
00007f85`183c0000 00007f85`183d8000   libgcc_s_so   (deferred)             
00007f85`185d8000 00007f85`18776000   libm_2_27   (deferred)             
00007f85`18976000 00007f85`18b53000   libstdc___so_6_0   (deferred)             
00007f85`18d56000 00007f85`18d5a000   libdl_2_27   (deferred)             
00007f85`18f5a000 00007f85`18f75000   libpthread_2_27   (deferred)             
00007f85`18f79000 00007f85`18fa2000   ld_2_27    (deferred)             

아마도 windbg 나름대로 리눅스 용 덤프 분석도 지원하는 방향으로 노력하고 있는 듯합니다. 위에서 특이한 점이 있다면, lldb의 경우 "target create"로 덤프 파일을 로드 시 반드시 대상 프로세스 이미지를 인자로 전달해야 했지만, windbg의 경우 lm 명령어는 그런 이미지가 없이도 로드된 모듈 목록을 잘 해석하고 있습니다.

하지만, 닷넷 개발자에게 있어 가장 중요한 sos.dll이나 mscordaccore.dll 등의 확장 모듈들은 모두 유닉스 ELF 포맷으로 빌드된 것이기 때문에,

libmscordaccore.so
libsos.so

당연히 로드가 되지 않습니다.

0:000> .load c:\temp\libsos.so
The call to LoadLibrary(f:\ts\libsos.so) failed, Win32 error 0n193
    "%1 is not a valid Win32 application."
Please check your debugger configuration and/or network access.

0:000> .cordll -lp c:\temp
CLR DLL status: No load attempts

참고로, 비주얼 스튜디오 역시 리눅스 용 덤프 파일은 "Debugging older format crashdumps is not supported"라는 식의 오류를 내며 지원하지 않습니다.




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]





[최초 등록일: ]
[최종 수정일: 12/18/2019 ]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer@outlook.com

비밀번호

댓글 쓴 사람
 



2019-12-18 03시13분
Ubuntu 환경에서 .NET Core 어플리케이션의 crash core dump 분석 가이드
; https://blogs.msdn.microsoft.com/kocssdva/2017/12/13/01_ubuntu_netcore_crashcoredump/
정성태
2020-07-13 08시59분
WinDbg debugger tool updated with several new improvements
  - Support for AMD64 and Linux kernel dump debugging
; https://mspoweruser.com/windbg-debugger-tool-microsoft-store-update/
정성태

1  2  3  4  5  6  [7]  8  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
12227정성태6/12/20203305오류 유형: 616. Visual Studio의 느린 업데이트 속도에 대한 원인 분석 [5]
12226정성태6/19/2020500개발 환경 구성: 493. OpenVPN의 네트워크 구성파일 다운로드1
12225정성태6/11/2020522개발 환경 구성: 492. 윈도우에 OpenVPN 설치 - 클라이언트 측 구성
12224정성태6/11/20201087개발 환경 구성: 491. 윈도우에 OpenVPN 설치 - 서버 측 구성
12223정성태6/9/2020697.NET Framework: 908. C# - Source Generator 소개 [3]파일 다운로드1
12222정성태6/3/2020339VS.NET IDE: 146. error information: "CryptQueryObject" (-2147024893/0x80070003)
12221정성태9/24/2020351Windows: 170. 비어 있지 않은 디렉터리로 symbolic link(junction) 연결하는 방법
12220정성태6/3/2020374.NET Framework: 907. C# DLL로부터 TLB 및 C/C++ 헤더 파일(TLH)을 생성하는 방법
12219정성태6/1/2020585.NET Framework: 906. C# - lock (this), lock (typeof(...))를 사용하면 안 되는 이유파일 다운로드1
12218정성태5/31/2020547.NET Framework: 905. C# - DirectX 게임 클라이언트 실행 중 키보드 입력을 감지하는 방법 [1]
12217정성태5/24/2020364오류 유형: 615. Transaction count after EXECUTE indicates a mismatching number of BEGIN and COMMIT statements. Previous count = 0, current count = 1.
12216정성태5/15/2020547.NET Framework: 904. USB/IP PROJECT를 이용해 C#으로 USB Keyboard 가상 장치 만들기
12215정성태5/12/20201381개발 환경 구성: 490. C# - (Wireshark의) USBPcap을 이용한 USB 패킷 모니터링파일 다운로드1
12214정성태5/5/2020454개발 환경 구성: 489. 정식 인증서가 있는 경우 Device Driver 서명하는 방법 (2) - UEFI/SecureBoot
12213정성태5/3/2020728개발 환경 구성: 488. (코드로 가상 USB 장치를 만들 수 있는) USB/IP PROJECT 소개
12212정성태5/1/2020398개발 환경 구성: 487. UEFI / Secure Boot 상태인지 확인하는 방법
12211정성태4/27/2020569개발 환경 구성: 486. WSL에서 Makefile로 공개된 리눅스 환경의 C/C++ 소스 코드 빌드
12210정성태4/20/2020791.NET Framework: 903. .NET Framework의 Strong-named 어셈블리 바인딩 (1) - app.config을 이용한 바인딩 리디렉션 [1]파일 다운로드1
12209정성태4/13/2020468오류 유형: 614. 리눅스 환경에서 C/C++ 프로그램이 Segmentation fault 에러가 발생한 경우 (2)
12208정성태4/12/2020571Linux: 29. 리눅스 환경에서 C/C++ 프로그램이 Segmentation fault 에러가 발생한 경우
12207정성태4/2/2020540스크립트: 19. Windows PowerShell의 NonInteractive 모드
12206정성태4/2/2020633오류 유형: 613. 파일 잠금이 바로 안 풀린다면? - The process cannot access the file '...' because it is being used by another process.
12205정성태4/2/2020496스크립트: 18. Powershell에서는 cmd.exe의 명령어를 지원하진 않습니다.
12204정성태4/1/2020424스크립트: 17. Powershell 명령어에 ';' (semi-colon) 문자가 포함된 경우
12203정성태3/18/2020753오류 유형: 612. warning: 'C:\ProgramData/Git/config' has a dubious owner: '...'.
12202정성태3/18/2020982개발 환경 구성: 486. .NET Framework 프로젝트를 위한 GitLab CI/CD Runner 구성
1  2  3  4  5  6  [7]  8  9  10  11  12  13  14  15  ...