Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 

(시리즈 글이 5개 있습니다.)
.NET Framework: 442. C# - 시스템의 CPU 사용량 및 프로세스(EXE)의 CPU 사용량 알아내는 방법
; https://www.sysnet.pe.kr/2/0/1684

Linux: 56. 리눅스 - /proc/pid/stat 정보를 이용해 프로세스의 CPU 사용량 구하는 방법
; https://www.sysnet.pe.kr/2/0/13215

Windows: 260. CPU 사용률을 나타내는 2가지 수치 - 사용량(Usage)과 활용률(Utilization)
; https://www.sysnet.pe.kr/2/0/13582

Windows: 261. CPU Utilization이 100% 넘는 경우를 성능 카운터로 확인하는 방법
; https://www.sysnet.pe.kr/2/0/13583

닷넷: 2233. C# - 프로세스 CPU 사용량을 나타내는 성능 카운터와 Win32 API
; https://www.sysnet.pe.kr/2/0/13589




리눅스 - /proc/pid/stat 정보를 이용해 프로세스의 CPU 사용량 구하는 방법

아래의 글에 보면,

Calculate the Total CPU Usage of a Process From /proc/pid/stat
; https://www.baeldung.com/linux/total-process-cpu-usage

다음과 같은 스크립트를 소개하고 있습니다.

#!/bin/bash
PID=$1
if [ -z "$PID" ]; then
    echo Usage: $0 PID
    exit 1
fi

PROCESS_STAT=($(sed -E 's/\([^)]+\)/X/' "/proc/$PID/stat"))
PROCESS_UTIME=${PROCESS_STAT[13]}
PROCESS_STIME=${PROCESS_STAT[14]}
PROCESS_STARTTIME=${PROCESS_STAT[21]}
SYSTEM_UPTIME_SEC=$(tr . ' ' </proc/uptime | awk '{print $1}')

CLK_TCK=$(getconf CLK_TCK)

let PROCESS_UTIME_SEC="$PROCESS_UTIME / $CLK_TCK"
let PROCESS_STIME_SEC="$PROCESS_STIME / $CLK_TCK"
let PROCESS_STARTTIME_SEC="$PROCESS_STARTTIME / $CLK_TCK"

let PROCESS_ELAPSED_SEC="$SYSTEM_UPTIME_SEC - $PROCESS_STARTTIME_SEC"
let PROCESS_USAGE_SEC="$PROCESS_UTIME_SEC + $PROCESS_STIME_SEC"
let PROCESS_USAGE="$PROCESS_USAGE_SEC * 100 / $PROCESS_ELAPSED_SEC"

echon TCK == ${CLK_TCK}, The PID $PID has spent ${PROCESS_UTIME_SEC}s in user mode, ${PROCESS_STIME_SEC}s in kernel mode. Total CPU usage is ${PROCESS_USAGE_SEC}s
echo The process has been running for ${PROCESS_ELAPSED_SEC}s. So, the process has used ${PROCESS_USAGE}% of CPU

그런데, 이게 좀 말이 안 됩니다. 프로세스가 구동된 시간(PROCESS_ELAPSED_SEC) 대비 CPU를 소비한 시간(PROCESS_USAGE_SEC)을 계산하고 있는데요, 그럼, 프로세스를 실행한 지 오래될수록 CPU 소비 시간이 줄어드는 계산밖에는 안 나옵니다. 그런데 달리 생각해 보면 말이 되기도 합니다. 프로세스가 실행된 이후로 시스템의 프로세스를 얼마나 소비했느냐를 알 수 있다는 것인데... 대개의 경우 별 쓸모없는 데이터에 불과합니다.

위와 같은 계산에 따르면, CPU 100%를 자주 치는 프로세스가 아닌 다음에야, 대부분의 경우 시간이 지날수록 출력 결과는 1%에 가까워지게 됩니다. 게다가 오래된 프로세스에 CPU 100%를 치는 코드를 돌려도 이미 지난 시간의 값이 크기 때문에 1%에서 2%로 가는 것조차 시간이 걸립니다. 실제로 위의 코드를 while 루프로 바꾸게 되면,

while [ -z "" ];
do
    sleep 1

    ...[생략]...
    echo The PID $PID has spent ${PROCESS_UTIME_SEC}s in user mode, ${PROCESS_STIME_SEC}s in kernel mode. Total CPU usage is ${PROCESS_USAGE_SEC}s
    echo The process has been running for ${PROCESS_ELAPSED_SEC}s. So, the process has used ${PROCESS_USAGE}% of CPU
done

화면에는 이런 식의 출력만 보게 됩니다.

The process has been running for 942s. So, the process has used 1% of CPU
TCK == 100, The PID 21702 has spent 8s in user mode, 9s in kernel mode. Total CPU usage is 17s
The process has been running for 943s. So, the process has used 1% of CPU
TCK == 100, The PID 21702 has spent 8s in user mode, 9s in kernel mode. Total CPU usage is 17s
The process has been running for 944s. So, the process has used 1% of CPU
TCK == 100, The PID 21702 has spent 8s in user mode, 9s in kernel mode. Total CPU usage is 17s
The process has been running for 945s. So, the process has used 1% of CPU
TCK == 100, The PID 21702 has spent 8s in user mode, 9s in kernel mode. Total CPU usage is 17s
The process has been running for 946s. So, the process has used 1% of CPU




그렇다면, 위의 코드를 우리가 잘 알고 있는 "작업 관리자"처럼, 혹은 "top"처럼 보고 싶다면 어떻게 해야 할까요? ^^

방법은 예전에 설명한 윈도우의 CPU 사용량과 유사합니다.

C# - 시스템의 CPU 사용량 및 프로세스(EXE)의 CPU 사용량 알아내는 방법
; https://www.sysnet.pe.kr/2/0/1684

즉, 시간 차에 따른 증가량을 CPU 사용량으로 보면 되는 건데요, 이를 위해 위의 코드에서 /proc/[pid]/stat 파일로부터 구한 user(PROCESS_UTIME), kernel(PROCESS_STIME) 시간을 1초마다 바뀐 차이를 계산하면 됩니다.

#!/bin/bash
# proc_cpu.sh

let OLD_PROCESS_TIME=0

while [ -z "" ];
do
    sleep 1
    
    PROCESS_STAT=($(sed -E 's/\([^)]+\)/X/' "/proc/$PID/stat"))
    PROCESS_UTIME=${PROCESS_STAT[13]}
    PROCESS_STIME=${PROCESS_STAT[14]}
    
    let PROCESS_TIME="$PROCESS_UTIME + $PROCESS_STIME"
    if [ $OLD_PROCESS_TIME -eq 0 ]; then
        OLD_PROCESS_TIME=$PROCESS_TIME
        continue
    fi
   
    let ELAPSED="$PROCESS_TIME - $OLD_PROCESS_TIME"
    OLD_PROCESS_TIME=$PROCESS_TIME
    
    echo $ELAPSED
done
/* 출력 결과
0
4
0
...[생략]...
*/

저 값은 CLK_TCK가 반영된 것이니 이 값을 정식으로는 다음과 같이 계산한 다음,

x = $ELAPSED / $CLK_TCK 

퍼센트로 바꾸기 위해 이렇게 계산하면,

usage = x * 100 / 1(초)

바로 저 값이 프로세스의 CPU 사용률이 됩니다. 그런데, 대개의 경우 $CLK_TCK가 100이기 때문에 $ELAPSED 자체가 백분율로 된 값으로 나옵니다.




그런데, 실제로 저렇게 구한 값을 top과 비교해 보면 좀 맞지 않습니다.

[1초마다 $ELAPSED]
0, 0, 5, 0, 0, 3, 0, 0, 4

[top에서 보이는 값]
대체로 1.0 ~ 1.3 정도의 값

도대체 무슨 차이일까요? 위의 테스트에 사용한 응용 프로그램은 CPU 사용을 약 1초마다 한 번씩 하고 있습니다. 실제로 /proc/pid/stat 파일의 값 변화를 체크해 봐도 그렇게 나옵니다.

그리고 왠지 top의 화면 변화는 약 3초로 보이는데요, 그래서 -d 옵션을 줘서 top을 1초 갱신으로 다시 실행해 보면,

linux_cpu_usage_1.png

거의 동일한 값을 보여주고 있습니다. 그러니까 결국 top은 /proc/pid/stat 값의 변화를 설정된 refresh 주기로 나눠서 "%CPU"에 보여주는 것이었습니다. 그렇기 때문에 기본 refresh 주기인 3초마다 나온 5, 3, 4의 값을 3으로 나눈 1.0 ~ 1.3 정도의 값이 나온 것입니다.

정리해 보면, 여러분들이 /proc/pid/stat을 이용해 CPU 사용량을 구하는 경우 차등 값을 사용해야 CPU 사용량을 구할 수 있습니다. 대개의 경우, 차등 값은 1초마다 구하게 될 텐데요, 그런 경우 (기본) 3초마다 평균을 보여주는 리눅스의 top 명령어와는 결과가 다를 수 있다는 점만 알아두시면 되겠습니다.




참고로, /proc/pid/stat 파일의 갱신 주기는 어떻게 될까요? 아래의 Q&A 글에 보면,

/proc/[pid]/stat refresh period
; https://stackoverflow.com/questions/31219317/proc-pid-stat-refresh-period

문서를 인용하며, OS/kernel 데이터가 바뀌는 순간에 바로 반영된다고 하니 아마도 CPU 사용량의 경우라면 이상적인 경우 시스템 타이머의 주기에 맞춰 바뀔 듯합니다. 예를 들어, CPU 100%를 소비하는 예제를 실행한 다음 위의 proc_cpu.sh을 사용하면 구하는 시간마다 값이 바뀌는 것을 볼 수 있습니다. 반면, CPU를 거의 사용하지 않으면 해당 파일도 바뀌지 않은 채로 그 시간만큼 유지됩니다.





[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 10/13/2023]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2023-03-20 10시30분
파이썬 시스템 정보 확인 방법 (CPU, MEMORY, DISK)
; https://blog.naver.com/cjinnnn/223047217336
정성태

... [61]  62  63  64  65  66  67  68  69  70  71  72  73  74  75  ...
NoWriterDateCnt.TitleFile(s)
12102정성태1/6/202011762디버깅 기술: 152. User 권한(Ring 3)의 프로그램에서 _ETHREAD 주소(및 커널 메모리를 읽을 수 있다면 _EPROCESS 주소) 구하는 방법
12101정성태1/5/202011106.NET Framework: 876. C# - PEB(Process Environment Block)를 통해 로드된 모듈 목록 열람
12100정성태1/3/20209130.NET Framework: 875. .NET 3.5 이하에서 IntPtr.Add 사용
12099정성태1/3/202011428디버깅 기술: 151. Windows 10 - Process Explorer로 확인한 Handle 정보를 windbg에서 조회 [1]
12098정성태1/2/202011020.NET Framework: 874. C# - 커널 구조체의 Offset 값을 하드 코딩하지 않고 사용하는 방법 [3]
12097정성태1/2/20209586디버깅 기술: 150. windbg - Wow64, x86, x64에서의 커널 구조체(예: TEB) 구조체 확인
12096정성태12/30/201911601디버깅 기술: 149. C# - DbgEng.dll을 이용한 간단한 디버거 제작 [1]
12095정성태12/27/201912957VC++: 135. C++ - string_view의 동작 방식
12094정성태12/26/201911117.NET Framework: 873. C# - 코드를 통해 PDB 심벌 파일 다운로드 방법
12093정성태12/26/201911141.NET Framework: 872. C# - 로딩된 Native DLL의 export 함수 목록 출력파일 다운로드1
12092정성태12/25/201910562디버깅 기술: 148. cdb.exe를 이용해 (ntdll.dll 등에 정의된) 커널 구조체 출력하는 방법
12091정성태12/25/201912081디버깅 기술: 147. pdb 파일을 다운로드하기 위한 symchk.exe 실행에 필요한 최소 파일 [1]
12090정성태12/24/201910730.NET Framework: 871. .NET AnyCPU로 빌드된 PE 헤더의 로딩 전/후 차이점 [1]파일 다운로드1
12089정성태12/23/201911464디버깅 기술: 146. gflags와 _CrtIsMemoryBlock을 이용한 Heap 메모리 손상 여부 체크
12088정성태12/23/201910428Linux: 28. Linux - 윈도우의 "Run as different user" 기능을 shell에서 실행하는 방법
12087정성태12/21/201910895디버깅 기술: 145. windbg/sos - Dictionary의 entries 배열 내용을 모두 덤프하는 방법 (do_hashtable.py) [1]
12086정성태12/20/201912929디버깅 기술: 144. windbg - Marshal.FreeHGlobal에서 발생한 덤프 분석 사례
12085정성태12/20/201910625오류 유형: 586. iisreset - The data is invalid. (2147942413, 8007000d) 오류 발생 - 두 번째 이야기 [1]
12084정성태12/19/201911276디버깅 기술: 143. windbg/sos - Hashtable의 buckets 배열 내용을 모두 덤프하는 방법 (do_hashtable.py) [1]
12083정성태12/17/201912557Linux: 27. linux - lldb를 이용한 .NET Core 응용 프로그램의 메모리 덤프 분석 방법 [2]
12082정성태12/17/201912409오류 유형: 585. lsof: WARNING: can't stat() fuse.gvfsd-fuse file system
12081정성태12/16/201914140개발 환경 구성: 465. 로컬 PC에서 개발 중인 ASP.NET Core 웹 응용 프로그램을 다른 PC에서도 접근하는 방법 [5]
12080정성태12/16/201912050.NET Framework: 870. C# - 프로세스의 모든 핸들을 열람
12079정성태12/13/201913279오류 유형: 584. 원격 데스크톱(rdp) 환경에서 다중 또는 고용량 파일 복사 시 "Unspecified error" 오류 발생
12078정성태12/13/201913232Linux: 26. .NET Core 응용 프로그램을 위한 메모리 덤프 방법 [3]
12077정성태12/13/201912737Linux: 25. 자주 실행할 명령어 또는 초기 환경을 "~/.bashrc" 파일에 등록
... [61]  62  63  64  65  66  67  68  69  70  71  72  73  74  75  ...