Microsoft MVP성태의 닷넷 이야기
Linux: 77. C# / Linux - zombie process (defunct process) [링크 복사], [링크+제목 복사],
조회: 8092
글쓴 사람
정성태 (seongtaejeong at gmail.com)
홈페이지
첨부 파일

C# / Linux - zombie process (defunct process)

요즘 "리눅스 API의 모든 것, 기초 리눅스 API" 책을 보고 있습니다. Win32 API를 다루던 개발자에게는 리눅스를 그 수준으로 이해할 목적으로 좋은 책이라고 생각됩니다. ^^

그 책의 내용 중에 좀비 프로세스의 사례에 대해 26장 "자식 프로세스 감시"의 "26.2 고아와 좀비 프로세스" 절에서 상세하게 다루고 있는데요, 그중에서 735 페이지 예제 코드를 약간 변형해서 다음과 같이 작성해,

// https://broman.dev/download/The%20Linux%20Programming%20Interface.pdf#page=554

#include <stdlib.h>
#include <cstdio>
#include <signal.h>
#include <libgen.h>
#include <string.h>
#include <sys/wait.h>
#include <linux/limits.h>

int main(int argc, char *argv[])
{
    char cmd[PATH_MAX];
    pid_t childPid;

    setbuf(stdout, nullptr);
    printf("Parent PID=%ld\n", (long)getpid());

    switch (childPid = fork())
    {
    case -1:
        printf("fork\n");
        return 1;

    case 0:
        printf("Child (PID=%ld) exiting\n", (long)getpid());
        _exit(0);

    default:
        sleep(3);
        memset(cmd, 0, PATH_MAX);
        snprintf(cmd, PATH_MAX, "ps | grep ConsoleApplicat");
        system(cmd);

        wait(nullptr);
        printf("call wait()\n");
        system(cmd);
        
        return 0;
    }
}

실행하면 이런 결과가 나옵니다.

// Visual Studio 2022 C++ Console Application + WSL Ubuntu 20.04 LTS

Parent PID=1044695
Child (PID=1044787) exiting
1044695 ?        00:00:00 ConsoleApplicat
1044787 ?        00:00:00 ConsoleApplicat <defunct>
call wait()
1044695 ?        00:00:00 ConsoleApplicat

위의 예제 코드가 의도하는 것은, 부모가 "wait" 호출을 하지 않은 자식 프로세스는 좀비 프로세스가 된다는 것입니다. (이 외에 좀비 프로세스를 막기 위한 방법들이 있는데 그것은 책을 참조하세요. ^^)

보통 윈도우 운영체제에서는 자식 프로세스를 굳이 기다리지 않습니다. 물론, 자식 프로세스의 종료 시 성공 여부를 판단하기 위해 (C#이라면) WaitForExit 메서드를 호출하지만 *NIX에서는 wait을 호출해 주지 않으면 zombie process가 되는 것입니다.

그렇다면, .NET Core가 리눅스에서 실행할 때 자식 프로세스에 대해 wait을 호출해야 할까요?...라는 의문이 듭니다. 윈도우에서 프로그래밍하던 경험으로, 보통은 WaitForExit 메서드 호출을 하지 않고 넘어가는 경우도 많을 텐데 마이크로소프트가 wait에 의존했을지, 아니면 별도의 signal 처리를 했을지 궁금합니다.

확인 작업이 어렵지 않으니, 다음과 같은 코드로 곧바로 테스트할 수 있습니다. ^^

using System.Diagnostics;
using System.Runtime.InteropServices;

namespace ConsoleApp1;

internal class Program
{
    [DllImport("libc")]
    public static extern int system(string format);

    static int Main(string[] args)
    {
        if (args.Length == 1 && args[0] == "/child")
        {
            Console.WriteLine($"PID(child) == {Environment.ProcessId}");
            return 0;
        }
        else
        {
            Console.WriteLine($"PID(parent) == {Environment.ProcessId}");
        }

        ProcessStartInfo psi = new ProcessStartInfo();
        psi.FileName = Environment.ProcessPath;
        psi.Arguments = $"{nameof(ConsoleApp1)}.dll /child";
        psi.WorkingDirectory = Environment.CurrentDirectory;

        Process? proc = Process.Start(psi);
        if (proc == null)
        {
            Console.WriteLine($"not found: {psi.FileName}");
            return 2;
        }

        Thread.Sleep(3000); // 자식 프로세스가 종료하기를 대기

        system("ps"); // proc.WaitForExit()를 호출하지 않은 상태, 
                      // 즉, 아마도 wait을 하지 않은 상태
        
        return 0;
    }
}

위의 코드를 실행하면 이런 결과가 나오는데요,

PID(parent) == 1208
PID(child) == 1216
  PID TTY          TIME CMD
  834 pts/0    00:00:00 bash
 1208 pts/0    00:00:00 dotnet
 1224 pts/0    00:00:00 sh
 1225 pts/0    00:00:00 ps

defunct 프로세스가 없는 것으로 봐서, 아마도 .NET CLR 개발팀은 wait에 의존하지 않은 signal 처리를 별도로 하는 방식으로 구현하지 않았을까... 예상해 봅니다. ^^

(첨부 파일은 이 글의 예제 코드를 포함합니다.)




참고로, "리눅스 API의 모든 것, 기초 리눅스 API" 책이 의외로 번역 오류가 좀 있습니다. 예를 들어, 836 페이지에 다음과 같은 문구가 있는데요,

오직 백그라운드에 있는 프로세스만이 제어 터미널에서 읽을 수 있다.

웹상에서 원문을 찾아봤더니,

// https://broman.dev/download/The%20Linux%20Programming%20Interface.pdf#page=716

Only processes in the foreground job may read from the controlling terminal.

위와 같이 나옵니다. 아마도 순간적으로 머릿속에서 생각과 꼬여 오타가 난 것 같은데, 이런 사례가 좀 됩니다. 일례로, 아래의 "상수 집합 크기"는,

"888 페이지 번역"
RLIMIT_RSS: 상수 집합 크기(바이트, 구현되지 않음)

"원문"
// https://broman.dev/download/The%20Linux%20Programming%20Interface.pdf#page=757

RLIMIT_RSS: Resident set size (bytes; not implemented)

아마도 "상주 집합 크기"의 오타일 것입니다. (윈도우의 경우 Working set size)

그 외에도 읽으면서 뭔가 이상한 부분들이 있었는데 원문 찾아보기가 귀찮아서 넘어갔다가, 은근히 불편한 부분들이 계속 나오길래 원문이 필요하겠단 생각이 들어 이참에 찾아보니 다행히 저렇게 PDF로 제공돼 확인할 수 있었습니다.

그런 부분을 감안해 책을 읽긴 해야 하지만 그래도 리눅스 API를 이해하는 데 도움이 되는 책이라고 생각됩니다. ^^






[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 8/16/2024]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2024-11-21 08시55분
윈도우의 경우, 스레드 관련 자원을 완전히 회수하기 위해 Thread reaper라는 것이 있다고 합니다.

What is the thread reaper?
; https://devblogs.microsoft.com/oldnewthing/20231031-00/?p=108944

다른 자원과는 달리 스레드는, 종료 시 가능한 많은 자원을 정리하려 들지만 유일하게 "thread stack"만큼은 정리할 수 없다고 합니다. 왜냐하면, 그런 정리 작업 자체가 실행을 위해서는 그 스택을 필요로 하기 때문입니다.

따라서, 윈도우에서는 스레드 종료 시 thread reaper에게 그 사실을 알리고, 이후 thread reaper는 종료된 스레드의 스택 자원을 정리하는 절차를 밟게 됩니다.
정성태

... 46  47  48  49  50  51  [52]  53  54  55  56  57  58  59  60  ...
NoWriterDateCnt.TitleFile(s)
12637정성태5/10/202117752사물인터넷: 62. NodeMCU v1 ESP8266 보드의 A0 핀에 다중 아날로그 센서 연결 [1]
12636정성태5/10/202117962사물인터넷: 61. NodeMCU v1 ESP8266 보드의 A0 핀 사용법 - FSR-402 아날로그 압력 센서 연동파일 다운로드1
12635정성태5/9/202116310기타: 81. OpenTabletDriver를 (관리자 권한으로 실행하지 않고도) 관리자 권한의 프로그램에서 동작하게 만드는 방법
12634정성태5/9/202114793개발 환경 구성: 572. .NET에서의 필수 무결성 제어 - 외부 Manifest 파일을 두는 방법파일 다운로드1
12633정성태5/7/202117721개발 환경 구성: 571. UAC - 관리자 권한 없이 UIPI 제약을 없애는 방법
12632정성태5/7/202118932기타: 80. (WACOM도 지원하는) Tablet 공통 디바이스 드라이버 - OpenTabletDriver
12631정성태5/5/202117763사물인터넷: 60. ThingSpeak 사물인터넷 플랫폼에 ESP8266 NodeMCU v1 + 조도 센서 장비 연동파일 다운로드1
12630정성태5/5/202118530사물인터넷: 59. NodeMCU v1 ESP8266 보드의 A0 핀 사용법 - CdS Cell(GL3526) 조도 센서 연동파일 다운로드1
12629정성태5/5/202120270.NET Framework: 1057. C# - CoAP 서버 및 클라이언트 제작 (UDP 소켓 통신) [1]파일 다운로드1
12628정성태5/4/202118188Linux: 39. Eclipse 원격 디버깅 - Cannot run program "gdb": Launching failed
12627정성태5/4/202118288Linux: 38. 라즈베리 파이 제로 용 프로그램 개발을 위한 Eclipse C/C++ 윈도우 환경 설정
12626정성태5/3/202118387.NET Framework: 1056. C# - Thread.Suspend 호출 시 응용 프로그램 hang 현상 (2)파일 다운로드1
12625정성태5/3/202116874오류 유형: 714. error CS5001: Program does not contain a static 'Main' method suitable for an entry point
12624정성태5/2/202121337.NET Framework: 1055. C# - struct/class가 스택/힙에 할당되는 사례 정리 [10]파일 다운로드1
12623정성태5/2/202117670.NET Framework: 1054. C# 9 최상위 문에 STAThread 사용 [1]파일 다운로드1
12622정성태5/2/202113509오류 유형: 713. XSD 파일을 포함한 프로젝트 - The type or namespace name 'TypedTableBase<>' does not exist in the namespace 'System.Data'
12621정성태5/1/202118407.NET Framework: 1053. C# - 특정 레지스트리 변경 시 알림을 받는 방법 [1]파일 다운로드1
12620정성태4/29/202121526.NET Framework: 1052. C# - 왜 구조체는 16 바이트의 크기가 적합한가? [1]파일 다운로드1
12619정성태4/28/202121538.NET Framework: 1051. C# - 구조체의 크기가 16바이트가 넘어가면 힙에 할당된다? [2]파일 다운로드1
12618정성태4/27/202119797사물인터넷: 58. NodeMCU v1 ESP8266 CP2102 Module을 이용한 WiFi UDP 통신 [1]파일 다운로드1
12617정성태4/26/202117074.NET Framework: 1050. C# - ETW EventListener의 Keywords별 EventId에 따른 필터링 방법파일 다운로드1
12616정성태4/26/202116755.NET Framework: 1049. C# - ETW EventListener를 상속받았을 때 초기화 순서파일 다운로드1
12615정성태4/26/202114009오류 유형: 712. Microsoft Live 로그인 - 계정을 선택하는(Pick an account) 화면에서 진행이 안 되는 문제
12614정성태4/24/202118325개발 환경 구성: 570. C# - Azure AD 인증을 지원하는 ASP.NET Core/5+ 웹 애플리케이션 예제 구성 [4]파일 다운로드1
12613정성태4/23/202116677.NET Framework: 1048. C# - ETW 이벤트의 Keywords에 속한 EventId 구하는 방법 (2) 관리 코드파일 다운로드1
12612정성태4/23/202116549.NET Framework: 1047. C# - ETW 이벤트의 Keywords에 속한 EventId 구하는 방법 (1) PInvoke파일 다운로드1
... 46  47  48  49  50  51  [52]  53  54  55  56  57  58  59  60  ...