Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일

(시리즈 글이 3개 있습니다.)
Linux: 44. 윈도우 개발자를 위한 리눅스 fork 동작 방식 설명 (파이썬 코드)
; https://www.sysnet.pe.kr/2/0/12811

스크립트: 29. 파이썬 - fork 시 기존 클라이언트 소켓 및 스레드의 동작
; https://www.sysnet.pe.kr/2/0/12843

C/C++: 167. Visual C++ - 윈도우 환경에서 _execv 동작
; https://www.sysnet.pe.kr/2/0/13716




파이썬 - fork 시 기존 클라이언트 소켓 및 스레드의 동작

지난 글에 설명한 것처럼,

윈도우 개발자를 위한 리눅스 fork 동작 방식 설명 (파이썬 코드)
; https://www.sysnet.pe.kr/2/0/12811

fork는 현재 프로세스의 메모리 그대로 복사해 실행하는데, 그렇다면 해당 프로세스에서 이미 연결해 두었던 클라이언트 소켓은 어떻게 되는 걸까요? 이론상으로는 fork된 프로세스에서도 유효한 소켓 descriptor이기 때문에 부모 프로세스와 전혀 다르지 않게 통신을 해야 할 것입니다.

정말 그런지 테스트를 해볼까요? ^^

이를 위해 다음과 같이 간단하게 파이썬 예제 코드를 만들고,

import os
import socket
import struct
import time
from threading import Thread, Timer

log_socket = None


class LogSocket:
    def __init__(self, port, address=None):
        self.sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

        if address is None:
            address = "127.0.0.1"

        self.address = address
        self.port = port

        self.sock.connect((self.address, self.port))
        pid = os.getpid()
        buf = struct.pack('i', pid)
        self.sock.send(buf)

    def log(self, text):
        buf = struct.pack('i', len(text))
        self.sock.send(buf)

        self.sock.send(text.encode('utf-8'))

    def close(self):
        self.sock.close()


log_socket = LogSocket(39999)
pid = os.fork()

if pid > 0:
    print('부모 프로세스의 실행 흐름', os.getpid())
elif pid == 0:
    print('자식 프로세스의 실행 흐름', os.getpid())
else:  # pid < 0
    print('fork 오류')

while True:
    time.sleep(1)
    log_socket.log("current pid: " + str(os.getpid()))

(첨부 파일로 포함한 C# TCP 서버 프로그램을 마련한 후) 실행해 TCP 서버 측에서 수신하는 데이터를 보면,

$ python main.py
부모 프로세스의 실행 흐름 17120
자식 프로세스의 실행 흐름 17121

/*
pstree -p | grep main.py
*/

// TCP 서버 측 수신 데이터

current pid: 17120
current pid: 17121
...[이하 반복]...

단일 소켓 연결을 사용해 (fork 중인) 부모와 자식 프로세스 모두 TCP 서버와 통신하는 것을 확인할 수 있습니다.




fork로 인한 부모/자식이 소켓 하나를 공유해 사용하고 있지만, 네트워크의 특성을 고려해 저것이 2개로 나뉠 수 있다는 것을 감안해야 합니다.

가령, fork 이후 서버 측과의 소켓 통신이 끊겨서 재연결을 하는 경우라고 가정해 보겠습니다. 그렇다면, 기존에는 1개의 소켓을 공유했지만, 소켓이 끊기게 되면 이후 부모/자식 프로세스가 모두 각각 소켓 통신을 열게 되므로 2개의 소켓이 사용될 수 있습니다.

역시 간단하게 이전에 사용한 코드 중 LogSocket 관련 코드만 다음과 같이 바꾸고,

class LogSocket:
    def __init__(self, port, address=None):
        self.sock = None
        self.address = address
        self.port = port

        self.reconnect()

    def reconnect(self):
        self.sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

        if self.address is None:
            self.address = "127.0.0.1"

        self.sock.connect((self.address, self.port))
        process_id = os.getpid()
        buf = struct.pack('i', process_id)
        self.sock.send(buf)

    def log(self, text):

        try:
            buf = struct.pack('i', len(text))
            self.sock.send(buf)

            self.sock.send(text.encode('utf-8'))
        except:
            self.reconnect()

    def close(self):
        self.sock.close()

테스트하면, 최초 실행 시 1개의 소켓으로 공유하는 중에 서버 측에서 강제로 해당 연결을 끊어버리면 fork의 부모/자식 프로세스가 reconnect 함수를 각각 실행하면서 별도의 소켓 연결을 가져가게 됩니다.

사실, fork의 이런 동작은 전체적인 프로그램에 대한 코드 실행 경로를 자칫 난해하게 만들 수 있으므로 사용하는 유형이 정해져 있습니다. 대표적인 사례로 TCP 서버에서 클라이언트가 접속했을 때 해당 소켓과 통신하는 전용 프로세스를 fork로 만들어 떼어내는 것입니다.

또한 전에도 언급했지만, 파이썬의 경우 유독 GIL(Global Interpreter Lock)로 인해 fork와 친해질 수밖에 없는 구조입니다. 이로 인해 Django를 호스팅하는 uwsgigunicorn에서 요청이 오면 그것을 처리하기 위한 (별도 스레드가 아닌) fork로 자식 프로세스를 만들게 된 것입니다. (물론, gunicorn이라면 --worker-class=gthread 옵션이 있지만!)




그렇다면 스레드는 어떻게 될까요? 원칙상으로 보면, 소켓이나 스레드와 같은 커널 자원이 fork로 자식 프로세스에 복제되는 것은 엄밀히 핸들 값에 불과할 뿐입니다. 그렇기 때문에 소켓의 경우는 부모/자식에서 모두 사용할 수 있었지만, 스레드의 경우에는 fork된 자식 프로세스에서 딱히 역할을 하지 않습니다.

역시 간단하게 이전의 파이썬 코드에서 스레드만 추가해 다음과 같이 확인할 수 있습니다.

import os
import socket
import struct
import threading
import time
from threading import Thread, Timer

log_socket = None


class LogSocket:
    def __init__(self, port, address=None):
        self.sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

        if address is None:
            address = "127.0.0.1"

        self.address = address
        self.port = port

        self.sock.connect((self.address, self.port))
        pid = os.getpid()
        buf = struct.pack('i', pid)
        self.sock.send(buf)

    def log(self, text):
        buf = struct.pack('i', len(text))
        self.sock.send(buf)

        self.sock.send(text.encode('utf-8'))

    def close(self):
        self.sock.close()


def run_thread():
    def handler():
        global log_socket

        while True:
            log_socket.log("current pid: " + str(os.getpid()) + ", " + str(threading.get_native_id()))
            time.sleep(1)

    t = Thread(target=handler)
    t.daemon = True
    t.start()
    return t


log_socket = LogSocket(39999)
run_thread()

pid = os.fork()

if pid > 0:
    print('부모 프로세스의 실행 흐름', os.getpid())
elif pid == 0:
    print('자식 프로세스의 실행 흐름', os.getpid())
else:  # pid < 0
    print('fork 오류')

while True:
    time.sleep(1)

실행해 보면 파이썬 콘솔에는 2개의 프로세스 id가 보이고 TCP 서버에서는 단일 소켓으로 1초마다 들어오는 메시지를 확인할 수 있습니다.

$ python main.py
부모 프로세스의 실행 흐름 17109
자식 프로세스의 실행 흐름 17111

// TCP 서버 측 수신 데이터

current pid: 17109, 17110
current pid: 17109, 17110
...[이하 반복]...

pid를 보면 알겠지만, 부모 프로세스가 17109이고 그 프로세스에서 생성한 스레드가 17110, 마지막으로 fork 프로세스가 17111로 할당돼 있습니다.

(첨부 파일은 이 글에서 사용한 파이썬 예제 코드와 C# TCP 서버를 포함합니다.)




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 2/8/2023]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




... 151  152  153  154  155  156  157  [158]  159  160  161  162  163  164  165  ...
NoWriterDateCnt.TitleFile(s)
1099정성태8/15/201128254오류 유형: 132. 어느 순간 갑자기 접속이 안 되는 TFS 서버
1098정성태8/15/201150337웹: 24. 네이버는 어떻게 로그인 처리를 할까요? [2]
1097정성태8/15/201121639.NET Framework: 235. 메서드의 메타 데이터 토큰 값으로 클래스를 찾아내는 방법
1096정성태8/15/201125763디버깅 기술: 42. Watson Bucket 정보를 이용한 CLR 응용 프로그램 예외 분석 - (2)
1095정성태8/14/201126151디버깅 기술: 41. Windbg - 비정상 종료된 닷넷 프로그램의 StackTrace에서 보이는 offset 값 의미
1094정성태8/14/201130599오류 유형: 131. Fiddler가 강제 종료된 경우, 웹 사이트 방문이 안되는 현상
1093정성태7/27/201124167오류 유형: 130. Unable to connect to the Microsoft Visual Studio Remote Debugging Monitor ... Access is denied.
1092정성태7/22/201126622Team Foundation Server: 46. 코드 이외의 파일에 대해 소스 제어에서 제외시키는 방법
1091정성태7/21/201125655개발 환경 구성: 128. WP7 Emulator 실행 시 audiodg.exe의 CPU 소모율 증가 [2]
1089정성태7/18/201131217.NET Framework: 234. 왜? Button 컨트롤에는 MouseDown/MouseUp 이벤트가 발생하지 않을까요?파일 다운로드1
1088정성태7/16/201124250.NET Framework: 233. Entity Framework 4.1 - 윈도우 폰 7에서의 CodeFirst 순환 참조 문제파일 다운로드1
1087정성태7/15/201126994.NET Framework: 232. Entity Framework 4.1 - CodeFirst 개체의 직렬화 시 순환 참조 해결하는 방법 - 두 번째 이야기파일 다운로드1
1086정성태7/14/201128368.NET Framework: 231. Entity Framework 4.1 - CodeFirst 개체의 직렬화 시 순환 참조 해결하는 방법 [1]파일 다운로드1
1085정성태7/14/201128889.NET Framework: 230. Entity Framework 4.1 - Code First + WCF 서비스 시 EndpointNotFoundException 오류 - 두 번째 이야기파일 다운로드1
1084정성태7/11/201134158.NET Framework: 229. SQL 서버 - DB 테이블의 데이터 변경에 대한 알림 처리 [4]파일 다운로드1
1083정성태7/11/201128195.NET Framework: 228. Entity Framework 4.1 - Code First + WCF 서비스 시 EndpointNotFoundException 오류
1082정성태7/10/201127738.NET Framework: 227. basicHttpBinding + 사용자 정의 인증 구현 [2]파일 다운로드1
1081정성태7/9/201127070VC++: 53. Windows 7에서 gcc.exe 실행 시 Access denied 오류 [2]
1080정성태7/8/201125565웹: 23. Sysnet 웹 사이트의 HTML5 변환 기록 - 두 번째 이야기파일 다운로드1
1079정성태7/6/201130003오류 유형: 129. Hyper-V + Realtek 랜카드가 설치된 시스템의 BSOD 현상 [2]
1078정성태7/5/201137472VC++: 52. Chromium 컴파일하는 방법 [2]
1077정성태6/24/201135101.NET Framework: 226. HttpWebRequest 타입의 HaveResponse 속성 이야기파일 다운로드1
1076정성태6/23/201129290오류 유형: 128. SQL Express - User Instance 옵션을 사용한 경우 발생하는 오류 메시지 유형 2가지
1075정성태6/21/201124861VS.NET IDE: 69. 윈폰 프로젝트에서 WCF 서비스 참조할 때 Reference.cs 파일이 비어있는 경우
1074정성태6/20/201124981.NET Framework: 225. 닷넷 네트워크 라이브러리의 트레이스 기능파일 다운로드1
1073정성태6/20/201127205오류 유형: 127. Visual Studio에서 WCF 서비스의 이름 변경 시 발생할 수 있는 오류
... 151  152  153  154  155  156  157  [158]  159  160  161  162  163  164  165  ...