Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일

파이썬 - fork 시 기존 클라이언트 소켓 및 스레드의 동작

지난 글에 설명한 것처럼,

윈도우 개발자를 위한 리눅스 fork 동작 방식 설명 (파이썬 코드)
; https://www.sysnet.pe.kr/2/0/12811

fork는 현재 프로세스의 메모리 그대로 복사해 실행하는데, 그렇다면 해당 프로세스에서 이미 연결해 두었던 클라이언트 소켓은 어떻게 되는 걸까요? 이론상으로는 fork된 프로세스에서도 유효한 소켓 descriptor이기 때문에 부모 프로세스와 전혀 다르지 않게 통신을 해야 할 것입니다.

정말 그런지 테스트를 해볼까요? ^^

이를 위해 다음과 같이 간단하게 파이썬 예제 코드를 만들고,

import os
import socket
import struct
import time
from threading import Thread, Timer

log_socket = None


class LogSocket:
    def __init__(self, port, address=None):
        self.sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

        if address is None:
            address = "127.0.0.1"

        self.address = address
        self.port = port

        self.sock.connect((self.address, self.port))
        pid = os.getpid()
        buf = struct.pack('i', pid)
        self.sock.send(buf)

    def log(self, text):
        buf = struct.pack('i', len(text))
        self.sock.send(buf)

        self.sock.send(text.encode('utf-8'))

    def close(self):
        self.sock.close()


log_socket = LogSocket(39999)
pid = os.fork()

if pid > 0:
    print('부모 프로세스의 실행 흐름', os.getpid())
elif pid == 0:
    print('자식 프로세스의 실행 흐름', os.getpid())
else:  # pid < 0
    print('fork 오류')

while True:
    time.sleep(1)
    log_socket.log("current pid: " + str(os.getpid()))

(첨부 파일로 포함한 C# TCP 서버 프로그램을 마련한 후) 실행해 TCP 서버 측에서 수신하는 데이터를 보면,

$ python main.py
부모 프로세스의 실행 흐름 17120
자식 프로세스의 실행 흐름 17121

/*
pstree -p | grep main.py
*/

// TCP 서버 측 수신 데이터

current pid: 17120
current pid: 17121
...[이하 반복]...

단일 소켓 연결을 사용해 (fork 중인) 부모와 자식 프로세스 모두 TCP 서버와 통신하는 것을 확인할 수 있습니다.




fork로 인한 부모/자식이 소켓 하나를 공유해 사용하고 있지만, 네트워크의 특성을 고려해 저것이 2개로 나뉠 수 있다는 것을 감안해야 합니다.

가령, fork 이후 서버 측과의 소켓 통신이 끊겨서 재연결을 하는 경우라고 가정해 보겠습니다. 그렇다면, 기존에는 1개의 소켓을 공유했지만, 소켓이 끊기게 되면 이후 부모/자식 프로세스가 모두 각각 소켓 통신을 열게 되므로 2개의 소켓이 사용될 수 있습니다.

역시 간단하게 이전에 사용한 코드 중 LogSocket 관련 코드만 다음과 같이 바꾸고,

class LogSocket:
    def __init__(self, port, address=None):
        self.sock = None
        self.address = address
        self.port = port

        self.reconnect()

    def reconnect(self):
        self.sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

        if self.address is None:
            self.address = "127.0.0.1"

        self.sock.connect((self.address, self.port))
        process_id = os.getpid()
        buf = struct.pack('i', process_id)
        self.sock.send(buf)

    def log(self, text):

        try:
            buf = struct.pack('i', len(text))
            self.sock.send(buf)

            self.sock.send(text.encode('utf-8'))
        except:
            self.reconnect()

    def close(self):
        self.sock.close()

테스트하면, 최초 실행 시 1개의 소켓으로 공유하는 중에 서버 측에서 강제로 해당 연결을 끊어버리면 fork의 부모/자식 프로세스가 reconnect 함수를 각각 실행하면서 별도의 소켓 연결을 가져가게 됩니다.

사실, fork의 이런 동작은 전체적인 프로그램에 대한 코드 실행 경로를 자칫 난해하게 만들 수 있으므로 사용하는 유형이 정해져 있습니다. 대표적인 사례로 TCP 서버에서 클라이언트가 접속했을 때 해당 소켓과 통신하는 전용 프로세스를 fork로 만들어 떼어내는 것입니다.

또한 전에도 언급했지만, 파이썬의 경우 유독 GIL(Global Interpreter Lock)로 인해 fork와 친해질 수밖에 없는 구조입니다. 이로 인해 Django를 호스팅하는 uwsgigunicorn에서 요청이 오면 그것을 처리하기 위한 (별도 스레드가 아닌) fork로 자식 프로세스를 만들게 된 것입니다. (물론, --worker-class=gthread 등의 옵션이 있지만!)




그렇다면 스레드는 어떻게 될까요? 원칙상으로 보면, 소켓이나 스레드와 같은 커널 자원이 fork로 자식 프로세스에 복제되는 것은 엄밀히 핸들 값에 불과할 뿐입니다. 그렇기 때문에 소켓의 경우는 부모/자식에서 모두 (피동적으로) 사용할 수 있었지만, 스레드의 경우에는 fork된 자식 프로세스에서 딱히 역할을 하지 않습니다.

역시 간단하게 이전의 파이썬 코드에서 스레드만 추가해 다음과 같이 확인할 수 있습니다.

import os
import socket
import struct
import threading
import time
from threading import Thread, Timer

log_socket = None


class LogSocket:
    def __init__(self, port, address=None):
        self.sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

        if address is None:
            address = "127.0.0.1"

        self.address = address
        self.port = port

        self.sock.connect((self.address, self.port))
        pid = os.getpid()
        buf = struct.pack('i', pid)
        self.sock.send(buf)

    def log(self, text):
        buf = struct.pack('i', len(text))
        self.sock.send(buf)

        self.sock.send(text.encode('utf-8'))

    def close(self):
        self.sock.close()


def run_thread():
    def handler():
        global log_socket

        while True:
            log_socket.log("current pid: " + str(os.getpid()) + ", " + str(threading.get_native_id()))
            time.sleep(1)

    t = Thread(target=handler)
    t.daemon = True
    t.start()
    return t


log_socket = LogSocket(39999)
run_thread()

pid = os.fork()

if pid > 0:
    print('부모 프로세스의 실행 흐름', os.getpid())
elif pid == 0:
    print('자식 프로세스의 실행 흐름', os.getpid())
else:  # pid < 0
    print('fork 오류')

while True:
    time.sleep(1)

실행해 보면 파이썬 콘솔에는 2개의 프로세스 id가 보이고 TCP 서버에서는 단일 소켓으로 1초마다 들어오는 메시지를 확인할 수 있습니다.

$ python main.py
부모 프로세스의 실행 흐름 17109
자식 프로세스의 실행 흐름 17111

// TCP 서버 측 수신 데이터

current pid: 17109, 17110
current pid: 17109, 17110
...[이하 반복]...

pid를 보면 알겠지만, 부모 프로세스가 17109이고 그 프로세스에서 생성한 스레드가 17110, 마지막으로 fork 프로세스가 17111로 할당돼 있습니다.

(첨부 파일은 이 글에서 사용한 파이썬 예제 코드와 C# TCP 서버를 포함합니다.)




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 10/6/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




1  2  3  4  5  6  7  8  9  [10]  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
12891정성태12/23/2021956스크립트: 38. 파이썬 - uwsgi의 --master 옵션
12890정성태12/23/20211062VC++: 152. Golang - (문자가 아닌) 바이트 위치를 반환하는 strings.IndexRune 함수
12889정성태12/22/20211556.NET Framework: 1123. C# - (SharpDX + DXGI) 화면 캡처한 이미지를 빠르게 JPG로 변환하는 방법파일 다운로드1
12888정성태12/21/20211333.NET Framework: 1122. C# - ImageCodecInfo 사용 시 System.Drawing.Image와 System.Drawing.Bitmap에 따른 Save 성능 차이파일 다운로드1
12887정성태12/21/20211453오류 유형: 777. OpenCVSharp4를 사용한 프로그램 실행 시 "The type initializer for 'OpenCvSharp.Internal.NativeMethods' threw an exception." 예외 발생
12886정성태12/20/20211142스크립트: 37. 파이썬 - uwsgi의 --enable-threads 옵션
12885정성태12/20/2021902오류 유형: 776. uwsgi-plugin-python3 환경에서 MySQLdb 사용 환경
12884정성태12/20/2021903개발 환경 구성: 620. Windows 10+에서 WMI root/Microsoft/Windows/WindowsUpdate 네임스페이스 제거
12883정성태12/19/20211201오류 유형: 775. uwsgi-plugin-python3 환경에서 "ModuleNotFoundError: No module named 'django'" 오류 발생
12882정성태12/18/2021967개발 환경 구성: 619. Windows Server에서 WSL을 위한 리눅스 배포본을 설치하는 방법
12881정성태12/17/20211196개발 환경 구성: 618. WSL Ubuntu 20.04에서 파이썬을 위한 uwsgi 설치 방법 (2)
12880정성태12/16/2021989VS.NET IDE: 170. Visual Studio에서 .NET Core/5+ 역어셈블 소스코드 확인하는 방법
12879정성태12/16/20214189오류 유형: 774. Windows Server 2022 + docker desktop 설치 시 WSL 2로 선택한 경우 "Failed to deploy distro docker-desktop to ..." 오류 발생
12878정성태12/15/20211175개발 환경 구성: 617. 윈도우 WSL 환경에서 같은 종류의 리눅스를 다중으로 설치하는 방법
12877정성태12/15/2021976스크립트: 36. 파이썬 - pymysql 기본 예제 코드
12876정성태12/14/20211017개발 환경 구성: 616. Custom Sources를 이용한 Azure Monitor Metric 만들기
12875정성태12/13/2021991스크립트: 35. python - time.sleep(...) 호출 시 hang이 걸리는 듯한 문제
12874정성태12/13/2021833오류 유형: 773. shell script 실행 시 "$'\r': command not found" 오류
12873정성태12/12/20211246오류 유형: 772. 리눅스 - PATH에 등록했는데도 "command not found"가 나온다면?
12872정성태12/12/20211069개발 환경 구성: 615. GoLang과 Python 빌드가 모두 가능한 docker 이미지 만들기
12871정성태12/12/20211953오류 유형: 771. docker: Error response from daemon: OCI runtime create failed
12870정성태12/9/2021946개발 환경 구성: 614. 파이썬 - PyPI 패키지 만들기 (4) package_data 옵션
12869정성태12/8/20211165개발 환경 구성: 613. git clone 실행 시 fingerprint 묻는 단계를 생략하는 방법
12868정성태12/7/2021886오류 유형: 770. twine 업로드 시 "HTTPError: 400 Bad Request ..." 오류
12867정성태12/7/2021968개발 환경 구성: 612. 파이썬 - PyPI 패키지 만들기 (3) entry_points 옵션
12866정성태12/7/20214114오류 유형: 769. "docker build ..." 시 "failed to solve with frontend dockerfile.v0: failed to read dockerfile ..." 오류
1  2  3  4  5  6  7  8  9  [10]  11  12  13  14  15  ...