Microsoft MVP성태의 닷넷 이야기
스크립트: 44. 파이썬의 3가지 스레드 ID [링크 복사], [링크+제목 복사],
조회: 12164
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 

(시리즈 글이 2개 있습니다.)
스크립트: 44. 파이썬의 3가지 스레드 ID
; https://www.sysnet.pe.kr/2/0/13251

Linux: 108. Linux와 Windows의 프로세스/스레드 ID 관리 방식
; https://www.sysnet.pe.kr/2/0/13821




파이썬의 3가지 스레드 ID

(이 글은 리눅스 환경을 가정합니다.)

간단하게 다음의 코드를 실행하면,

import threading
import os

print(os.getpid(), threading.get_native_id(), threading.current_thread().native_id)

# os.getpid() == 16000 
# threading.get_native_id() == 16000  (python 3.8 or later)
# threading.current_thread().native_id == 16000  (python 3.8 or later)

당연히 모든 값이 동일합니다. CPU 입장에서는 사실 스레드와 프로세스의 구분이 없으므로, 그 부분은 운영체제 수준에서 구현하기 나름인데요, 윈도우와는 달리 리눅스는 내부적으로 스레드와 프로세스를 거의 동급으로 취급하기 때문에 저런 결과가 나옵니다.

그렇다면 os.getpid()와 threading.get_native_id(), threading.current_thread().native_id는 어떻게 다를까요? 간단합니다. 하나의 프로세스에서 스레드를 생성해 테스트하면,

def run_thread():
    def handler():
        print('run_thread', os.getpid(), threading.get_native_id(), threading.current_thread().native_id)

    t = threading.Thread(target=handler)
    t.daemon = True
    t.start()
    return t

run_thread()

이렇게 값이 나옵니다.

os.getpid() == 16000 
threading.get_native_id(), threading.current_thread().native_id == 16001 

당연하겠죠?!!!




그렇다면, threading.get_native_id(), threading.current_thread().native_id 간의 차이점은 뭘까요? 이름상으로는 2개 모두 현재 스레드의 ID를 반환할 것 같은데요, 불행히도 threading.current_thread().native_id에는 한 가지 문제가 있습니다. 아래의 코드를 통해 그것을 재현할 수 있는데,

# 윈도우 개발자를 위한 리눅스 fork 동작 방식 설명 (파이썬 코드)
# ; https://www.sysnet.pe.kr/2/0/12811

pid = os.fork()

if pid == 0:
    print(pid, '자식 프로세스의 실행 흐름', os.getpid(), threading.get_native_id(), threading.current_thread().native_id)

# os.getpid() == 16001 
# threading.get_native_id() == 16001 
# threading.current_thread().native_id == 16000

결과를 보면, threading.get_native_id()는 새로 fork한 자식 프로세스의 thread id를 나타내고 있지만, threading.current_thread().native_id는 (forking 시킨) 부모 프로세스의 스레드 id를 가리킵니다.

따라서 fork를 가정한다면 threading.current_thread().native_id를 사용해서는 안 됩니다. 달리 말해 threading.current_thread().native_id가 왜 있는 것인지 사실 잘 모르겠습니다. ^^;




그런데, 파이썬에는 또 다른 thread id가 있습니다. 닷넷도 Thread.ManagedThreadId가 있는 것처럼, 파이썬 역시 엔진 자체에서 추상화시킨 스레드 ID를 가지고 있는데 이 값은 threading.current_thread().ident로 구할 수 있습니다.

import threading

print(threading.get_native_id(), threading.current_thread().ident)

# threading.get_native_id() == 160654
# threading.current_thread().ident == 140401214547776

보는 바와 같이 완전히 다른 id 값을 가지므로 숫자 크기만으로 다른 값들과 쉽게 구분할 수 있습니다.

자, 그렇다면 (다른) 스레드의 호출 스택을 구할 때 사용하는 _current_frames의 get 함수에는 어떤 thread id를 전달해야 할까요?

frame = sys._current_frames().get(tid)
print(frame)

어느 정도 예상할 수 있을 텐데요, 파이썬 엔진에서 호출 스택을 구하는 것이므로 threading.current_thread().ident 값이어야 합니다. (이상한 이름 규칙이지만, threading.current_thread().native_id와 threading.get_native_id()는 값이 다른 경우가 있었는데요, 반면 동일한 이름 규칙의 threading.current_thread().ident와 threading.get_ident()는 완전히 동일한 값을 반환합니다.)

ident의 또 한 가지 특징이라면, 위에서 살펴 본 id들은 스레드의 생명이 살아 있는 동안에는 고유한 값을 띄기 때문에 동시에 같은 id가 중복되는 경우는 없습니다. 반면 ident는 파이썬 엔진에서 fork한 프로세스인 경우 동시에 같은 id가 나오기도 합니다.

pid = os.fork()

if pid == 0:
    print(pid, '자식 프로세스의 실행 흐름', threading.get_ident())  # 139813516781376
else:
    print(pid, '부모 프로세스의 실행 흐름', threading.get_ident())  # 139813516781376

생성 규칙이 뭔지는 모르겠지만, 보는 바와 같이 완전히 동일한 값이 부모/자식 프로세스 사이에서 나타나고 있습니다.




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 2/8/2023]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




1  2  3  4  5  [6]  7  8  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
13793정성태10/28/20245134C/C++: 183. C++ - 윈도우에서 한글(및 유니코드)을 포함한 콘솔 프로그램을 컴파일 및 실행하는 방법
13792정성태10/27/20244620Linux: 99. Linux - 프로세스의 실행 파일 경로 확인
13791정성태10/27/20244885Windows: 267. Win32 API의 A(ANSI) 버전은 DBCS를 사용할까요?파일 다운로드1
13790정성태10/27/20244607Linux: 98. Ubuntu 22.04 - 리눅스 커널 빌드 및 업그레이드
13789정성태10/27/20244908Linux: 97. menuconfig에 CONFIG_DEBUG_INFO_BTF, CONFIG_DEBUG_INFO_BTF_MODULES 옵션이 없는 경우
13788정성태10/26/20244443Linux: 96. eBPF (bpf2go) - fentry, fexit를 이용한 트레이스
13787정성태10/26/20244949개발 환경 구성: 730. github - Linux 커널 repo를 윈도우 환경에서 git clone하는 방법 [1]
13786정성태10/26/20245203Windows: 266. Windows - 대소문자 구분이 가능한 파일 시스템
13785정성태10/23/20244969C/C++: 182. 윈도우가 운영하는 2개의 Code Page파일 다운로드1
13784정성태10/23/20245235Linux: 95. eBPF - kprobe를 이용한 트레이스
13783정성태10/23/20244845Linux: 94. eBPF - vmlinux.h 헤더 포함하는 방법 (bpf2go에서 사용)
13782정성태10/23/20244605Linux: 93. Ubuntu 22.04 - 커널 이미지로부터 커널 함수 역어셈블
13781정성태10/22/20244785오류 유형: 930. WSL + eBPF: modprobe: FATAL: Module kheaders not found in directory
13780정성태10/22/20245546Linux: 92. WSL 2 - 커널 이미지로부터 커널 함수 역어셈블
13779정성태10/22/20244840개발 환경 구성: 729. WSL 2 - Mariner VM 커널 이미지 업데이트 방법
13778정성태10/21/20245653C/C++: 181. C/C++ - 소스코드 파일의 인코딩, 바이너리 모듈 상태의 인코딩
13777정성태10/20/20244937Windows: 265. Win32 API의 W(유니코드) 버전은 UCS-2일까요? UTF-16 인코딩일까요?
13776정성태10/19/20245250C/C++: 180. C++ - 고수준 FILE I/O 함수에서의 Unicode stream 모드(_O_WTEXT, _O_U16TEXT, _O_U8TEXT)파일 다운로드1
13775정성태10/19/20245477개발 환경 구성: 728. 윈도우 환경의 개발자를 위한 UTF-8 환경 설정
13774정성태10/18/20245182Linux: 91. Container 환경에서 출력하는 eBPF bpf_get_current_pid_tgid의 pid가 존재하지 않는 이유
13773정성태10/18/20244871Linux: 90. pid 네임스페이스 구성으로 본 WSL 2 + docker-desktop
13772정성태10/17/20245144Linux: 89. pid 네임스페이스 구성으로 본 WSL 2 배포본의 계층 관계
13771정성태10/17/20245049Linux: 88. WSL 2 리눅스 배포본 내에서의 pid 네임스페이스 구성
13770정성태10/17/20245327Linux: 87. ps + grep 조합에서 grep 명령어를 사용한 프로세스를 출력에서 제거하는 방법
13769정성태10/15/20246101Linux: 86. Golang + bpf2go를 사용한 eBPF 기본 예제파일 다운로드1
13768정성태10/15/20245379C/C++: 179. C++ - _O_WTEXT, _O_U16TEXT, _O_U8TEXT의 Unicode stream 모드파일 다운로드2
1  2  3  4  5  [6]  7  8  9  10  11  12  13  14  15  ...