Microsoft MVP성태의 닷넷 이야기
스크립트: 44. 파이썬의 3가지 스레드 ID [링크 복사], [링크+제목 복사],
조회: 12347
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 

(시리즈 글이 2개 있습니다.)
스크립트: 44. 파이썬의 3가지 스레드 ID
; https://www.sysnet.pe.kr/2/0/13251

Linux: 108. Linux와 Windows의 프로세스/스레드 ID 관리 방식
; https://www.sysnet.pe.kr/2/0/13821




파이썬의 3가지 스레드 ID

(이 글은 리눅스 환경을 가정합니다.)

간단하게 다음의 코드를 실행하면,

import threading
import os

print(os.getpid(), threading.get_native_id(), threading.current_thread().native_id)

# os.getpid() == 16000 
# threading.get_native_id() == 16000  (python 3.8 or later)
# threading.current_thread().native_id == 16000  (python 3.8 or later)

당연히 모든 값이 동일합니다. CPU 입장에서는 사실 스레드와 프로세스의 구분이 없으므로, 그 부분은 운영체제 수준에서 구현하기 나름인데요, 윈도우와는 달리 리눅스는 내부적으로 스레드와 프로세스를 거의 동급으로 취급하기 때문에 저런 결과가 나옵니다.

그렇다면 os.getpid()와 threading.get_native_id(), threading.current_thread().native_id는 어떻게 다를까요? 간단합니다. 하나의 프로세스에서 스레드를 생성해 테스트하면,

def run_thread():
    def handler():
        print('run_thread', os.getpid(), threading.get_native_id(), threading.current_thread().native_id)

    t = threading.Thread(target=handler)
    t.daemon = True
    t.start()
    return t

run_thread()

이렇게 값이 나옵니다.

os.getpid() == 16000 
threading.get_native_id(), threading.current_thread().native_id == 16001 

당연하겠죠?!!!




그렇다면, threading.get_native_id(), threading.current_thread().native_id 간의 차이점은 뭘까요? 이름상으로는 2개 모두 현재 스레드의 ID를 반환할 것 같은데요, 불행히도 threading.current_thread().native_id에는 한 가지 문제가 있습니다. 아래의 코드를 통해 그것을 재현할 수 있는데,

# 윈도우 개발자를 위한 리눅스 fork 동작 방식 설명 (파이썬 코드)
# ; https://www.sysnet.pe.kr/2/0/12811

pid = os.fork()

if pid == 0:
    print(pid, '자식 프로세스의 실행 흐름', os.getpid(), threading.get_native_id(), threading.current_thread().native_id)

# os.getpid() == 16001 
# threading.get_native_id() == 16001 
# threading.current_thread().native_id == 16000

결과를 보면, threading.get_native_id()는 새로 fork한 자식 프로세스의 thread id를 나타내고 있지만, threading.current_thread().native_id는 (forking 시킨) 부모 프로세스의 스레드 id를 가리킵니다.

따라서 fork를 가정한다면 threading.current_thread().native_id를 사용해서는 안 됩니다. 달리 말해 threading.current_thread().native_id가 왜 있는 것인지 사실 잘 모르겠습니다. ^^;




그런데, 파이썬에는 또 다른 thread id가 있습니다. 닷넷도 Thread.ManagedThreadId가 있는 것처럼, 파이썬 역시 엔진 자체에서 추상화시킨 스레드 ID를 가지고 있는데 이 값은 threading.current_thread().ident로 구할 수 있습니다.

import threading

print(threading.get_native_id(), threading.current_thread().ident)

# threading.get_native_id() == 160654
# threading.current_thread().ident == 140401214547776

보는 바와 같이 완전히 다른 id 값을 가지므로 숫자 크기만으로 다른 값들과 쉽게 구분할 수 있습니다.

자, 그렇다면 (다른) 스레드의 호출 스택을 구할 때 사용하는 _current_frames의 get 함수에는 어떤 thread id를 전달해야 할까요?

frame = sys._current_frames().get(tid)
print(frame)

어느 정도 예상할 수 있을 텐데요, 파이썬 엔진에서 호출 스택을 구하는 것이므로 threading.current_thread().ident 값이어야 합니다. (이상한 이름 규칙이지만, threading.current_thread().native_id와 threading.get_native_id()는 값이 다른 경우가 있었는데요, 반면 동일한 이름 규칙의 threading.current_thread().ident와 threading.get_ident()는 완전히 동일한 값을 반환합니다.)

ident의 또 한 가지 특징이라면, 위에서 살펴 본 id들은 스레드의 생명이 살아 있는 동안에는 고유한 값을 띄기 때문에 동시에 같은 id가 중복되는 경우는 없습니다. 반면 ident는 파이썬 엔진에서 fork한 프로세스인 경우 동시에 같은 id가 나오기도 합니다.

pid = os.fork()

if pid == 0:
    print(pid, '자식 프로세스의 실행 흐름', threading.get_ident())  # 139813516781376
else:
    print(pid, '부모 프로세스의 실행 흐름', threading.get_ident())  # 139813516781376

생성 규칙이 뭔지는 모르겠지만, 보는 바와 같이 완전히 동일한 값이 부모/자식 프로세스 사이에서 나타나고 있습니다.




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 2/8/2023]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




... 61  62  63  64  65  66  67  68  69  70  71  72  [73]  74  75  ...
NoWriterDateCnt.TitleFile(s)
12112정성태1/12/202016830오류 유형: 589. PowerShell - 원격 Invoke-Command 실행 시 "WinRM cannot complete the operation" 오류 발생
12111정성태1/12/202020625디버깅 기술: 155. C# - KernelMemoryIO 드라이버를 이용해 실행 프로그램을 숨기는 방법(DKOM: Direct Kernel Object Modification) [16]파일 다운로드1
12110정성태1/11/202020018디버깅 기술: 154. Patch Guard로 인해 블루 스크린(BSOD)가 발생하는 사례 [5]파일 다운로드1
12109정성태1/10/202016703오류 유형: 588. Driver 프로젝트 빌드 오류 - Inf2Cat error -2: "Inf2Cat, signability test failed."
12108정성태1/10/202017514오류 유형: 587. Kernel Driver 시작 시 127(The specified procedure could not be found.) 오류 메시지 발생
12107정성태1/10/202018730.NET Framework: 877. C# - 프로세스의 모든 핸들을 열람 - 두 번째 이야기
12106정성태1/8/202019722VC++: 136. C++ - OSR Driver Loader와 같은 Legacy 커널 드라이버 설치 프로그램 제작 [1]
12105정성태1/8/202018216디버깅 기술: 153. C# - PEB를 조작해 로드된 DLL을 숨기는 방법
12104정성태1/7/202019472DDK: 9. 커널 메모리를 읽고 쓰는 NT Legacy driver와 C# 클라이언트 프로그램 [4]
12103정성태1/7/202022594DDK: 8. Visual Studio 2019 + WDK Legacy Driver 제작- Hello World 예제 [1]파일 다운로드2
12102정성태1/6/202018866디버깅 기술: 152. User 권한(Ring 3)의 프로그램에서 _ETHREAD 주소(및 커널 메모리를 읽을 수 있다면 _EPROCESS 주소) 구하는 방법
12101정성태1/5/202019245.NET Framework: 876. C# - PEB(Process Environment Block)를 통해 로드된 모듈 목록 열람
12100정성태1/3/202016666.NET Framework: 875. .NET 3.5 이하에서 IntPtr.Add 사용
12099정성태1/3/202019539디버깅 기술: 151. Windows 10 - Process Explorer로 확인한 Handle 정보를 windbg에서 조회 [1]
12098정성태1/2/202019311.NET Framework: 874. C# - 커널 구조체의 Offset 값을 하드 코딩하지 않고 사용하는 방법 [3]
12097정성태1/2/202017416디버깅 기술: 150. windbg - Wow64, x86, x64에서의 커널 구조체(예: TEB) 구조체 확인
12096정성태12/30/201919986디버깅 기술: 149. C# - DbgEng.dll을 이용한 간단한 디버거 제작 [1]
12095정성태12/27/201921733VC++: 135. C++ - string_view의 동작 방식
12094정성태12/26/201919436.NET Framework: 873. C# - 코드를 통해 PDB 심벌 파일 다운로드 방법
12093정성태12/26/201919055.NET Framework: 872. C# - 로딩된 Native DLL의 export 함수 목록 출력파일 다운로드1
12092정성태12/25/201917721디버깅 기술: 148. cdb.exe를 이용해 (ntdll.dll 등에 정의된) 커널 구조체 출력하는 방법
12091정성태12/25/201920129디버깅 기술: 147. pdb 파일을 다운로드하기 위한 symchk.exe 실행에 필요한 최소 파일 [1]
12090정성태12/24/201920175.NET Framework: 871. .NET AnyCPU로 빌드된 PE 헤더의 로딩 전/후 차이점 [1]파일 다운로드1
12089정성태12/23/201919110디버깅 기술: 146. gflags와 _CrtIsMemoryBlock을 이용한 Heap 메모리 손상 여부 체크
12088정성태12/23/201918091Linux: 28. Linux - 윈도우의 "Run as different user" 기능을 shell에서 실행하는 방법
12087정성태12/21/201918566디버깅 기술: 145. windbg/sos - Dictionary의 entries 배열 내용을 모두 덤프하는 방법 (do_hashtable.py) [1]
... 61  62  63  64  65  66  67  68  69  70  71  72  [73]  74  75  ...