Microsoft MVP성태의 닷넷 이야기
스크립트: 44. 파이썬의 3가지 스레드 ID [링크 복사], [링크+제목 복사],
조회: 14091
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 

(시리즈 글이 2개 있습니다.)
스크립트: 44. 파이썬의 3가지 스레드 ID
; https://www.sysnet.pe.kr/2/0/13251

Linux: 108. Linux와 Windows의 프로세스/스레드 ID 관리 방식
; https://www.sysnet.pe.kr/2/0/13821




파이썬의 3가지 스레드 ID

(이 글은 리눅스 환경을 가정합니다.)

간단하게 다음의 코드를 실행하면,

import threading
import os

print(os.getpid(), threading.get_native_id(), threading.current_thread().native_id)

# os.getpid() == 16000 
# threading.get_native_id() == 16000  (python 3.8 or later)
# threading.current_thread().native_id == 16000  (python 3.8 or later)

당연히 모든 값이 동일합니다. CPU 입장에서는 사실 스레드와 프로세스의 구분이 없으므로, 그 부분은 운영체제 수준에서 구현하기 나름인데요, 윈도우와는 달리 리눅스는 내부적으로 스레드와 프로세스를 거의 동급으로 취급하기 때문에 저런 결과가 나옵니다.

그렇다면 os.getpid()와 threading.get_native_id(), threading.current_thread().native_id는 어떻게 다를까요? 간단합니다. 하나의 프로세스에서 스레드를 생성해 테스트하면,

def run_thread():
    def handler():
        print('run_thread', os.getpid(), threading.get_native_id(), threading.current_thread().native_id)

    t = threading.Thread(target=handler)
    t.daemon = True
    t.start()
    return t

run_thread()

이렇게 값이 나옵니다.

os.getpid() == 16000 
threading.get_native_id(), threading.current_thread().native_id == 16001 

당연하겠죠?!!!




그렇다면, threading.get_native_id(), threading.current_thread().native_id 간의 차이점은 뭘까요? 이름상으로는 2개 모두 현재 스레드의 ID를 반환할 것 같은데요, 불행히도 threading.current_thread().native_id에는 한 가지 문제가 있습니다. 아래의 코드를 통해 그것을 재현할 수 있는데,

# 윈도우 개발자를 위한 리눅스 fork 동작 방식 설명 (파이썬 코드)
# ; https://www.sysnet.pe.kr/2/0/12811

pid = os.fork()

if pid == 0:
    print(pid, '자식 프로세스의 실행 흐름', os.getpid(), threading.get_native_id(), threading.current_thread().native_id)

# os.getpid() == 16001 
# threading.get_native_id() == 16001 
# threading.current_thread().native_id == 16000

결과를 보면, threading.get_native_id()는 새로 fork한 자식 프로세스의 thread id를 나타내고 있지만, threading.current_thread().native_id는 (forking 시킨) 부모 프로세스의 스레드 id를 가리킵니다.

따라서 fork를 가정한다면 threading.current_thread().native_id를 사용해서는 안 됩니다. 달리 말해 threading.current_thread().native_id가 왜 있는 것인지 사실 잘 모르겠습니다. ^^;




그런데, 파이썬에는 또 다른 thread id가 있습니다. 닷넷도 Thread.ManagedThreadId가 있는 것처럼, 파이썬 역시 엔진 자체에서 추상화시킨 스레드 ID를 가지고 있는데 이 값은 threading.current_thread().ident로 구할 수 있습니다.

import threading

print(threading.get_native_id(), threading.current_thread().ident)

# threading.get_native_id() == 160654
# threading.current_thread().ident == 140401214547776

보는 바와 같이 완전히 다른 id 값을 가지므로 숫자 크기만으로 다른 값들과 쉽게 구분할 수 있습니다.

자, 그렇다면 (다른) 스레드의 호출 스택을 구할 때 사용하는 _current_frames의 get 함수에는 어떤 thread id를 전달해야 할까요?

frame = sys._current_frames().get(tid)
print(frame)

어느 정도 예상할 수 있을 텐데요, 파이썬 엔진에서 호출 스택을 구하는 것이므로 threading.current_thread().ident 값이어야 합니다. (이상한 이름 규칙이지만, threading.current_thread().native_id와 threading.get_native_id()는 값이 다른 경우가 있었는데요, 반면 동일한 이름 규칙의 threading.current_thread().ident와 threading.get_ident()는 완전히 동일한 값을 반환합니다.)

ident의 또 한 가지 특징이라면, 위에서 살펴 본 id들은 스레드의 생명이 살아 있는 동안에는 고유한 값을 띄기 때문에 동시에 같은 id가 중복되는 경우는 없습니다. 반면 ident는 파이썬 엔진에서 fork한 프로세스인 경우 동시에 같은 id가 나오기도 합니다.

pid = os.fork()

if pid == 0:
    print(pid, '자식 프로세스의 실행 흐름', threading.get_ident())  # 139813516781376
else:
    print(pid, '부모 프로세스의 실행 흐름', threading.get_ident())  # 139813516781376

생성 규칙이 뭔지는 모르겠지만, 보는 바와 같이 완전히 동일한 값이 부모/자식 프로세스 사이에서 나타나고 있습니다.




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 2/8/2023]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




... 61  62  63  64  65  66  67  68  69  70  71  72  73  74  [75]  ...
NoWriterDateCnt.TitleFile(s)
12103정성태1/7/202024913DDK: 8. Visual Studio 2019 + WDK Legacy Driver 제작- Hello World 예제 [1]파일 다운로드2
12102정성태1/6/202020112디버깅 기술: 152. User 권한(Ring 3)의 프로그램에서 _ETHREAD 주소(및 커널 메모리를 읽을 수 있다면 _EPROCESS 주소) 구하는 방법
12101정성태1/5/202021720.NET Framework: 876. C# - PEB(Process Environment Block)를 통해 로드된 모듈 목록 열람
12100정성태1/3/202019079.NET Framework: 875. .NET 3.5 이하에서 IntPtr.Add 사용
12099정성태1/3/202021944디버깅 기술: 151. Windows 10 - Process Explorer로 확인한 Handle 정보를 windbg에서 조회 [1]
12098정성태1/2/202021536.NET Framework: 874. C# - 커널 구조체의 Offset 값을 하드 코딩하지 않고 사용하는 방법 [3]
12097정성태1/2/202019352디버깅 기술: 150. windbg - Wow64, x86, x64에서의 커널 구조체(예: TEB) 구조체 확인
12096정성태12/30/201921122디버깅 기술: 149. C# - DbgEng.dll을 이용한 간단한 디버거 제작 [1]
12095정성태12/27/201923694VC++: 135. C++ - string_view의 동작 방식
12094정성태12/26/201921888.NET Framework: 873. C# - 코드를 통해 PDB 심벌 파일 다운로드 방법
12093정성태12/26/201921061.NET Framework: 872. C# - 로딩된 Native DLL의 export 함수 목록 출력파일 다운로드1
12092정성태12/25/201919180디버깅 기술: 148. cdb.exe를 이용해 (ntdll.dll 등에 정의된) 커널 구조체 출력하는 방법
12091정성태12/25/201922567디버깅 기술: 147. pdb 파일을 다운로드하기 위한 symchk.exe 실행에 필요한 최소 파일 [1]
12090정성태12/24/201922237.NET Framework: 871. .NET AnyCPU로 빌드된 PE 헤더의 로딩 전/후 차이점 [1]파일 다운로드1
12089정성태12/23/201920333디버깅 기술: 146. gflags와 _CrtIsMemoryBlock을 이용한 Heap 메모리 손상 여부 체크
12088정성태12/23/201919848Linux: 28. Linux - 윈도우의 "Run as different user" 기능을 shell에서 실행하는 방법
12087정성태12/21/201920084디버깅 기술: 145. windbg/sos - Dictionary의 entries 배열 내용을 모두 덤프하는 방법 (do_hashtable.py) [1]
12086정성태12/20/201923302디버깅 기술: 144. windbg - Marshal.FreeHGlobal에서 발생한 덤프 분석 사례
12085정성태12/20/201921369오류 유형: 586. iisreset - The data is invalid. (2147942413, 8007000d) 오류 발생 - 두 번째 이야기 [1]
12084정성태12/19/201921437디버깅 기술: 143. windbg/sos - Hashtable의 buckets 배열 내용을 모두 덤프하는 방법 (do_hashtable.py) [1]
12083정성태12/17/201924032Linux: 27. linux - lldb를 이용한 .NET Core 응용 프로그램의 메모리 덤프 분석 방법 [2]
12082정성태12/17/201922591오류 유형: 585. lsof: WARNING: can't stat() fuse.gvfsd-fuse file system
12081정성태12/16/201924824개발 환경 구성: 465. 로컬 PC에서 개발 중인 ASP.NET Core 웹 응용 프로그램을 다른 PC에서도 접근하는 방법 [5]
12080정성태12/16/201921187.NET Framework: 870. C# - 프로세스의 모든 핸들을 열람
12079정성태12/13/201923815오류 유형: 584. 원격 데스크톱(rdp) 환경에서 다중 또는 고용량 파일 복사 시 "Unspecified error" 오류 발생
12078정성태12/13/201923613Linux: 26. .NET Core 응용 프로그램을 위한 메모리 덤프 방법 [3]
... 61  62  63  64  65  66  67  68  69  70  71  72  73  74  [75]  ...