Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 

NUMA 노드 수에 따른 IIS Worker Process(w3wp.exe) 설정

역시 이래서 경험이 중요한가 봅니다. ^^

개인적으로 사용하는 컴퓨터는 당연하겠지만, 업무/고객사에서 사용하는 컴퓨터에서 NUMA 아키텍처가 활성화된 시스템을 이제껏 본 적이 없습니다. 단지, 언젠가 읽었던 마이크로소프트웨어 잡지 책에서의 글로만 봤을 뿐.

미래의 멀티코어 환경을 위한 NUMA
; http://www.imaso.co.kr/?doc=bbs/gnuboard.php&bo_table=article&wr_id=33740

 (그냥 간단하게 생각하면, NUMA는 64개보다 많은 (논리) 프로세서가 장착된 시스템의 효율을 높이기 위한 구조라고 이해하면 무리가 없습니다.)

물론, 일반적인 상황이라면 NUMA 노드의 수를 모르고 지나칠 수 있었겠지만, 특이하게도, 특정 컴퓨터에 설치된 IIS Web AppPool들의 "Web Garden" 설정이 모두 0이었다는 점!

처음에는 Web Garden 설정이 잘못된 것이 아닌가 생각했는데요. 알고 보니, 마이크로소프트의 공식 문서에 다음과 같이 기재된 사항이었습니다.

Process Model Settings for an Application Pool <processModel>
; http://www.iis.net/configreference/system.applicationhost/applicationpools/add/processmodel

Web gardening and use of Non-Uniform Memory Access (NUMA) hardware, which you can configure by setting the maxProcesses attribute. For Web gardening, see maxProcesses to a value greater than one. For use of NUMA hardware, set maxProcesses to a value of "0" to specify that IIS runs the same number of worker processes as there are NUMA nodes.


아마도, 해당 고객사의 관리자가 직접 0으로 설정했을 리는 없을 것 같고... NUMA 노드가 1을 초과하는 경우 IIS 서버가 자동으로 감지해서 기본값을 0으로 해주는 것이 아닌가 생각됩니다. (이 부분은 예상일 뿐, 확인이 필요합니다. 그러나... 어떻게 확인해야 할까요? ^^;)

암튼, 그래서 maxProcesses 설정값이 0일 수 없다는 가정을 하시면 안됩니다.

아울러, NUMA에 대한 정보를 C#에서 구하고 싶다면 다음의 API를 이용할 수 있고,

PInvoke for GetLogicalProcessorInformation Function
; http://stackoverflow.com/questions/6972437/pinvoke-for-getlogicalprocessorinformation-function

기존 알려진 도구 중에는 sysinternal의 coreinfo를 이용하면 NUMA 정보를 쉽게 알 수 있습니다.

D:\tools> coreinfo -n

Coreinfo v3.2 - Dump information on system CPU and memory topology
Copyright (C) 2008-2012 Mark Russinovich
Sysinternals - www.sysinternals.com

Logical Processor to NUMA Node Map:
********  NUMA Node 0

아직은, 대부분의 시스템에서 저렇게 "NUMA Node 0" 한 줄만 출력될 테지만... 가끔 제가 겪은 그 고객사처럼 본격적으로 도입되는 경우도 있다는! ^^




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 7/17/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2022-03-31 11시47분
단일 프로세스에서 NUMA가 야기한 성능 저하
; https://netmarble.engineering/single-process-programming-numa-effect/

위의 글에서는 단일 프로세스(EXE)에서 NUMA 노드가 있는 서버에서 CPU 전체를 쓰기 위한 방법으로 "Node interleaving" 설정을 하라고 되어 있지만... 글쎄요, 재미있는 문제군요. ^^

일단, NUMA가 적용된 시스템은 프로세서(Processor)마다 메모리가 분할돼 할당이 되는 형식입니다. "Node interleaving"을 설정했다고 해서 그 시스템의 구조 자체가 바뀌는 것은 아닙니다. 결국, 프로세스(EXE)는 특정 NUMA 노드에 연결된 메모리에 로드돼 있다는 것은 분명 문제가 됩니다.

가령 A 프로세서가 test.exe를 A 프로세서와 연결된 메모리에 로드해 실행했다고 가정해 보겠습니다. 그 EXE 내에서 스레드를 생성해 B 프로세서에서 실행되도록 스케줄링을 했다면 결국 B 프로세서는 A 프로세서에 연결된 메모리를 어떤 식으로든 부하를 거쳐 접근할 수밖에 없습니다.

-----------------------------

그러니까, 가장 좋은 방법은 NUMA 시스템인 경우 응용 프로그램의 구조도 함께 바꾸는 것이 좋습니다. 기존의 단일 프로세스로 NUMA 시스템에서 성능을 높이려 하는 것은 적절한 방법은 아닙니다. 뭐랄까, 예전에도 32비트 프로세스를 64비트 운영체제에서 급한 김에 실행은 했지만, 결국 성능을 제대로 발휘하기 위해서는 64비트로 마이그레이션을 하는 것과 같은 이치일 것입니다.

-----------------------------

그런 의미에서 IIS에서 w3wp.exe Worker Process를 NUMA에 분산시켜 실행하는 것은 아주 정석적인 NUMA 시스템의 활용입니다. 가령 2개의 test.exe가 실행됐다면 IIS는 자동으로 그중 한 개는 A 프로세서에서 그와 연결된 메모리에 로드를 시킬 것이고, 또 다른 test.exe는 B 프로세서와 연결된 메모리에 로드를 할 것이기 때문입니다.
정성태

... 61  62  63  64  65  66  67  68  69  70  71  72  73  [74]  75  ...
NoWriterDateCnt.TitleFile(s)
12086정성태12/20/201920984디버깅 기술: 144. windbg - Marshal.FreeHGlobal에서 발생한 덤프 분석 사례
12085정성태12/20/201918982오류 유형: 586. iisreset - The data is invalid. (2147942413, 8007000d) 오류 발생 - 두 번째 이야기 [1]
12084정성태12/19/201919405디버깅 기술: 143. windbg/sos - Hashtable의 buckets 배열 내용을 모두 덤프하는 방법 (do_hashtable.py) [1]
12083정성태12/17/201922367Linux: 27. linux - lldb를 이용한 .NET Core 응용 프로그램의 메모리 덤프 분석 방법 [2]
12082정성태12/17/201920587오류 유형: 585. lsof: WARNING: can't stat() fuse.gvfsd-fuse file system
12081정성태12/16/201922446개발 환경 구성: 465. 로컬 PC에서 개발 중인 ASP.NET Core 웹 응용 프로그램을 다른 PC에서도 접근하는 방법 [5]
12080정성태12/16/201919609.NET Framework: 870. C# - 프로세스의 모든 핸들을 열람
12079정성태12/13/201921496오류 유형: 584. 원격 데스크톱(rdp) 환경에서 다중 또는 고용량 파일 복사 시 "Unspecified error" 오류 발생
12078정성태12/13/201921297Linux: 26. .NET Core 응용 프로그램을 위한 메모리 덤프 방법 [3]
12077정성태12/13/201920390Linux: 25. 자주 실행할 명령어 또는 초기 환경을 "~/.bashrc" 파일에 등록
12076정성태12/12/201918931디버깅 기술: 142. Linux - lldb 환경에서 sos 확장 명령어를 이용한 닷넷 프로세스 디버깅 - 배포 방법에 따른 차이
12075정성태12/11/201919733디버깅 기술: 141. Linux - lldb 환경에서 sos 확장 명령어를 이용한 닷넷 프로세스 디버깅
12074정성태12/10/201919425디버깅 기술: 140. windbg/Visual Studio - 값이 변경된 경우를 위한 정지점(BP) 설정(Data Breakpoint)
12073정성태12/10/201920924Linux: 24. Linux/C# - 실행 파일이 아닌 스크립트 형식의 명령어를 Process.Start로 실행하는 방법
12072정성태12/9/201917693오류 유형: 583. iisreset 수행 시 "No such interface supported" 오류
12071정성태12/9/201921224오류 유형: 582. 리눅스 디스크 공간 부족 및 safemode 부팅 방법
12070정성태12/9/201923146오류 유형: 581. resize2fs: Bad magic number in super-block while trying to open /dev/.../root
12069정성태12/2/201919533디버깅 기술: 139. windbg - x64 덤프 분석 시 메서드의 인자 또는 로컬 변수의 값을 확인하는 방법
12068정성태11/28/201928212디버깅 기술: 138. windbg와 Win32 API로 알아보는 Windows Heap 정보 분석 [3]파일 다운로드2
12067정성태11/27/201919617디버깅 기술: 137. 실제 사례를 통해 Debug Diagnostics 도구가 생성한 닷넷 웹 응용 프로그램의 성능 장애 보고서 설명 [1]파일 다운로드1
12066정성태11/27/201919274디버깅 기술: 136. windbg - C# PInvoke 호출 시 마샬링을 담당하는 함수 분석 - OracleCommand.ExecuteReader에서 OpsSql.Prepare2 PInvoke 호출 분석
12065정성태11/25/201917580디버깅 기술: 135. windbg - C# PInvoke 호출 시 마샬링을 담당하는 함수 분석파일 다운로드1
12064정성태11/25/201920506오류 유형: 580. HTTP Error 500.0/500.33 - ANCM In-Process Handler Load Failure
12063정성태11/21/201919432디버깅 기술: 134. windbg - RtlReportCriticalFailure로부터 parameters 정보 찾는 방법
12062정성태11/21/201918919디버깅 기술: 133. windbg - CoTaskMemFree/FreeCoTaskMem에서 발생한 덤프 분석 사례 - 두 번째 이야기
12061정성태11/20/201919366Windows: 167. CoTaskMemAlloc/CoTaskMemFree과 윈도우 Heap의 관계
... 61  62  63  64  65  66  67  68  69  70  71  72  73  [74]  75  ...