Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 

NUMA 노드 수에 따른 IIS Worker Process(w3wp.exe) 설정

역시 이래서 경험이 중요한가 봅니다. ^^

개인적으로 사용하는 컴퓨터는 당연하겠지만, 업무/고객사에서 사용하는 컴퓨터에서 NUMA 아키텍처가 활성화된 시스템을 이제껏 본 적이 없습니다. 단지, 언젠가 읽었던 마이크로소프트웨어 잡지 책에서의 글로만 봤을 뿐.

미래의 멀티코어 환경을 위한 NUMA
; http://www.imaso.co.kr/?doc=bbs/gnuboard.php&bo_table=article&wr_id=33740

 (그냥 간단하게 생각하면, NUMA는 64개보다 많은 (논리) 프로세서가 장착된 시스템의 효율을 높이기 위한 구조라고 이해하면 무리가 없습니다.)

물론, 일반적인 상황이라면 NUMA 노드의 수를 모르고 지나칠 수 있었겠지만, 특이하게도, 특정 컴퓨터에 설치된 IIS Web AppPool들의 "Web Garden" 설정이 모두 0이었다는 점!

처음에는 Web Garden 설정이 잘못된 것이 아닌가 생각했는데요. 알고 보니, 마이크로소프트의 공식 문서에 다음과 같이 기재된 사항이었습니다.

Process Model Settings for an Application Pool <processModel>
; http://www.iis.net/configreference/system.applicationhost/applicationpools/add/processmodel

Web gardening and use of Non-Uniform Memory Access (NUMA) hardware, which you can configure by setting the maxProcesses attribute. For Web gardening, see maxProcesses to a value greater than one. For use of NUMA hardware, set maxProcesses to a value of "0" to specify that IIS runs the same number of worker processes as there are NUMA nodes.


아마도, 해당 고객사의 관리자가 직접 0으로 설정했을 리는 없을 것 같고... NUMA 노드가 1을 초과하는 경우 IIS 서버가 자동으로 감지해서 기본값을 0으로 해주는 것이 아닌가 생각됩니다. (이 부분은 예상일 뿐, 확인이 필요합니다. 그러나... 어떻게 확인해야 할까요? ^^;)

암튼, 그래서 maxProcesses 설정값이 0일 수 없다는 가정을 하시면 안됩니다.

아울러, NUMA에 대한 정보를 C#에서 구하고 싶다면 다음의 API를 이용할 수 있고,

PInvoke for GetLogicalProcessorInformation Function
; http://stackoverflow.com/questions/6972437/pinvoke-for-getlogicalprocessorinformation-function

기존 알려진 도구 중에는 sysinternal의 coreinfo를 이용하면 NUMA 정보를 쉽게 알 수 있습니다.

D:\tools> coreinfo -n

Coreinfo v3.2 - Dump information on system CPU and memory topology
Copyright (C) 2008-2012 Mark Russinovich
Sysinternals - www.sysinternals.com

Logical Processor to NUMA Node Map:
********  NUMA Node 0

아직은, 대부분의 시스템에서 저렇게 "NUMA Node 0" 한 줄만 출력될 테지만... 가끔 제가 겪은 그 고객사처럼 본격적으로 도입되는 경우도 있다는! ^^




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 7/17/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2022-03-31 11시47분
단일 프로세스에서 NUMA가 야기한 성능 저하
; https://netmarble.engineering/single-process-programming-numa-effect/

위의 글에서는 단일 프로세스(EXE)에서 NUMA 노드가 있는 서버에서 CPU 전체를 쓰기 위한 방법으로 "Node interleaving" 설정을 하라고 되어 있지만... 글쎄요, 재미있는 문제군요. ^^

일단, NUMA가 적용된 시스템은 프로세서(Processor)마다 메모리가 분할돼 할당이 되는 형식입니다. "Node interleaving"을 설정했다고 해서 그 시스템의 구조 자체가 바뀌는 것은 아닙니다. 결국, 프로세스(EXE)는 특정 NUMA 노드에 연결된 메모리에 로드돼 있다는 것은 분명 문제가 됩니다.

가령 A 프로세서가 test.exe를 A 프로세서와 연결된 메모리에 로드해 실행했다고 가정해 보겠습니다. 그 EXE 내에서 스레드를 생성해 B 프로세서에서 실행되도록 스케줄링을 했다면 결국 B 프로세서는 A 프로세서에 연결된 메모리를 어떤 식으로든 부하를 거쳐 접근할 수밖에 없습니다.

-----------------------------

그러니까, 가장 좋은 방법은 NUMA 시스템인 경우 응용 프로그램의 구조도 함께 바꾸는 것이 좋습니다. 기존의 단일 프로세스로 NUMA 시스템에서 성능을 높이려 하는 것은 적절한 방법은 아닙니다. 뭐랄까, 예전에도 32비트 프로세스를 64비트 운영체제에서 급한 김에 실행은 했지만, 결국 성능을 제대로 발휘하기 위해서는 64비트로 마이그레이션을 하는 것과 같은 이치일 것입니다.

-----------------------------

그런 의미에서 IIS에서 w3wp.exe Worker Process를 NUMA에 분산시켜 실행하는 것은 아주 정석적인 NUMA 시스템의 활용입니다. 가령 2개의 test.exe가 실행됐다면 IIS는 자동으로 그중 한 개는 A 프로세서에서 그와 연결된 메모리에 로드를 시킬 것이고, 또 다른 test.exe는 B 프로세서와 연결된 메모리에 로드를 할 것이기 때문입니다.
정성태

1  2  3  4  5  6  7  [8]  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
13743정성태9/26/20246437닷넷: 2298. C# - Console 프로젝트에서의 await 대상으로 Main 스레드 활용하는 방법 [1]
13742정성태9/26/20246730닷넷: 2297. C# - ssh-keygen으로 생성한 ecdsa 유형의 Public Key 파일 해석 [1]파일 다운로드1
13741정성태9/25/20245913디버깅 기술: 202. windbg - ASP.NET MVC Web Application (.NET Framework) 응용 프로그램의 덤프 분석 시 요령
13740정성태9/24/20245766기타: 86. RSA 공개키 등의 modulus 값에 0x00 선행 바이트가 있는 이유(ASN.1 인코딩)
13739정성태9/24/20245917닷넷: 2297. C# - ssh-keygen으로 생성한 Public Key 파일 해석과 fingerprint 값(md5, sha256) 생성 [1]파일 다운로드1
13738정성태9/22/20245637C/C++: 174. C/C++ - 윈도우 운영체제에서의 file descriptor, FILE*파일 다운로드1
13737정성태9/21/20245999개발 환경 구성: 727. Visual C++ - 리눅스 프로젝트를 위한 빌드 서버의 msbuild 구성
13736정성태9/20/20246003오류 유형: 923. Visual Studio Code - Could not establish connection to "...": Port forwarding is disabled.
13735정성태9/20/20246076개발 환경 구성: 726. ARM 플랫폼용 Visual C++ 리눅스 프로젝트 빌드
13734정성태9/19/20245776개발 환경 구성: 725. ssh를 이용한 원격 docker 서비스 사용
13733정성태9/19/20246112VS.NET IDE: 194. Visual Studio - Cross Platform / "Authentication Type: Private Key"로 접속하는 방법
13732정성태9/17/20246164개발 환경 구성: 724. ARM + docker 환경에서 .NET 8 설치
13731정성태9/15/20246755개발 환경 구성: 723. C# / Visual C++ - Control Flow Guard (CFG) 활성화 [1]파일 다운로드2
13730정성태9/10/20246406오류 유형: 922. docker - RULE_APPEND failed (No such file or directory): rule in chain DOCKER
13729정성태9/9/20247166C/C++: 173. Windows / C++ - AllocConsole로 할당한 콘솔과 CRT 함수 연동 [1]파일 다운로드1
13728정성태9/7/20246985C/C++: 172. Windows - C 런타임에서 STARTUPINFO의 cbReserved2, lpReserved2 멤버를 사용하는 이유파일 다운로드1
13727정성태9/6/20247518개발 환경 구성: 722. ARM 플랫폼 빌드를 위한 미니 PC(?) - Khadas VIM4 [1]
13726정성태9/5/20247415C/C++: 171. C/C++ - 윈도우 운영체제에서의 file descriptor와 HANDLE파일 다운로드1
13725정성태9/4/20246169디버깅 기술: 201. WinDbg - sos threads 명령어 실행 시 "Failed to request ThreadStore"
13724정성태9/3/20248024닷넷: 2296. Win32/C# - 자식 프로세스로 HANDLE 상속파일 다운로드1
13723정성태9/2/20248279C/C++: 170. Windows - STARTUPINFO의 cbReserved2, lpReserved2 멤버 사용자 정의파일 다운로드2
13722정성태9/2/20246021C/C++: 169. C/C++ - CRT(C Runtime) 함수에 의존성이 없는 프로젝트 생성
13721정성태8/30/20246051C/C++: 168. Visual C++ CRT(C Runtime DLL: msvcr...dll)에 대한 의존성 제거 - 두 번째 이야기
13720정성태8/29/20246217VS.NET IDE: 193. C# - Visual Studio의 자식 프로세스 디버깅
13719정성태8/28/20246368Linux: 79. C++ - pthread_mutexattr_destroy가 없다면 메모리 누수가 발생할까요?
13718정성태8/27/20247454오류 유형: 921. Visual C++ - error C1083: Cannot open include file: 'float.h': No such file or directory [2]
1  2  3  4  5  6  7  [8]  9  10  11  12  13  14  15  ...