Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 

NUMA 노드 수에 따른 IIS Worker Process(w3wp.exe) 설정

역시 이래서 경험이 중요한가 봅니다. ^^

개인적으로 사용하는 컴퓨터는 당연하겠지만, 업무/고객사에서 사용하는 컴퓨터에서 NUMA 아키텍처가 활성화된 시스템을 이제껏 본 적이 없습니다. 단지, 언젠가 읽었던 마이크로소프트웨어 잡지 책에서의 글로만 봤을 뿐.

미래의 멀티코어 환경을 위한 NUMA
; http://www.imaso.co.kr/?doc=bbs/gnuboard.php&bo_table=article&wr_id=33740

 (그냥 간단하게 생각하면, NUMA는 64개보다 많은 (논리) 프로세서가 장착된 시스템의 효율을 높이기 위한 구조라고 이해하면 무리가 없습니다.)

물론, 일반적인 상황이라면 NUMA 노드의 수를 모르고 지나칠 수 있었겠지만, 특이하게도, 특정 컴퓨터에 설치된 IIS Web AppPool들의 "Web Garden" 설정이 모두 0이었다는 점!

처음에는 Web Garden 설정이 잘못된 것이 아닌가 생각했는데요. 알고 보니, 마이크로소프트의 공식 문서에 다음과 같이 기재된 사항이었습니다.

Process Model Settings for an Application Pool <processModel>
; http://www.iis.net/configreference/system.applicationhost/applicationpools/add/processmodel

Web gardening and use of Non-Uniform Memory Access (NUMA) hardware, which you can configure by setting the maxProcesses attribute. For Web gardening, see maxProcesses to a value greater than one. For use of NUMA hardware, set maxProcesses to a value of "0" to specify that IIS runs the same number of worker processes as there are NUMA nodes.


아마도, 해당 고객사의 관리자가 직접 0으로 설정했을 리는 없을 것 같고... NUMA 노드가 1을 초과하는 경우 IIS 서버가 자동으로 감지해서 기본값을 0으로 해주는 것이 아닌가 생각됩니다. (이 부분은 예상일 뿐, 확인이 필요합니다. 그러나... 어떻게 확인해야 할까요? ^^;)

암튼, 그래서 maxProcesses 설정값이 0일 수 없다는 가정을 하시면 안됩니다.

아울러, NUMA에 대한 정보를 C#에서 구하고 싶다면 다음의 API를 이용할 수 있고,

PInvoke for GetLogicalProcessorInformation Function
; http://stackoverflow.com/questions/6972437/pinvoke-for-getlogicalprocessorinformation-function

기존 알려진 도구 중에는 sysinternal의 coreinfo를 이용하면 NUMA 정보를 쉽게 알 수 있습니다.

D:\tools> coreinfo -n

Coreinfo v3.2 - Dump information on system CPU and memory topology
Copyright (C) 2008-2012 Mark Russinovich
Sysinternals - www.sysinternals.com

Logical Processor to NUMA Node Map:
********  NUMA Node 0

아직은, 대부분의 시스템에서 저렇게 "NUMA Node 0" 한 줄만 출력될 테지만... 가끔 제가 겪은 그 고객사처럼 본격적으로 도입되는 경우도 있다는! ^^




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 7/17/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2022-03-31 11시47분
단일 프로세스에서 NUMA가 야기한 성능 저하
; https://netmarble.engineering/single-process-programming-numa-effect/

위의 글에서는 단일 프로세스(EXE)에서 NUMA 노드가 있는 서버에서 CPU 전체를 쓰기 위한 방법으로 "Node interleaving" 설정을 하라고 되어 있지만... 글쎄요, 재미있는 문제군요. ^^

일단, NUMA가 적용된 시스템은 프로세서(Processor)마다 메모리가 분할돼 할당이 되는 형식입니다. "Node interleaving"을 설정했다고 해서 그 시스템의 구조 자체가 바뀌는 것은 아닙니다. 결국, 프로세스(EXE)는 특정 NUMA 노드에 연결된 메모리에 로드돼 있다는 것은 분명 문제가 됩니다.

가령 A 프로세서가 test.exe를 A 프로세서와 연결된 메모리에 로드해 실행했다고 가정해 보겠습니다. 그 EXE 내에서 스레드를 생성해 B 프로세서에서 실행되도록 스케줄링을 했다면 결국 B 프로세서는 A 프로세서에 연결된 메모리를 어떤 식으로든 부하를 거쳐 접근할 수밖에 없습니다.

-----------------------------

그러니까, 가장 좋은 방법은 NUMA 시스템인 경우 응용 프로그램의 구조도 함께 바꾸는 것이 좋습니다. 기존의 단일 프로세스로 NUMA 시스템에서 성능을 높이려 하는 것은 적절한 방법은 아닙니다. 뭐랄까, 예전에도 32비트 프로세스를 64비트 운영체제에서 급한 김에 실행은 했지만, 결국 성능을 제대로 발휘하기 위해서는 64비트로 마이그레이션을 하는 것과 같은 이치일 것입니다.

-----------------------------

그런 의미에서 IIS에서 w3wp.exe Worker Process를 NUMA에 분산시켜 실행하는 것은 아주 정석적인 NUMA 시스템의 활용입니다. 가령 2개의 test.exe가 실행됐다면 IIS는 자동으로 그중 한 개는 A 프로세서에서 그와 연결된 메모리에 로드를 시킬 것이고, 또 다른 test.exe는 B 프로세서와 연결된 메모리에 로드를 할 것이기 때문입니다.
정성태

... 31  32  33  34  35  36  37  38  39  40  41  42  43  [44]  45  ...
NoWriterDateCnt.TitleFile(s)
12839정성태9/15/202118192.NET Framework: 1118. C# 11 - 제네릭 타입의 특성 적용파일 다운로드1
12838정성태9/13/202117212.NET Framework: 1117. C# - Task에 전달한 Action, Func 유형에 따라 달라지는 async/await 비동기 처리 [2]파일 다운로드1
12837정성태9/11/202115234VC++: 151. Golang - fmt.Errorf, errors.Is, errors.As 설명
12836정성태9/10/202115500Linux: 45. 리눅스 - 실행 중인 다른 프로그램의 출력을 확인하는 방법
12835정성태9/7/202117325.NET Framework: 1116. C# 10 - (15) CallerArgumentExpression 특성 추가 [2]파일 다운로드1
12834정성태9/7/202115494오류 유형: 762. Visual Studio 2019 Build Tools - 'C:\Program' is not recognized as an internal or external command, operable program or batch file.
12833정성태9/6/202113592VC++: 150. Golang - TCP client/server echo 예제 코드파일 다운로드1
12832정성태9/6/202115620VC++: 149. Golang - 인터페이스 포인터가 의미 있을까요?
12831정성태9/6/202112770VC++: 148. Golang - 채널에 따른 다중 작업 처리파일 다운로드1
12830정성태9/6/202117076오류 유형: 761. Internet Explorer에서 파일 다운로드 시 "Your current security settings do not allow this file to be downloaded." 오류
12829정성태9/5/202118399.NET Framework: 1115. C# 10 - (14) 구조체 타입에 기본 생성자 정의 가능파일 다운로드1
12828정성태9/4/202115646.NET Framework: 1114. C# 10 - (13) 단일 파일 내에 적용되는 namespace 선언파일 다운로드1
12827정성태9/4/202115847스크립트: 27. 파이썬 - 웹 페이지 데이터 수집을 위한 scrapy Crawler 사용법 요약
12826정성태9/3/202119540.NET Framework: 1113. C# 10 - (12) 문자열 보간 성능 개선 [1]파일 다운로드1
12825정성태9/3/202115691개발 환경 구성: 603. GoLand - WSL 환경과 연동
12824정성태9/2/202124935오류 유형: 760. 파이썬 tensorflow - Dst tensor is not initialized. 오류 메시지
12823정성태9/2/202114199스크립트: 26. 파이썬 - PyCharm을 이용한 fork 디버그 방법
12822정성태9/1/202119270오류 유형: 759. 파이썬 tensorflow - ValueError: Shapes (...) and (...) are incompatible [2]
12821정성태9/1/202114654.NET Framework: 1112. C# - .NET 6부터 공개된 ISpanFormattable 사용법
12820정성태9/1/202115601VC++: 147. Golang - try/catch에 대응하는 panic/recover [1]파일 다운로드1
12819정성태8/31/202116068.NET Framework: 1111. C# - FormattableString 타입
12818정성태8/31/202113932Windows: 198. 윈도우 - 작업 관리자에서 (tensorflow 등으로 인한) GPU 연산 부하 보는 방법
12817정성태8/31/202117681스크립트: 25. 파이썬 - 윈도우 환경에서 directml을 이용한 tensorflow의 AMD GPU 사용 방법
12816정성태8/30/202123393스크립트: 24. 파이썬 - tensorflow 2.6 NVidia GPU 사용 방법 [2]
12815정성태8/30/202115783개발 환경 구성: 602. WSL 2 - docker-desktop-data, docker-desktop (%LOCALAPPDATA%\Docker\wsl\data\ext4.vhdx) 파일을 다른 디렉터리로 옮기는 방법
12814정성태8/30/202120198.NET Framework: 1110. C# 11 - 인터페이스 내에 정적 추상 메서드 정의 가능 (DIM for Static Members) [2]파일 다운로드1
... 31  32  33  34  35  36  37  38  39  40  41  42  43  [44]  45  ...