Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 

NUMA 노드 수에 따른 IIS Worker Process(w3wp.exe) 설정

역시 이래서 경험이 중요한가 봅니다. ^^

개인적으로 사용하는 컴퓨터는 당연하겠지만, 업무/고객사에서 사용하는 컴퓨터에서 NUMA 아키텍처가 활성화된 시스템을 이제껏 본 적이 없습니다. 단지, 언젠가 읽었던 마이크로소프트웨어 잡지 책에서의 글로만 봤을 뿐.

미래의 멀티코어 환경을 위한 NUMA
; http://www.imaso.co.kr/?doc=bbs/gnuboard.php&bo_table=article&wr_id=33740

 (그냥 간단하게 생각하면, NUMA는 64개보다 많은 (논리) 프로세서가 장착된 시스템의 효율을 높이기 위한 구조라고 이해하면 무리가 없습니다.)

물론, 일반적인 상황이라면 NUMA 노드의 수를 모르고 지나칠 수 있었겠지만, 특이하게도, 특정 컴퓨터에 설치된 IIS Web AppPool들의 "Web Garden" 설정이 모두 0이었다는 점!

처음에는 Web Garden 설정이 잘못된 것이 아닌가 생각했는데요. 알고 보니, 마이크로소프트의 공식 문서에 다음과 같이 기재된 사항이었습니다.

Process Model Settings for an Application Pool <processModel>
; http://www.iis.net/configreference/system.applicationhost/applicationpools/add/processmodel

Web gardening and use of Non-Uniform Memory Access (NUMA) hardware, which you can configure by setting the maxProcesses attribute. For Web gardening, see maxProcesses to a value greater than one. For use of NUMA hardware, set maxProcesses to a value of "0" to specify that IIS runs the same number of worker processes as there are NUMA nodes.


아마도, 해당 고객사의 관리자가 직접 0으로 설정했을 리는 없을 것 같고... NUMA 노드가 1을 초과하는 경우 IIS 서버가 자동으로 감지해서 기본값을 0으로 해주는 것이 아닌가 생각됩니다. (이 부분은 예상일 뿐, 확인이 필요합니다. 그러나... 어떻게 확인해야 할까요? ^^;)

암튼, 그래서 maxProcesses 설정값이 0일 수 없다는 가정을 하시면 안됩니다.

아울러, NUMA에 대한 정보를 C#에서 구하고 싶다면 다음의 API를 이용할 수 있고,

PInvoke for GetLogicalProcessorInformation Function
; http://stackoverflow.com/questions/6972437/pinvoke-for-getlogicalprocessorinformation-function

기존 알려진 도구 중에는 sysinternal의 coreinfo를 이용하면 NUMA 정보를 쉽게 알 수 있습니다.

D:\tools> coreinfo -n

Coreinfo v3.2 - Dump information on system CPU and memory topology
Copyright (C) 2008-2012 Mark Russinovich
Sysinternals - www.sysinternals.com

Logical Processor to NUMA Node Map:
********  NUMA Node 0

아직은, 대부분의 시스템에서 저렇게 "NUMA Node 0" 한 줄만 출력될 테지만... 가끔 제가 겪은 그 고객사처럼 본격적으로 도입되는 경우도 있다는! ^^




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 7/17/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2022-03-31 11시47분
단일 프로세스에서 NUMA가 야기한 성능 저하
; https://netmarble.engineering/single-process-programming-numa-effect/

위의 글에서는 단일 프로세스(EXE)에서 NUMA 노드가 있는 서버에서 CPU 전체를 쓰기 위한 방법으로 "Node interleaving" 설정을 하라고 되어 있지만... 글쎄요, 재미있는 문제군요. ^^

일단, NUMA가 적용된 시스템은 프로세서(Processor)마다 메모리가 분할돼 할당이 되는 형식입니다. "Node interleaving"을 설정했다고 해서 그 시스템의 구조 자체가 바뀌는 것은 아닙니다. 결국, 프로세스(EXE)는 특정 NUMA 노드에 연결된 메모리에 로드돼 있다는 것은 분명 문제가 됩니다.

가령 A 프로세서가 test.exe를 A 프로세서와 연결된 메모리에 로드해 실행했다고 가정해 보겠습니다. 그 EXE 내에서 스레드를 생성해 B 프로세서에서 실행되도록 스케줄링을 했다면 결국 B 프로세서는 A 프로세서에 연결된 메모리를 어떤 식으로든 부하를 거쳐 접근할 수밖에 없습니다.

-----------------------------

그러니까, 가장 좋은 방법은 NUMA 시스템인 경우 응용 프로그램의 구조도 함께 바꾸는 것이 좋습니다. 기존의 단일 프로세스로 NUMA 시스템에서 성능을 높이려 하는 것은 적절한 방법은 아닙니다. 뭐랄까, 예전에도 32비트 프로세스를 64비트 운영체제에서 급한 김에 실행은 했지만, 결국 성능을 제대로 발휘하기 위해서는 64비트로 마이그레이션을 하는 것과 같은 이치일 것입니다.

-----------------------------

그런 의미에서 IIS에서 w3wp.exe Worker Process를 NUMA에 분산시켜 실행하는 것은 아주 정석적인 NUMA 시스템의 활용입니다. 가령 2개의 test.exe가 실행됐다면 IIS는 자동으로 그중 한 개는 A 프로세서에서 그와 연결된 메모리에 로드를 시킬 것이고, 또 다른 test.exe는 B 프로세서와 연결된 메모리에 로드를 할 것이기 때문입니다.
정성태

... 76  77  78  79  [80]  81  82  83  84  85  86  87  88  89  90  ...
NoWriterDateCnt.TitleFile(s)
11936정성태6/10/201918371Math: 58. C# - 최소 자승법의 1차, 2차 수렴 그래프 변화 확인 [2]파일 다운로드1
11935정성태6/9/201919941.NET Framework: 843. C# - PLplot 출력을 파일이 아닌 Window 화면으로 변경
11934정성태6/7/201921279VC++: 133. typedef struct와 타입 전방 선언으로 인한 C2371 오류파일 다운로드1
11933정성태6/7/201919609VC++: 132. enum 정의를 C++11의 enum class로 바꿀 때 유의할 사항파일 다운로드1
11932정성태6/7/201918789오류 유형: 544. C++ - fatal error C1017: invalid integer constant expression파일 다운로드1
11931정성태6/6/201919305개발 환경 구성: 441. C# - CairoSharp/GtkSharp 사용을 위한 프로젝트 구성 방법
11930정성태6/5/201919837.NET Framework: 842. .NET Reflection을 대체할 System.Reflection.Metadata 소개 [1]
11929정성태6/5/201919401.NET Framework: 841. Windows Forms/C# - 클립보드에 RTF 텍스트를 복사 및 확인하는 방법 [1]
11928정성태6/5/201918172오류 유형: 543. PowerShell 확장 설치 시 "Catalog file '[...].cat' is not found in the contents of the module" 오류 발생
11927정성태6/5/201919407스크립트: 15. PowerShell ISE의 스크립트를 복사 후 PPT/Word에 붙여 넣으면 한글이 깨지는 문제 [1]
11926정성태6/4/201919935오류 유형: 542. Visual Studio - pointer to incomplete class type is not allowed
11925정성태6/4/201919780VC++: 131. Visual C++ - uuid 확장 속성과 __uuidof 확장 연산자파일 다운로드1
11924정성태5/30/201921419Math: 57. C# - 해석학적 방법을 이용한 최소 자승법 [1]파일 다운로드1
11923정성태5/30/201921043Math: 56. C# - 그래프 그리기로 알아보는 경사 하강법의 최소/최댓값 구하기파일 다운로드1
11922정성태5/29/201918536.NET Framework: 840. ML.NET 데이터 정규화파일 다운로드1
11921정성태5/28/201924395Math: 55. C# - 다항식을 위한 최소 자승법(Least Squares Method)파일 다운로드1
11920정성태5/28/201916052.NET Framework: 839. C# - PLplot 색상 제어
11919정성태5/27/201920310Math: 54. C# - 최소 자승법의 1차 함수에 대한 매개변수를 단순 for 문으로 구하는 방법 [1]파일 다운로드1
11918정성태5/25/201921150Math: 53. C# - 행렬식을 이용한 최소 자승법(LSM: Least Square Method)파일 다운로드1
11917정성태5/24/201922135Math: 52. MathNet을 이용한 간단한 통계 정보 처리 - 분산/표준편차파일 다운로드1
11916정성태5/24/201919951Math: 51. MathNET + OxyPlot을 이용한 간단한 통계 정보 처리 - Histogram파일 다운로드1
11915정성태5/24/201923066Linux: 11. 리눅스의 환경 변수 관련 함수 정리 - putenv, setenv, unsetenv
11914정성태5/24/201922054Linux: 10. 윈도우의 GetTickCount와 리눅스의 clock_gettime파일 다운로드1
11913정성태5/23/201918764.NET Framework: 838. C# - 숫자형 타입의 bit(2진) 문자열, 16진수 문자열 구하는 방법파일 다운로드1
11912정성태5/23/201918726VS.NET IDE: 137. Visual Studio 2019 버전 16.1부터 리눅스 C/C++ 프로젝트에 추가된 WSL 지원
11911정성태5/23/201917492VS.NET IDE: 136. Visual Studio 2019 - 리눅스 C/C++ 프로젝트에 인텔리센스가 동작하지 않는 경우
... 76  77  78  79  [80]  81  82  83  84  85  86  87  88  89  90  ...