Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 

NUMA 노드 수에 따른 IIS Worker Process(w3wp.exe) 설정

역시 이래서 경험이 중요한가 봅니다. ^^

개인적으로 사용하는 컴퓨터는 당연하겠지만, 업무/고객사에서 사용하는 컴퓨터에서 NUMA 아키텍처가 활성화된 시스템을 이제껏 본 적이 없습니다. 단지, 언젠가 읽었던 마이크로소프트웨어 잡지 책에서의 글로만 봤을 뿐.

미래의 멀티코어 환경을 위한 NUMA
; http://www.imaso.co.kr/?doc=bbs/gnuboard.php&bo_table=article&wr_id=33740

 (그냥 간단하게 생각하면, NUMA는 64개보다 많은 (논리) 프로세서가 장착된 시스템의 효율을 높이기 위한 구조라고 이해하면 무리가 없습니다.)

물론, 일반적인 상황이라면 NUMA 노드의 수를 모르고 지나칠 수 있었겠지만, 특이하게도, 특정 컴퓨터에 설치된 IIS Web AppPool들의 "Web Garden" 설정이 모두 0이었다는 점!

처음에는 Web Garden 설정이 잘못된 것이 아닌가 생각했는데요. 알고 보니, 마이크로소프트의 공식 문서에 다음과 같이 기재된 사항이었습니다.

Process Model Settings for an Application Pool <processModel>
; http://www.iis.net/configreference/system.applicationhost/applicationpools/add/processmodel

Web gardening and use of Non-Uniform Memory Access (NUMA) hardware, which you can configure by setting the maxProcesses attribute. For Web gardening, see maxProcesses to a value greater than one. For use of NUMA hardware, set maxProcesses to a value of "0" to specify that IIS runs the same number of worker processes as there are NUMA nodes.


아마도, 해당 고객사의 관리자가 직접 0으로 설정했을 리는 없을 것 같고... NUMA 노드가 1을 초과하는 경우 IIS 서버가 자동으로 감지해서 기본값을 0으로 해주는 것이 아닌가 생각됩니다. (이 부분은 예상일 뿐, 확인이 필요합니다. 그러나... 어떻게 확인해야 할까요? ^^;)

암튼, 그래서 maxProcesses 설정값이 0일 수 없다는 가정을 하시면 안됩니다.

아울러, NUMA에 대한 정보를 C#에서 구하고 싶다면 다음의 API를 이용할 수 있고,

PInvoke for GetLogicalProcessorInformation Function
; http://stackoverflow.com/questions/6972437/pinvoke-for-getlogicalprocessorinformation-function

기존 알려진 도구 중에는 sysinternal의 coreinfo를 이용하면 NUMA 정보를 쉽게 알 수 있습니다.

D:\tools> coreinfo -n

Coreinfo v3.2 - Dump information on system CPU and memory topology
Copyright (C) 2008-2012 Mark Russinovich
Sysinternals - www.sysinternals.com

Logical Processor to NUMA Node Map:
********  NUMA Node 0

아직은, 대부분의 시스템에서 저렇게 "NUMA Node 0" 한 줄만 출력될 테지만... 가끔 제가 겪은 그 고객사처럼 본격적으로 도입되는 경우도 있다는! ^^




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 7/17/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2022-03-31 11시47분
단일 프로세스에서 NUMA가 야기한 성능 저하
; https://netmarble.engineering/single-process-programming-numa-effect/

위의 글에서는 단일 프로세스(EXE)에서 NUMA 노드가 있는 서버에서 CPU 전체를 쓰기 위한 방법으로 "Node interleaving" 설정을 하라고 되어 있지만... 글쎄요, 재미있는 문제군요. ^^

일단, NUMA가 적용된 시스템은 프로세서(Processor)마다 메모리가 분할돼 할당이 되는 형식입니다. "Node interleaving"을 설정했다고 해서 그 시스템의 구조 자체가 바뀌는 것은 아닙니다. 결국, 프로세스(EXE)는 특정 NUMA 노드에 연결된 메모리에 로드돼 있다는 것은 분명 문제가 됩니다.

가령 A 프로세서가 test.exe를 A 프로세서와 연결된 메모리에 로드해 실행했다고 가정해 보겠습니다. 그 EXE 내에서 스레드를 생성해 B 프로세서에서 실행되도록 스케줄링을 했다면 결국 B 프로세서는 A 프로세서에 연결된 메모리를 어떤 식으로든 부하를 거쳐 접근할 수밖에 없습니다.

-----------------------------

그러니까, 가장 좋은 방법은 NUMA 시스템인 경우 응용 프로그램의 구조도 함께 바꾸는 것이 좋습니다. 기존의 단일 프로세스로 NUMA 시스템에서 성능을 높이려 하는 것은 적절한 방법은 아닙니다. 뭐랄까, 예전에도 32비트 프로세스를 64비트 운영체제에서 급한 김에 실행은 했지만, 결국 성능을 제대로 발휘하기 위해서는 64비트로 마이그레이션을 하는 것과 같은 이치일 것입니다.

-----------------------------

그런 의미에서 IIS에서 w3wp.exe Worker Process를 NUMA에 분산시켜 실행하는 것은 아주 정석적인 NUMA 시스템의 활용입니다. 가령 2개의 test.exe가 실행됐다면 IIS는 자동으로 그중 한 개는 A 프로세서에서 그와 연결된 메모리에 로드를 시킬 것이고, 또 다른 test.exe는 B 프로세서와 연결된 메모리에 로드를 할 것이기 때문입니다.
정성태

... 31  32  33  34  35  36  [37]  38  39  40  41  42  43  44  45  ...
NoWriterDateCnt.TitleFile(s)
13016정성태3/27/202215956.NET Framework: 1183. C# 11에 추가된 ref 필드의 (우회) 구현 방법파일 다운로드1
13015정성태3/26/202217672.NET Framework: 1182. C# 11 - ref struct에 ref 필드를 허용 [1]
13014정성태3/23/202215086VC++: 155. CComPtr/CComQIPtr과 Conformance mode 옵션의 충돌 [1]
13013정성태3/22/202212880개발 환경 구성: 641. WSL 우분투 인스턴스에 파이썬 2.7 개발 환경 구성하는 방법
13012정성태3/21/202212513오류 유형: 803. C# - Local '...' or its members cannot have their address taken and be used inside an anonymous method or lambda expression
13011정성태3/21/202215993오류 유형: 802. 윈도우 운영체제에서 웹캠 카메라 인식이 안 되는 경우
13010정성태3/21/202212704오류 유형: 801. Oracle.ManagedDataAccess.Core - GetTypes 호출 시 "Could not load file or assembly 'System.DirectoryServices.Protocols...'" 오류
13009정성태3/20/202215311개발 환경 구성: 640. docker - ibmcom/db2 컨테이너 실행
13008정성태3/19/202214925VS.NET IDE: 176. 비주얼 스튜디오 - 솔루션 탐색기에서 프로젝트를 선택할 때 csproj 파일이 열리지 않도록 만드는 방법
13007정성태3/18/202213289.NET Framework: 1181. C# - Oracle.ManagedDataAccess의 Pool 및 그것의 연결 개체 수를 알아내는 방법파일 다운로드1
13006정성태3/17/202215695.NET Framework: 1180. C# - ffmpeg(FFmpeg.AutoGen)를 이용한 remuxing.c 예제 포팅
13005정성태3/17/202213998오류 유형: 800. C# - System.InvalidOperationException: Late bound operations cannot be performed on fields with types for which Type.ContainsGenericParameters is true.
13004정성태3/16/202213512디버깅 기술: 182. windbg - 닷넷 메모리 덤프에서 AppDomain에 걸친 정적(static) 필드 값을 조사하는 방법
13003정성태3/15/202213838.NET Framework: 1179. C# - (.NET Framework를 위한) Oracle.ManagedDataAccess 패키지의 성능 카운터 설정 방법
13002정성태3/14/202215417.NET Framework: 1178. C# - ffmpeg(FFmpeg.AutoGen)를 이용한 http_multiclient.c 예제 포팅
13001정성태3/13/202216039.NET Framework: 1177. C# - 닷넷에서 허용하는 메서드의 매개변수와 호출 인자의 최대 수
13000정성태3/12/202214998.NET Framework: 1176. C# - Oracle.ManagedDataAccess.Core의 성능 카운터 설정 방법
12999정성태3/10/202214819.NET Framework: 1175. Visual Studio - 프로젝트 또는 솔루션의 Clean 작업 시 응용 프로그램에서 생성한 파일을 함께 삭제파일 다운로드1
12998정성태3/10/202213256.NET Framework: 1174. C# - ELEMENT_TYPE_FNPTR 유형의 사용 예
12997정성태3/10/202222369오류 유형: 799. Oracle.ManagedDataAccess - "ORA-01882: timezone region not found" 오류가 발생하는 이유
12996정성태3/9/202223784VS.NET IDE: 175. Visual Studio - 인텔리센스에서 오버로드 메서드를 키보드로 선택하는 방법
12995정성태3/8/202216149.NET Framework: 1173. .NET에서 Producer/Consumer를 구현한 BlockingCollection<T>
12994정성태3/8/202215211오류 유형: 798. WinDbg - Failed to load data access module, 0x80004002
12993정성태3/4/202214928.NET Framework: 1172. .NET에서 Producer/Consumer를 구현하는 기초 인터페이스 - IProducerConsumerCollection<T>
12992정성태3/3/202217912.NET Framework: 1171. C# - BouncyCastle을 사용한 암호화/복호화 예제파일 다운로드1
12991정성태3/2/202215684.NET Framework: 1170. C# - ffmpeg(FFmpeg.AutoGen)를 이용한 transcode_aac.c 예제 포팅
... 31  32  33  34  35  36  [37]  38  39  40  41  42  43  44  45  ...