Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 
(연관된 글이 2개 있습니다.)

제니퍼 닷넷 적용 사례 (3) - '닷넷'이 문제일까? '닷넷 개발자'가 문제일까?

아래의 글을 읽어보면,

닷넷 가비지 컬렉션 다시 보기 - Part IV
; http://www.simpleisbest.net/post/2011/04/18/When-GC-Occurs.aspx

재미있는 사례가 하나 나옵니다.

필자가 몇 년 전 모 보험 회사의 성능 튜닝에 들어갔을 때 보았던 코드는 수 백 개의 테이블을 가진 Typed DataSet이 문제의 원인이었다. 이 데이터 셋은 단순히 new 하는 것만으로도 64MB 정도의 메모리를 쳐먹었으며 이 메모리를 할당하는 동안 몇 차례의 가비지 컬렉션이 발생할 정도였다. 그리고 더 웃긴 것은, 이 뷩신 같은 데이터 셋을 테이블 1-2개 조회하는데 잠깐 사용하고 버려버리는 코드들이 발견 되었다. 이로 인해 0, 1, 2세대 가비지 컬렉션이 미친 듯이 발생했고 CPU는 가비지 컬렉션만 수행하다 볼일을 다 보고 웹 사이트는 무지하게 느려진 것이다. (이런 미친 코드를 작성한 SI 업체는 어디론가 도망가 버렸고 그 보험 회사는 닷넷 욕을 엄청 해 댔으며, 6개월 후 시스템 개편 때 미련 없이 이 어플리케이션을 자바로 갈아치워 버렸다!)


닷넷하면서... 저렇게 자바로 넘어갔다는 사연을 심심치 않게 들어볼 수 있는데, 그저 안타까울 뿐입니다.

'제니퍼 닷넷' 성능 모니터링 도구를 적용하는 사이트를 보면서, 종종 위와 비슷한 상황을 만나게 됩니다. 이번에 소개해 드릴 사례가 바로 그러한데요. 이 웹 사이트는 모든 Biz 로직을 WCF로 옮겨서 서비스로 처리를 하는 상황이었습니다. 그런데, 서비스 공개하고 1달이 지나는 동안 성능 문제로 고생을 하게 되었으며, 이를 해결하기 위해 검색하다가 우연히 '제니퍼 닷넷'을 알게 되어 적용까지 하게 된 것입니다.

아래는, 처음 그 웹 사이트에 '제니퍼 닷넷'을 설치하고 운영되는 모습을 캡쳐한 것입니다.

wcf_recycle_1.png

저녁 시간을 이용해서 모니터링하고 있었기 때문에 요청은 많지 않았지만, 보시는 것처럼 그나마 발생하는 몇몇 요청조차도 스피드 미터에서는 '빨간색' 바(Bar)로 쌓이는 것을 볼 수 있고, 응답시간분포도(X-View)에서는 대다수의 요청들이 5초 이상으로 걸리는 상황을 볼 수 있습니다. (스피드 미터의 '빨간색' 바는 현재 들어온 요청이 8초 이상 처리가 계속 진행 중임을 의미합니다.)

X-View의 몇몇 점들에 대해 '상세 보기'로 들어가면 다음과 같이 WCF 호출 마다 1.5초 정도씩 소요되는 것을 볼 수 있었습니다.

wcf_recycle_2.png

이것만 보면... 분명 WCF에 어떤 문제가 있는 것 같습니다.




IIS는 웹 애플리케이션 내의 파일이 변경되는 경우, In-process 내에서 기존 AppDomain을 내리고 다시 생성하여 웹 애플리케이션을 호스팅하는 기능이 있습니다. '제니퍼 닷넷'에서는 이런 경우를 쉽게 인식할 수 있도록 "장애진단" / "유틸리티" / "시스템 환경 변수" 메뉴를 통해서 Recycle 된 횟수를 보여줍니다.

문제가 있던 그 웹 사이트는 WCF를 호스팅하는 웹 애플리케이션이 지속적으로 Recycle 횟수가 증가하는 현상을 보였고, 아래의 화면은 해당 화면을 캡쳐한 것입니다. (29번째 재생되었음을 나타내고 있으며, 일반적으로는 1이어야 합니다.)

wcf_recycle_3.png

위의 결과를 확인한 후, Recycle을 유발시키는 원인을 찾아보았습니다. 혹시 상상이 가시나요? ... 문제는 다름아닌, WCF 메서드 내에서 '웹 애플리케이션' 폴더의 하위에 '로그 파일'을 쓰고 있었기 때문이었습니다. 따라서, WCF 메서드가 호출될 때마다 IIS는 In-process recycle을 시도하게 되었고 새롭게 로드되는 AppDomain 및 WCF의 호스팅 초기화 부담으로 인해 WCF 메서드의 응답시간들이 지연되는 사태가 발생한 것입니다.

임시로, 로그 파일을 쓰는 폴더에 대해 해당 AppPool 계정만 "Deny" 설정을 한 후 모니터링을 했는데, 결과는 다음과 같이 나왔습니다.

wcf_recycle_4.png

차이점을 한 눈에 확인할 수 있는데요. Recycle이 발생하지 않는 시점부터는 전체적인 응답시간이 아래로 가라앉아서 안정적인 모습을 볼 수 있습니다.




위의 결과를 보기 전, 해당 웹 사이트를 개발한 업체는 그동안 'WCF'에 문제가 있는 것이 아닌가 의심했었다고 합니다. 만약, 위와 같은 원인 파악이 안된 체로 이런 상황이 쭉 진행되었다면... 아마도 그 업체는 지금쯤 WCF를 모두 걷어냈을 지도 모를 일입니다. (그에 따른 비용은 둘째치고, WCF에 대한 신뢰도 하락은 회복 불가능이었을 것입니다.)

결과적으로, 해당 업체는 로그를 남기는 함수 내에서 경로를 수정하기로 했고 아마 지금쯤이면 ^^ 웹 사이트가 정상적으로 서비스들을 호스팅하고 있을 것입니다.

어쨌든... '제니퍼 닷넷'으로 이렇게 금방 성능 문제를 짚어낼 수 있다는 것은... 좀 대단하긴 하지요? ^^




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 7/9/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2012-01-13 11시38분
[사이] WOW !! COOL!!!
[guest]
2012-01-14 10시34분
제가 보기에는... "Hot"한데요. ^^ 그나저나... 대학원 가는 날까지 며칠 남았어요? (부럽당~~~ ^^)
정성태
2016-10-17 12시50분
[ryujh] 안녕하세요.
웹사이트 가상디렉토리에 서버공유폴더가 연결되어 있으며 서버공유폴더에 파일이 업로드 됩니다. 이 경우도 가상디렉토리가 포함된 어플리케이션의 AppDomain 이 recycle 되는 것이 맞는지요?
그렇다면 AppDomain recycle 이 된다는 것을 어떻게 확인할 수 있을까요? 단 제니퍼가 없는 경우이고 제가 확인한 것은 성능 모니터, IIS 어플리케이션 풀 등에서는 변화를 찾을 수 없었습니다.
결국 프로그래밍으로 AppDomain recycle 을 체크해야 하는지요? 감사합니다.
[guest]
2016-10-17 01시52분
@ryujh 님, 말씀하신 현상으로 봐서는 recycle이 안 되는 것 같습니다. recycle이 되면 작업 관리자에서도 w3wp.exe의 pid가 바뀌는 걸로 확인할 수 있습니다. 또는, IIS AppPool 설정에 보면 "Generate Recycle Event Log Entry" 항목의 값을 통해 이벤트 로그에 남기는 것도 가능합니다.

Recycling Settings for an Application Pool <recycling>
; https://www.iis.net/configreference/system.applicationhost/applicationpools/add/recycling

또는, 이런 방법도 있습니다.

Health Monitoring for Application’s Lifetime related events in ASP.NET 2.0
; https://docs.microsoft.com/en-us/archive/blogs/rahulso/health-monitoring-for-applications-lifetime-related-events-in-asp-net-2-0
정성태
2016-10-17 02시42분
[ryujh] 답변 감사합니다. 알려주신 주소 참고하겠습니다.

처음에 질문한 것에 보충하자면 사이트에 파일을 업로드 후 업로드 한 파일을 가상디렉토리 경로로 접근하면 간헐적으로 행(hang) 현상이 발생하며 몇분동안 지속됩니다. 이때 어플리케이션 풀이 재생되지는 않으며 IIS에서 어플리케이션 풀을 수동으로 '재생'하면 행 현상이 사라집니다. 올려주신 원문을 읽었을 때 저는 appdomain recycle 이 application pool recycle 과는 다른 것으로 보고 appdomain recycle 에 대해 확인할 수 있는지 문의드린 것 입니다.

참고로 검색을 해보니

What causes an application pool in IIS to recycle?
http://stackoverflow.com/questions/302110/what-causes-an-application-pool-in-iis-to-recycle

What exactly is Appdomain recycling
http://stackoverflow.com/questions/37564/what-exactly-is-appdomain-recycling

이렇게 나와서 이제 appdomain recycle 을 확인할 수 있으면 행(hang) 현상의 원인을 다른 분께 설명할 수 있다고 봅니다.

* 행현상 원인 찾으면서 사이트의 windbg 사용, 디버깅 방법 등을 알게 되었고 도움 많이 되었습니다.
[guest]
2016-10-17 02시55분
본문의 내용은 w3wp.exe의 recycle 현상입니다.

말씀하신 것처럼, 마이크로소프트는 exe 수준에서의 recycle을 할 때도 있고, 단순히 .NET 내부의 AppDomain을 다시 올리는 수준에서 recycle할 때도 있습니다. (이에 대한 기준은 찾을 수 없었습니다.)

IIS - (프로세스 종료 없는) AppDomain Recycle
; https://www.sysnet.pe.kr/2/0/13672

AppDomain recycle의 경우에는 간단하게 AppDomain.DomainUnload 이벤트를 걸어두시면 됩니다. 그 외에 이벤트 로그에 AppDomain recycle에 대해서도 발생하는지는 확인을 못해봤습니다. (ryujh 님이 해보시고 덧글 남겨주신면... ^^)
정성태

... 61  62  63  64  65  66  67  68  69  70  71  72  [73]  74  75  ...
NoWriterDateCnt.TitleFile(s)
12111정성태1/12/202020542디버깅 기술: 155. C# - KernelMemoryIO 드라이버를 이용해 실행 프로그램을 숨기는 방법(DKOM: Direct Kernel Object Modification) [16]파일 다운로드1
12110정성태1/11/202019851디버깅 기술: 154. Patch Guard로 인해 블루 스크린(BSOD)가 발생하는 사례 [5]파일 다운로드1
12109정성태1/10/202016583오류 유형: 588. Driver 프로젝트 빌드 오류 - Inf2Cat error -2: "Inf2Cat, signability test failed."
12108정성태1/10/202017424오류 유형: 587. Kernel Driver 시작 시 127(The specified procedure could not be found.) 오류 메시지 발생
12107정성태1/10/202018604.NET Framework: 877. C# - 프로세스의 모든 핸들을 열람 - 두 번째 이야기
12106정성태1/8/202019641VC++: 136. C++ - OSR Driver Loader와 같은 Legacy 커널 드라이버 설치 프로그램 제작 [1]
12105정성태1/8/202018141디버깅 기술: 153. C# - PEB를 조작해 로드된 DLL을 숨기는 방법
12104정성태1/7/202019348DDK: 9. 커널 메모리를 읽고 쓰는 NT Legacy driver와 C# 클라이언트 프로그램 [4]
12103정성태1/7/202022478DDK: 8. Visual Studio 2019 + WDK Legacy Driver 제작- Hello World 예제 [1]파일 다운로드2
12102정성태1/6/202018813디버깅 기술: 152. User 권한(Ring 3)의 프로그램에서 _ETHREAD 주소(및 커널 메모리를 읽을 수 있다면 _EPROCESS 주소) 구하는 방법
12101정성태1/5/202019069.NET Framework: 876. C# - PEB(Process Environment Block)를 통해 로드된 모듈 목록 열람
12100정성태1/3/202016551.NET Framework: 875. .NET 3.5 이하에서 IntPtr.Add 사용
12099정성태1/3/202019419디버깅 기술: 151. Windows 10 - Process Explorer로 확인한 Handle 정보를 windbg에서 조회 [1]
12098정성태1/2/202019166.NET Framework: 874. C# - 커널 구조체의 Offset 값을 하드 코딩하지 않고 사용하는 방법 [3]
12097정성태1/2/202017223디버깅 기술: 150. windbg - Wow64, x86, x64에서의 커널 구조체(예: TEB) 구조체 확인
12096정성태12/30/201919884디버깅 기술: 149. C# - DbgEng.dll을 이용한 간단한 디버거 제작 [1]
12095정성태12/27/201921598VC++: 135. C++ - string_view의 동작 방식
12094정성태12/26/201919341.NET Framework: 873. C# - 코드를 통해 PDB 심벌 파일 다운로드 방법
12093정성태12/26/201918911.NET Framework: 872. C# - 로딩된 Native DLL의 export 함수 목록 출력파일 다운로드1
12092정성태12/25/201917667디버깅 기술: 148. cdb.exe를 이용해 (ntdll.dll 등에 정의된) 커널 구조체 출력하는 방법
12091정성태12/25/201919971디버깅 기술: 147. pdb 파일을 다운로드하기 위한 symchk.exe 실행에 필요한 최소 파일 [1]
12090정성태12/24/201920083.NET Framework: 871. .NET AnyCPU로 빌드된 PE 헤더의 로딩 전/후 차이점 [1]파일 다운로드1
12089정성태12/23/201919037디버깅 기술: 146. gflags와 _CrtIsMemoryBlock을 이용한 Heap 메모리 손상 여부 체크
12088정성태12/23/201917975Linux: 28. Linux - 윈도우의 "Run as different user" 기능을 shell에서 실행하는 방법
12087정성태12/21/201918448디버깅 기술: 145. windbg/sos - Dictionary의 entries 배열 내용을 모두 덤프하는 방법 (do_hashtable.py) [1]
12086정성태12/20/201920970디버깅 기술: 144. windbg - Marshal.FreeHGlobal에서 발생한 덤프 분석 사례
... 61  62  63  64  65  66  67  68  69  70  71  72  [73]  74  75  ...