Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 
(연관된 글이 2개 있습니다.)

제니퍼 닷넷 적용 사례 (3) - '닷넷'이 문제일까? '닷넷 개발자'가 문제일까?

아래의 글을 읽어보면,

닷넷 가비지 컬렉션 다시 보기 - Part IV
; http://www.simpleisbest.net/post/2011/04/18/When-GC-Occurs.aspx

재미있는 사례가 하나 나옵니다.

필자가 몇 년 전 모 보험 회사의 성능 튜닝에 들어갔을 때 보았던 코드는 수 백 개의 테이블을 가진 Typed DataSet이 문제의 원인이었다. 이 데이터 셋은 단순히 new 하는 것만으로도 64MB 정도의 메모리를 쳐먹었으며 이 메모리를 할당하는 동안 몇 차례의 가비지 컬렉션이 발생할 정도였다. 그리고 더 웃긴 것은, 이 뷩신 같은 데이터 셋을 테이블 1-2개 조회하는데 잠깐 사용하고 버려버리는 코드들이 발견 되었다. 이로 인해 0, 1, 2세대 가비지 컬렉션이 미친 듯이 발생했고 CPU는 가비지 컬렉션만 수행하다 볼일을 다 보고 웹 사이트는 무지하게 느려진 것이다. (이런 미친 코드를 작성한 SI 업체는 어디론가 도망가 버렸고 그 보험 회사는 닷넷 욕을 엄청 해 댔으며, 6개월 후 시스템 개편 때 미련 없이 이 어플리케이션을 자바로 갈아치워 버렸다!)


닷넷하면서... 저렇게 자바로 넘어갔다는 사연을 심심치 않게 들어볼 수 있는데, 그저 안타까울 뿐입니다.

'제니퍼 닷넷' 성능 모니터링 도구를 적용하는 사이트를 보면서, 종종 위와 비슷한 상황을 만나게 됩니다. 이번에 소개해 드릴 사례가 바로 그러한데요. 이 웹 사이트는 모든 Biz 로직을 WCF로 옮겨서 서비스로 처리를 하는 상황이었습니다. 그런데, 서비스 공개하고 1달이 지나는 동안 성능 문제로 고생을 하게 되었으며, 이를 해결하기 위해 검색하다가 우연히 '제니퍼 닷넷'을 알게 되어 적용까지 하게 된 것입니다.

아래는, 처음 그 웹 사이트에 '제니퍼 닷넷'을 설치하고 운영되는 모습을 캡쳐한 것입니다.

wcf_recycle_1.png

저녁 시간을 이용해서 모니터링하고 있었기 때문에 요청은 많지 않았지만, 보시는 것처럼 그나마 발생하는 몇몇 요청조차도 스피드 미터에서는 '빨간색' 바(Bar)로 쌓이는 것을 볼 수 있고, 응답시간분포도(X-View)에서는 대다수의 요청들이 5초 이상으로 걸리는 상황을 볼 수 있습니다. (스피드 미터의 '빨간색' 바는 현재 들어온 요청이 8초 이상 처리가 계속 진행 중임을 의미합니다.)

X-View의 몇몇 점들에 대해 '상세 보기'로 들어가면 다음과 같이 WCF 호출 마다 1.5초 정도씩 소요되는 것을 볼 수 있었습니다.

wcf_recycle_2.png

이것만 보면... 분명 WCF에 어떤 문제가 있는 것 같습니다.




IIS는 웹 애플리케이션 내의 파일이 변경되는 경우, In-process 내에서 기존 AppDomain을 내리고 다시 생성하여 웹 애플리케이션을 호스팅하는 기능이 있습니다. '제니퍼 닷넷'에서는 이런 경우를 쉽게 인식할 수 있도록 "장애진단" / "유틸리티" / "시스템 환경 변수" 메뉴를 통해서 Recycle 된 횟수를 보여줍니다.

문제가 있던 그 웹 사이트는 WCF를 호스팅하는 웹 애플리케이션이 지속적으로 Recycle 횟수가 증가하는 현상을 보였고, 아래의 화면은 해당 화면을 캡쳐한 것입니다. (29번째 재생되었음을 나타내고 있으며, 일반적으로는 1이어야 합니다.)

wcf_recycle_3.png

위의 결과를 확인한 후, Recycle을 유발시키는 원인을 찾아보았습니다. 혹시 상상이 가시나요? ... 문제는 다름아닌, WCF 메서드 내에서 '웹 애플리케이션' 폴더의 하위에 '로그 파일'을 쓰고 있었기 때문이었습니다. 따라서, WCF 메서드가 호출될 때마다 IIS는 In-process recycle을 시도하게 되었고 새롭게 로드되는 AppDomain 및 WCF의 호스팅 초기화 부담으로 인해 WCF 메서드의 응답시간들이 지연되는 사태가 발생한 것입니다.

임시로, 로그 파일을 쓰는 폴더에 대해 해당 AppPool 계정만 "Deny" 설정을 한 후 모니터링을 했는데, 결과는 다음과 같이 나왔습니다.

wcf_recycle_4.png

차이점을 한 눈에 확인할 수 있는데요. Recycle이 발생하지 않는 시점부터는 전체적인 응답시간이 아래로 가라앉아서 안정적인 모습을 볼 수 있습니다.




위의 결과를 보기 전, 해당 웹 사이트를 개발한 업체는 그동안 'WCF'에 문제가 있는 것이 아닌가 의심했었다고 합니다. 만약, 위와 같은 원인 파악이 안된 체로 이런 상황이 쭉 진행되었다면... 아마도 그 업체는 지금쯤 WCF를 모두 걷어냈을 지도 모를 일입니다. (그에 따른 비용은 둘째치고, WCF에 대한 신뢰도 하락은 회복 불가능이었을 것입니다.)

결과적으로, 해당 업체는 로그를 남기는 함수 내에서 경로를 수정하기로 했고 아마 지금쯤이면 ^^ 웹 사이트가 정상적으로 서비스들을 호스팅하고 있을 것입니다.

어쨌든... '제니퍼 닷넷'으로 이렇게 금방 성능 문제를 짚어낼 수 있다는 것은... 좀 대단하긴 하지요? ^^




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 7/9/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2012-01-13 11시38분
[사이] WOW !! COOL!!!
[guest]
2012-01-14 10시34분
제가 보기에는... "Hot"한데요. ^^ 그나저나... 대학원 가는 날까지 며칠 남았어요? (부럽당~~~ ^^)
정성태
2016-10-17 12시50분
[ryujh] 안녕하세요.
웹사이트 가상디렉토리에 서버공유폴더가 연결되어 있으며 서버공유폴더에 파일이 업로드 됩니다. 이 경우도 가상디렉토리가 포함된 어플리케이션의 AppDomain 이 recycle 되는 것이 맞는지요?
그렇다면 AppDomain recycle 이 된다는 것을 어떻게 확인할 수 있을까요? 단 제니퍼가 없는 경우이고 제가 확인한 것은 성능 모니터, IIS 어플리케이션 풀 등에서는 변화를 찾을 수 없었습니다.
결국 프로그래밍으로 AppDomain recycle 을 체크해야 하는지요? 감사합니다.
[guest]
2016-10-17 01시52분
@ryujh 님, 말씀하신 현상으로 봐서는 recycle이 안 되는 것 같습니다. recycle이 되면 작업 관리자에서도 w3wp.exe의 pid가 바뀌는 걸로 확인할 수 있습니다. 또는, IIS AppPool 설정에 보면 "Generate Recycle Event Log Entry" 항목의 값을 통해 이벤트 로그에 남기는 것도 가능합니다.

Recycling Settings for an Application Pool <recycling>
; https://www.iis.net/configreference/system.applicationhost/applicationpools/add/recycling

또는, 이런 방법도 있습니다.

Health Monitoring for Application’s Lifetime related events in ASP.NET 2.0
; https://docs.microsoft.com/en-us/archive/blogs/rahulso/health-monitoring-for-applications-lifetime-related-events-in-asp-net-2-0
정성태
2016-10-17 02시42분
[ryujh] 답변 감사합니다. 알려주신 주소 참고하겠습니다.

처음에 질문한 것에 보충하자면 사이트에 파일을 업로드 후 업로드 한 파일을 가상디렉토리 경로로 접근하면 간헐적으로 행(hang) 현상이 발생하며 몇분동안 지속됩니다. 이때 어플리케이션 풀이 재생되지는 않으며 IIS에서 어플리케이션 풀을 수동으로 '재생'하면 행 현상이 사라집니다. 올려주신 원문을 읽었을 때 저는 appdomain recycle 이 application pool recycle 과는 다른 것으로 보고 appdomain recycle 에 대해 확인할 수 있는지 문의드린 것 입니다.

참고로 검색을 해보니

What causes an application pool in IIS to recycle?
http://stackoverflow.com/questions/302110/what-causes-an-application-pool-in-iis-to-recycle

What exactly is Appdomain recycling
http://stackoverflow.com/questions/37564/what-exactly-is-appdomain-recycling

이렇게 나와서 이제 appdomain recycle 을 확인할 수 있으면 행(hang) 현상의 원인을 다른 분께 설명할 수 있다고 봅니다.

* 행현상 원인 찾으면서 사이트의 windbg 사용, 디버깅 방법 등을 알게 되었고 도움 많이 되었습니다.
[guest]
2016-10-17 02시55분
본문의 내용은 w3wp.exe의 recycle 현상입니다.

말씀하신 것처럼, 마이크로소프트는 exe 수준에서의 recycle을 할 때도 있고, 단순히 .NET 내부의 AppDomain을 다시 올리는 수준에서 recycle할 때도 있습니다. (이에 대한 기준은 찾을 수 없었습니다.)

AppDomain recycle의 경우에는 간단하게 AppDomain.DomainUnload 이벤트를 걸어두시면 됩니다. 그 외에 이벤트 로그에 AppDomain recycle에 대해서도 발생하는지는 확인을 못해봤습니다. (ryujh 님이 해보시고 덧글 남겨주신면... ^^)
정성태

[1]  2  3  4  5  6  7  8  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
13606정성태4/24/202461닷넷: 2247. C# - tensorflow 연동 (MNIST 예제)파일 다운로드1
13605정성태4/23/2024322닷넷: 2246. C# - Python.NET을 이용한 파이썬 소스코드 연동파일 다운로드1
13604정성태4/22/2024334오류 유형: 901. Visual Studio - Unable to set the next statement. Set next statement cannot be used in '[Exception]' call stack frames.
13603정성태4/21/2024555닷넷: 2245. C# - IronPython을 이용한 파이썬 소스코드 연동파일 다운로드1
13602정성태4/20/2024795닷넷: 2244. C# - PCM 오디오 데이터를 연속(Streaming) 재생 (Windows Multimedia)파일 다운로드1
13601정성태4/19/2024837닷넷: 2243. C# - PCM 사운드 재생(NAudio)파일 다운로드1
13600정성태4/18/2024846닷넷: 2242. C# - 관리 스레드와 비관리 스레드
13599정성태4/17/2024862닷넷: 2241. C# - WAV 파일의 PCM 사운드 재생(Windows Multimedia)파일 다운로드1
13598정성태4/16/2024884닷넷: 2240. C# - WAV 파일 포맷 + LIST 헤더파일 다운로드2
13597정성태4/15/2024862닷넷: 2239. C# - WAV 파일의 PCM 데이터 생성 및 출력파일 다운로드1
13596정성태4/14/20241049닷넷: 2238. C# - WAV 기본 파일 포맷파일 다운로드1
13595정성태4/13/20241050닷넷: 2237. C# - Audio 장치 열기 (Windows Multimedia, NAudio)파일 다운로드1
13594정성태4/12/20241068닷넷: 2236. C# - Audio 장치 열람 (Windows Multimedia, NAudio)파일 다운로드1
13593정성태4/8/20241079닷넷: 2235. MSBuild - AccelerateBuildsInVisualStudio 옵션
13592정성태4/2/20241217C/C++: 165. CLion으로 만든 Rust Win32 DLL을 C#과 연동
13591정성태4/2/20241193닷넷: 2234. C# - WPF 응용 프로그램에 Blazor App 통합파일 다운로드1
13590정성태3/31/20241078Linux: 70. Python - uwsgi 응용 프로그램이 k8s 환경에서 OOM 발생하는 문제
13589정성태3/29/20241150닷넷: 2233. C# - 프로세스 CPU 사용량을 나타내는 성능 카운터와 Win32 API파일 다운로드1
13588정성태3/28/20241262닷넷: 2232. C# - Unity + 닷넷 App(WinForms/WPF) 간의 Named Pipe 통신 [2]파일 다운로드1
13587정성태3/27/20241168오류 유형: 900. Windows Update 오류 - 8024402C, 80070643
13586정성태3/27/20241328Windows: 263. Windows - 복구 파티션(Recovery Partition) 용량을 늘리는 방법
13585정성태3/26/20241112Windows: 262. PerformanceCounter의 InstanceName에 pid를 추가한 "Process V2"
13584정성태3/26/20241060개발 환경 구성: 708. Unity3D - C# Windows Forms / WPF Application에 통합하는 방법파일 다운로드1
13583정성태3/25/20241195Windows: 261. CPU Utilization이 100% 넘는 경우를 성능 카운터로 확인하는 방법
13582정성태3/19/20241454Windows: 260. CPU 사용률을 나타내는 2가지 수치 - 사용량(Usage)과 활용률(Utilization)파일 다운로드1
[1]  2  3  4  5  6  7  8  9  10  11  12  13  14  15  ...