Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 
(연관된 글이 2개 있습니다.)

제니퍼 닷넷 적용 사례 (3) - '닷넷'이 문제일까? '닷넷 개발자'가 문제일까?

아래의 글을 읽어보면,

닷넷 가비지 컬렉션 다시 보기 - Part IV
; http://www.simpleisbest.net/post/2011/04/18/When-GC-Occurs.aspx

재미있는 사례가 하나 나옵니다.

필자가 몇 년 전 모 보험 회사의 성능 튜닝에 들어갔을 때 보았던 코드는 수 백 개의 테이블을 가진 Typed DataSet이 문제의 원인이었다. 이 데이터 셋은 단순히 new 하는 것만으로도 64MB 정도의 메모리를 쳐먹었으며 이 메모리를 할당하는 동안 몇 차례의 가비지 컬렉션이 발생할 정도였다. 그리고 더 웃긴 것은, 이 뷩신 같은 데이터 셋을 테이블 1-2개 조회하는데 잠깐 사용하고 버려버리는 코드들이 발견 되었다. 이로 인해 0, 1, 2세대 가비지 컬렉션이 미친 듯이 발생했고 CPU는 가비지 컬렉션만 수행하다 볼일을 다 보고 웹 사이트는 무지하게 느려진 것이다. (이런 미친 코드를 작성한 SI 업체는 어디론가 도망가 버렸고 그 보험 회사는 닷넷 욕을 엄청 해 댔으며, 6개월 후 시스템 개편 때 미련 없이 이 어플리케이션을 자바로 갈아치워 버렸다!)


닷넷하면서... 저렇게 자바로 넘어갔다는 사연을 심심치 않게 들어볼 수 있는데, 그저 안타까울 뿐입니다.

'제니퍼 닷넷' 성능 모니터링 도구를 적용하는 사이트를 보면서, 종종 위와 비슷한 상황을 만나게 됩니다. 이번에 소개해 드릴 사례가 바로 그러한데요. 이 웹 사이트는 모든 Biz 로직을 WCF로 옮겨서 서비스로 처리를 하는 상황이었습니다. 그런데, 서비스 공개하고 1달이 지나는 동안 성능 문제로 고생을 하게 되었으며, 이를 해결하기 위해 검색하다가 우연히 '제니퍼 닷넷'을 알게 되어 적용까지 하게 된 것입니다.

아래는, 처음 그 웹 사이트에 '제니퍼 닷넷'을 설치하고 운영되는 모습을 캡쳐한 것입니다.

wcf_recycle_1.png

저녁 시간을 이용해서 모니터링하고 있었기 때문에 요청은 많지 않았지만, 보시는 것처럼 그나마 발생하는 몇몇 요청조차도 스피드 미터에서는 '빨간색' 바(Bar)로 쌓이는 것을 볼 수 있고, 응답시간분포도(X-View)에서는 대다수의 요청들이 5초 이상으로 걸리는 상황을 볼 수 있습니다. (스피드 미터의 '빨간색' 바는 현재 들어온 요청이 8초 이상 처리가 계속 진행 중임을 의미합니다.)

X-View의 몇몇 점들에 대해 '상세 보기'로 들어가면 다음과 같이 WCF 호출 마다 1.5초 정도씩 소요되는 것을 볼 수 있었습니다.

wcf_recycle_2.png

이것만 보면... 분명 WCF에 어떤 문제가 있는 것 같습니다.




IIS는 웹 애플리케이션 내의 파일이 변경되는 경우, In-process 내에서 기존 AppDomain을 내리고 다시 생성하여 웹 애플리케이션을 호스팅하는 기능이 있습니다. '제니퍼 닷넷'에서는 이런 경우를 쉽게 인식할 수 있도록 "장애진단" / "유틸리티" / "시스템 환경 변수" 메뉴를 통해서 Recycle 된 횟수를 보여줍니다.

문제가 있던 그 웹 사이트는 WCF를 호스팅하는 웹 애플리케이션이 지속적으로 Recycle 횟수가 증가하는 현상을 보였고, 아래의 화면은 해당 화면을 캡쳐한 것입니다. (29번째 재생되었음을 나타내고 있으며, 일반적으로는 1이어야 합니다.)

wcf_recycle_3.png

위의 결과를 확인한 후, Recycle을 유발시키는 원인을 찾아보았습니다. 혹시 상상이 가시나요? ... 문제는 다름아닌, WCF 메서드 내에서 '웹 애플리케이션' 폴더의 하위에 '로그 파일'을 쓰고 있었기 때문이었습니다. 따라서, WCF 메서드가 호출될 때마다 IIS는 In-process recycle을 시도하게 되었고 새롭게 로드되는 AppDomain 및 WCF의 호스팅 초기화 부담으로 인해 WCF 메서드의 응답시간들이 지연되는 사태가 발생한 것입니다.

임시로, 로그 파일을 쓰는 폴더에 대해 해당 AppPool 계정만 "Deny" 설정을 한 후 모니터링을 했는데, 결과는 다음과 같이 나왔습니다.

wcf_recycle_4.png

차이점을 한 눈에 확인할 수 있는데요. Recycle이 발생하지 않는 시점부터는 전체적인 응답시간이 아래로 가라앉아서 안정적인 모습을 볼 수 있습니다.




위의 결과를 보기 전, 해당 웹 사이트를 개발한 업체는 그동안 'WCF'에 문제가 있는 것이 아닌가 의심했었다고 합니다. 만약, 위와 같은 원인 파악이 안된 체로 이런 상황이 쭉 진행되었다면... 아마도 그 업체는 지금쯤 WCF를 모두 걷어냈을 지도 모를 일입니다. (그에 따른 비용은 둘째치고, WCF에 대한 신뢰도 하락은 회복 불가능이었을 것입니다.)

결과적으로, 해당 업체는 로그를 남기는 함수 내에서 경로를 수정하기로 했고 아마 지금쯤이면 ^^ 웹 사이트가 정상적으로 서비스들을 호스팅하고 있을 것입니다.

어쨌든... '제니퍼 닷넷'으로 이렇게 금방 성능 문제를 짚어낼 수 있다는 것은... 좀 대단하긴 하지요? ^^




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 7/9/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2012-01-13 11시38분
[사이] WOW !! COOL!!!
[guest]
2012-01-14 10시34분
제가 보기에는... "Hot"한데요. ^^ 그나저나... 대학원 가는 날까지 며칠 남았어요? (부럽당~~~ ^^)
정성태
2016-10-17 12시50분
[ryujh] 안녕하세요.
웹사이트 가상디렉토리에 서버공유폴더가 연결되어 있으며 서버공유폴더에 파일이 업로드 됩니다. 이 경우도 가상디렉토리가 포함된 어플리케이션의 AppDomain 이 recycle 되는 것이 맞는지요?
그렇다면 AppDomain recycle 이 된다는 것을 어떻게 확인할 수 있을까요? 단 제니퍼가 없는 경우이고 제가 확인한 것은 성능 모니터, IIS 어플리케이션 풀 등에서는 변화를 찾을 수 없었습니다.
결국 프로그래밍으로 AppDomain recycle 을 체크해야 하는지요? 감사합니다.
[guest]
2016-10-17 01시52분
@ryujh 님, 말씀하신 현상으로 봐서는 recycle이 안 되는 것 같습니다. recycle이 되면 작업 관리자에서도 w3wp.exe의 pid가 바뀌는 걸로 확인할 수 있습니다. 또는, IIS AppPool 설정에 보면 "Generate Recycle Event Log Entry" 항목의 값을 통해 이벤트 로그에 남기는 것도 가능합니다.

Recycling Settings for an Application Pool <recycling>
; https://www.iis.net/configreference/system.applicationhost/applicationpools/add/recycling

또는, 이런 방법도 있습니다.

Health Monitoring for Application’s Lifetime related events in ASP.NET 2.0
; https://docs.microsoft.com/en-us/archive/blogs/rahulso/health-monitoring-for-applications-lifetime-related-events-in-asp-net-2-0
정성태
2016-10-17 02시42분
[ryujh] 답변 감사합니다. 알려주신 주소 참고하겠습니다.

처음에 질문한 것에 보충하자면 사이트에 파일을 업로드 후 업로드 한 파일을 가상디렉토리 경로로 접근하면 간헐적으로 행(hang) 현상이 발생하며 몇분동안 지속됩니다. 이때 어플리케이션 풀이 재생되지는 않으며 IIS에서 어플리케이션 풀을 수동으로 '재생'하면 행 현상이 사라집니다. 올려주신 원문을 읽었을 때 저는 appdomain recycle 이 application pool recycle 과는 다른 것으로 보고 appdomain recycle 에 대해 확인할 수 있는지 문의드린 것 입니다.

참고로 검색을 해보니

What causes an application pool in IIS to recycle?
http://stackoverflow.com/questions/302110/what-causes-an-application-pool-in-iis-to-recycle

What exactly is Appdomain recycling
http://stackoverflow.com/questions/37564/what-exactly-is-appdomain-recycling

이렇게 나와서 이제 appdomain recycle 을 확인할 수 있으면 행(hang) 현상의 원인을 다른 분께 설명할 수 있다고 봅니다.

* 행현상 원인 찾으면서 사이트의 windbg 사용, 디버깅 방법 등을 알게 되었고 도움 많이 되었습니다.
[guest]
2016-10-17 02시55분
본문의 내용은 w3wp.exe의 recycle 현상입니다.

말씀하신 것처럼, 마이크로소프트는 exe 수준에서의 recycle을 할 때도 있고, 단순히 .NET 내부의 AppDomain을 다시 올리는 수준에서 recycle할 때도 있습니다. (이에 대한 기준은 찾을 수 없었습니다.)

IIS - (프로세스 종료 없는) AppDomain Recycle
; https://www.sysnet.pe.kr/2/0/13672

AppDomain recycle의 경우에는 간단하게 AppDomain.DomainUnload 이벤트를 걸어두시면 됩니다. 그 외에 이벤트 로그에 AppDomain recycle에 대해서도 발생하는지는 확인을 못해봤습니다. (ryujh 님이 해보시고 덧글 남겨주신면... ^^)
정성태

... 136  [137]  138  139  140  141  142  143  144  145  146  147  148  149  150  ...
NoWriterDateCnt.TitleFile(s)
1629정성태2/5/201432451개발 환경 구성: 215. DOS batch - 하나의 .bat 파일에서 다중 .bat 파일을 (비동기로) 실행하는 방법 [1]
1628정성태2/4/201433815Windows: 87. 윈도우 8.1에서 .NET 3.5 설치가 안된다면? [2]
1627정성태2/4/201428915개발 환경 구성: 214. SQL Server Reporting Services를 이용해 간단한 리포트 제작하는 방법
1626정성태2/4/201420886Windows: 86. 윈도우 8.1의 Skydrive 내용이 동기화가 안된다면?
1625정성태2/2/201428098.NET Framework: 422. C++과 C#의 Event 공유파일 다운로드1
1624정성태2/2/201423677.NET Framework: 421. ASP.NET에서 Server.CreateObject와 COM Interop 클래스 생성의 차이점
1623정성태2/1/201428417개발 환경 구성: 213. x86/x64별로 나뉘어진 어셈블리를 한 프로젝트에서 참조하는 방법 [1]파일 다운로드1
1622정성태1/31/201428915VC++: 74. 어떤 것을 쓰면 좋을까요? wvnsprintf, _vsnwprintf_s, StringCbVPrintfW [4]
1621정성태1/31/201420698.NET Framework: 420. 베트남의 11학년(한국의 고2)이 45분만에 푼다는 알고리즘 문제파일 다운로드1
1620정성태1/30/201430533.NET Framework: 419. C# - BigDecimal파일 다운로드1
1619정성태1/30/201427294VS.NET IDE: 85. T4를 이용한 INotifyPropertyChanged 코드 자동 생성파일 다운로드1
1618정성태1/29/201442977Linux: 2. 우분투에서 Active Directory 계정을 이용한 파일 공유
1617정성태1/29/201424116.NET Framework: 418. Thread.Abort 호출의 hang 현상 [1]
1616정성태1/29/201424767디버깅 기술: 63. windbg 디버깅 사례: AppDomain 간의 static 변수 사용으로 인한 crash
1615정성태1/29/201426744.NET Framework: 417. WPF WebBrowser 컨트롤에서 SHDocVw.IWebBrowser2 인터페이스를 구하는 방법 및 순수 WPF 웹 브라우저 컨트롤 소개
1614정성태1/29/201423696.NET Framework: 416. System.Net.Sockets.NetworkStream이 Thread-safe할까?파일 다운로드1
1613정성태1/29/201425746.NET Framework: 415. IIS 작업자 프로세스 재생(recycle)하는 방법 [1]
1612정성태1/29/201422484오류 유형: 219. IIS 500 Internal Server Error - Skydrive에 공유된 경우
1611정성태1/27/201453892.NET Framework: 414. C# - 컴퓨터에서 알아낼 수 있는 고윳값 정리 [3]파일 다운로드1
1610정성태1/26/201437808.NET Framework: 413. C# - chromiumembedded 사용 [11]파일 다운로드1
1609정성태1/26/201420817오류 유형: 218. wsDualHttpBinding + Windows Server 2003인 경우 발생하는 오류
1608정성태1/26/201426117.NET Framework: 412. HttpContext.Current를 통해 이해하는 CallContext와 ExecutionContext [4]
1607정성태1/26/201426075.NET Framework: 411. 유니코드의 "compatibility character"가 뭘까요? [4]파일 다운로드1
1606정성태1/25/201424170오류 유형: 217. 델 베뉴 스타일러스 관련 업데이트 오류 - 5830_Firmware_X267N_WN_1.0.4.1_A01.EXE
1605정성태1/23/201421069개발 환경 구성: 212. Visual Studio Online과 "Monaco" 서비스 연동
1604정성태1/23/201421404오류 유형: 216. 윈도우 서버 백업 - Hyper-V 가상 머신이 백업되지 않는 경우 (2)
... 136  [137]  138  139  140  141  142  143  144  145  146  147  148  149  150  ...