Microsoft MVP성태의 닷넷 이야기
글쓴 사람
조정용
홈페이지
첨부 파일
(연관된 글이 1개 있습니다.)

안녕하세요.
고민 고민하다 처음으로 질문 글을 올리게 되었습니다.

다름이 아니라 이번에 WCF 프로그램을 개발 하는 중에 생각치도 못한 심각한 문제가 발생되었습니다.

시나리오는 다음과 같습니다.

1. WCF 호스트는 주 호스트와 보조 호스트(N개)로 나누어집니다.
2. 클라이언트에서 주 호스트에 요청이 전달되면 처리 도중 조건에 의해 보조 호스트에 동일한 내용을 전파합니다. (복제)
3. 보조 호스트에 대한 요청 처리를 기다릴 필요는 없습니다. (성공을 기반으로 하나 실패하여도 무관, 방화벽 및 네트워크 장애 등등)


문제는 클라이언트에서 다량의 요청을 전달하면 2.번 항목의 복제 작업 때문에 응답에 대한 병목이 발생한다는 것입니다. (클라이언트가 받는 처리 시간이 들쑥날쑥합니다)
2.번 항목의 복제는 Task 클래스를 이용하여 waiting 없는 코드로 수행 하였기에 기대 결과는 호출자에 대한 영향이 없다고 생각했는데(실제로 스톱워치를 찍어봐도 그렇게 나오고)
정작 클라이언트 입장에서는 때때로 느리게 처리되었다...는 결과를 받게 되네요.

테스트 코드가 다량의 요청이라 백그라운드 처리 지연에 의한 리소스 고갈인가 의심도 되긴하는데....

해당 코드는 파일 (visual studio 2013으로 작성)로 첨부해두었습니다. (문제가 되는 부분만 떼어 다시 급하게 작성한거라 엉성하여도 이해부탁드립니다)


도움 부탁드리겠습니다.


[연관 글]






[최초 등록일: ]
[최종 수정일: 8/17/2014]


비밀번호

댓글 작성자
 



2014-08-18 04시56분
보내주신 WCF 서비스를 Visual Studio에서 F5 디버거로 시작하면, Output 창에 예외가 많이 발생하는 것을 볼 수 있습니다. 그것들을 아래의 글에 설명한대로,

First-Chance Exception
; http://www.sysnet.pe.kr/2/0/510

Exceptions 창에서 "Thrown"으로 설정해 두면 예외가 발생한 라인에서 디버거가 멈출 것입니다. 해당 에러들을 모두 수정하신 다음에 다시 소스 코드를 올려주세요. (아마 제 생각에는 그 예외들을 고치다 보면 현상이 해결될 것입니다.)
정성태
2014-08-19 02시32분
[조정용] 답변 감사드립니다.
말씀하신 Exception은 사실 발생할 수밖에 없는 구조입니다.
원격 호스트가 없거나 방화벽등의 장애로 연결 할 수 없을 경우 WCF Channel Open 과정에서 각종 Exception을 발생시키는데 이를 수정하기 위한 조건은 결국 원격 호스트가 정상적으로 열어 있어야만 합니다.
하지만 시나리오 상으로 호스트가 없거나 연결할 수 없는 경우도 있기 때문에 Excepiton을 수정할 수는 없습니다.
예외를 front caller에 throw하지 않고 아무런 처리를 하지 않도록 하여도 클라이언트에 대한 응답 병목현상은 해결이 안되네요 ㅜㅜ;
[guest]
2014-08-19 01시46분
@조정용 그렇다면 ^^ 상황이 달라지는군요. 일단, Task.Run은 스레드 풀을 기반으로 하는데, 이게 무조건 스레드를 늘리는 방식이 아닙니다. 이 때문에 지연 현상이 발생하는 것입니다. 관련해서는 다음의 글을 참고하세요.

ThreadPool.QueueUserWorkItem 의 실행 지연
; http://www.sysnet.pe.kr/2/0/1455

Task의 내부 구현은 살펴봐야겠지만 어쨌든 전체적인 맥락은 위의 글에 따를 것이므로 지연 현상이 발생합니다. 따라서 ReplicaProvider.Transfer 내부의 Task.Run( ... )을 new Thread( () => ... ).Start();로 바꿔주시면 되는데요. 이렇게 해도 문제가 됩니다.

왜냐하면 TestModuleClient.Use 메서드가 잘못 작성되었습니다.

public void Use(...)
{
    try { ... } catch (...) { Use(...); }
}

위와 같이 되어 있는데, 예외가 발생하면 그 내부에서 다시 Use를 호출하기 때문에 서버와 연결이 되지 않으면 무한 재귀 호출 현상에 빠집니다. 따라서, Thread 수가 급격하게 늘어나기 시작하고 예외 처리가 무겁기 때문에 CPU 100% 현상이 발생합니다.

그렇다고 catch 절의 Use를 제거했다고 해서 문제가 해결되는 것은 아닙니다. Socket.Connect TCP 연결 메서드는 내부적으로 연결 시도를 하기 때문에 Connect에서 예외가 발생하기까지 시간이 걸립니다. 따라서, 마찬가지로 급격하게 스레드가 늘어나고 역시 마찬가지로 CPU 100% 현상이 발생합니다.

따라서, 이를 해결하려면 Replica를 호출하는 전용 스레드를 하나만 두고 Queue를 만들어 처리하는 방식으로 바꿔야 합니다. 서버가 연결되지 않는 경우, 마찬가지로 Queue에는 급격하게 요청이 쌓일 것이므로 Queue의 최대 수를 적절하게 조절해서 처리하는 것이 좋습니다.
정성태
2014-08-23 10시39분
[조정용] 자세한 설명과 참고자료 정말 감사드립니다.
스레드의 지연 현상은 정말 의외네요 ^^;
조언 주신데로 장기 사용할 전용 스레드로 수행하도록 해야겠습니다.

다시 한번 감사드립니다.
[guest]

1  2  3  [4]  5  6  7  8  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
5857guest3/17/20232989귀도 반 로썸을 보고 [4]
5856guest3/17/20233197Form1_FormClosing에 closing time을 Sqlite 저장하는 법? [6]파일 다운로드1
5855욜로3/17/20232777C# 메타데이터에서 불러오는 참조 정의가 안됨 [1]
5854민성3/16/20232967안녕하세요 asp.net mvc using문 관련하여 [1]
5853pa3/16/20233218오피스 2016 업데이트 후 파일 출력 불가 [1]
5852guest3/16/20232908입력 foreach 검색/출력 foreach [3]
5851guest3/15/20233243foreach내 list변경 [10]
5850독서가3/14/20232905C#에서 동적dll 사용시 문의입니다. [4]파일 다운로드1
5849guest3/9/20232893C# wpf로 Web에서 구동되는 hts가능한가요? (노트북없고 스마트폰 없음) [4]
5848민성3/9/20232800도움 요청드립니다. [2]파일 다운로드1
5847guest3/7/20232953SQlike Like 구문 - 1시간째 인데 안되네요 [13]
5846Huuu...3/7/20232639웹 다운로드에 대한 고찰 [5]파일 다운로드1
5845guest3/7/20232663C# Split함수의 불친절함 [1]
5844까망이3/7/20232781c# 무료 디컴파일러는 어떤게 좋습니까? [1]
5843guest3/7/20232746판매 후 dll 등 에러 [5]
5842kr13/6/20232788publish 할 때 분석기 관련 dll 제외 [5]
5841guest3/3/20232972프로그램 판매 시 - Upgrade 버전 판매 [2]
5840joe3/2/20233072C# 클래스 라이브러리 수정 -> C++에서 참조시 함수 목록 갱신되지 않음. [4]파일 다운로드1
5839guest3/2/20233702윈도우 서비스 프로그램 - FORM 애플리케이션 감시서비스 [8]
5838랄랄라3/1/20232907event 사용 시 두 표현의 차이점이 있을까요? [1]
5837감사합니...2/28/20233062오라클 DB서버 접속관련 문의 드립니다.(Load Balancing, HA Events) [2]
5836박지범2/27/20232856static instance의 initialize 순서가 보장되나요? [6]
5835주민호2/25/20235680Windows Software Development Kit - 최신버전 1개 남기고 다 삭제하면 안되는지요? [10]파일 다운로드1
5834guest2/24/20232908Python IDE - 비주얼스튜디오 [3]
5833무지남2/23/20232613Async 메서드 그리고 나서 Bool 메서드 [5]
5832김지우2/21/20232916event와 delegate의 차이 , event를 써야하는 이유 [1]
1  2  3  [4]  5  6  7  8  9  10  11  12  13  14  15  ...