Microsoft MVP성태의 닷넷 이야기
글쓴 사람
조정용
홈페이지
첨부 파일
(연관된 글이 1개 있습니다.)

안녕하세요.
고민 고민하다 처음으로 질문 글을 올리게 되었습니다.

다름이 아니라 이번에 WCF 프로그램을 개발 하는 중에 생각치도 못한 심각한 문제가 발생되었습니다.

시나리오는 다음과 같습니다.

1. WCF 호스트는 주 호스트와 보조 호스트(N개)로 나누어집니다.
2. 클라이언트에서 주 호스트에 요청이 전달되면 처리 도중 조건에 의해 보조 호스트에 동일한 내용을 전파합니다. (복제)
3. 보조 호스트에 대한 요청 처리를 기다릴 필요는 없습니다. (성공을 기반으로 하나 실패하여도 무관, 방화벽 및 네트워크 장애 등등)


문제는 클라이언트에서 다량의 요청을 전달하면 2.번 항목의 복제 작업 때문에 응답에 대한 병목이 발생한다는 것입니다. (클라이언트가 받는 처리 시간이 들쑥날쑥합니다)
2.번 항목의 복제는 Task 클래스를 이용하여 waiting 없는 코드로 수행 하였기에 기대 결과는 호출자에 대한 영향이 없다고 생각했는데(실제로 스톱워치를 찍어봐도 그렇게 나오고)
정작 클라이언트 입장에서는 때때로 느리게 처리되었다...는 결과를 받게 되네요.

테스트 코드가 다량의 요청이라 백그라운드 처리 지연에 의한 리소스 고갈인가 의심도 되긴하는데....

해당 코드는 파일 (visual studio 2013으로 작성)로 첨부해두었습니다. (문제가 되는 부분만 떼어 다시 급하게 작성한거라 엉성하여도 이해부탁드립니다)


도움 부탁드리겠습니다.


[연관 글]






[최초 등록일: ]
[최종 수정일: 8/17/2014]


비밀번호

댓글 작성자
 



2014-08-18 04시56분
보내주신 WCF 서비스를 Visual Studio에서 F5 디버거로 시작하면, Output 창에 예외가 많이 발생하는 것을 볼 수 있습니다. 그것들을 아래의 글에 설명한대로,

First-Chance Exception
; http://www.sysnet.pe.kr/2/0/510

Exceptions 창에서 "Thrown"으로 설정해 두면 예외가 발생한 라인에서 디버거가 멈출 것입니다. 해당 에러들을 모두 수정하신 다음에 다시 소스 코드를 올려주세요. (아마 제 생각에는 그 예외들을 고치다 보면 현상이 해결될 것입니다.)
정성태
2014-08-19 02시32분
[조정용] 답변 감사드립니다.
말씀하신 Exception은 사실 발생할 수밖에 없는 구조입니다.
원격 호스트가 없거나 방화벽등의 장애로 연결 할 수 없을 경우 WCF Channel Open 과정에서 각종 Exception을 발생시키는데 이를 수정하기 위한 조건은 결국 원격 호스트가 정상적으로 열어 있어야만 합니다.
하지만 시나리오 상으로 호스트가 없거나 연결할 수 없는 경우도 있기 때문에 Excepiton을 수정할 수는 없습니다.
예외를 front caller에 throw하지 않고 아무런 처리를 하지 않도록 하여도 클라이언트에 대한 응답 병목현상은 해결이 안되네요 ㅜㅜ;
[guest]
2014-08-19 01시46분
@조정용 그렇다면 ^^ 상황이 달라지는군요. 일단, Task.Run은 스레드 풀을 기반으로 하는데, 이게 무조건 스레드를 늘리는 방식이 아닙니다. 이 때문에 지연 현상이 발생하는 것입니다. 관련해서는 다음의 글을 참고하세요.

ThreadPool.QueueUserWorkItem 의 실행 지연
; http://www.sysnet.pe.kr/2/0/1455

Task의 내부 구현은 살펴봐야겠지만 어쨌든 전체적인 맥락은 위의 글에 따를 것이므로 지연 현상이 발생합니다. 따라서 ReplicaProvider.Transfer 내부의 Task.Run( ... )을 new Thread( () => ... ).Start();로 바꿔주시면 되는데요. 이렇게 해도 문제가 됩니다.

왜냐하면 TestModuleClient.Use 메서드가 잘못 작성되었습니다.

public void Use(...)
{
    try { ... } catch (...) { Use(...); }
}

위와 같이 되어 있는데, 예외가 발생하면 그 내부에서 다시 Use를 호출하기 때문에 서버와 연결이 되지 않으면 무한 재귀 호출 현상에 빠집니다. 따라서, Thread 수가 급격하게 늘어나기 시작하고 예외 처리가 무겁기 때문에 CPU 100% 현상이 발생합니다.

그렇다고 catch 절의 Use를 제거했다고 해서 문제가 해결되는 것은 아닙니다. Socket.Connect TCP 연결 메서드는 내부적으로 연결 시도를 하기 때문에 Connect에서 예외가 발생하기까지 시간이 걸립니다. 따라서, 마찬가지로 급격하게 스레드가 늘어나고 역시 마찬가지로 CPU 100% 현상이 발생합니다.

따라서, 이를 해결하려면 Replica를 호출하는 전용 스레드를 하나만 두고 Queue를 만들어 처리하는 방식으로 바꿔야 합니다. 서버가 연결되지 않는 경우, 마찬가지로 Queue에는 급격하게 요청이 쌓일 것이므로 Queue의 최대 수를 적절하게 조절해서 처리하는 것이 좋습니다.
정성태
2014-08-23 10시39분
[조정용] 자세한 설명과 참고자료 정말 감사드립니다.
스레드의 지연 현상은 정말 의외네요 ^^;
조언 주신데로 장기 사용할 전용 스레드로 수행하도록 해야겠습니다.

다시 한번 감사드립니다.
[guest]

... 76  77  78  79  80  81  [82]  83  84  85  86  87  88  89  90  ...
NoWriterDateCnt.TitleFile(s)
4086/22/20067381    답변글 invoke 관련하여...
401김용국6/19/20068539SmartClient에서 동적 어셈블리 관련 문의 드립니다 [1]
402김용국6/20/20067900    답변글 [답변]: SmartClient에서 동적 어셈블리 관련 문의 드립니다 ... 다시 문의 드립니다! [1]
404김용국6/20/20068130        답변글 [답변]: [답변]: SmartClient에서 동적 어셈블리 관련 문의 드립니다 ... 다시 문의 드립니다! [1]
405김용국6/21/20068453            답변글 잘 되네요~~ ^^ 고맙습니다!
407김용국6/21/20067870                답변글 [답변]: 다시한번 문의드립니다!
398김성호6/17/20068618IE프로그래밍 관련하여 질문이
400정성태6/19/20068270    답변글 [답변]: IE프로그래밍 관련하여 질문이 [5]
396guest6/13/20068245CallByName 을 어떻게 처리해야 할지 ....조언 부탁합니다.
397정성태6/15/20067942    답변글 [답변]: CallByName 을 어떻게 처리해야 할지 ....조언 부탁합니다.
399guest6/19/20067645        답변글 [답변]: [답변]: CallByName 을 어떻게 처리해야 할지 ....조언 부탁합니다.
392이상식6/9/20068363스마트클라이언트 실행환경 관련 질문입니다.
394정성태6/12/20068226    답변글 [답변]: 스마트클라이언트 실행 환경 관련 질문입니다.
395이상식6/12/20068607        답변글 [답변]: [답변]: 스마트클라이언트 실행환경 관련 질문입니다.
391심현철6/9/20068462Win32 platform과 .NET platform간의 성능이 어느정도 차이가 날까요?
393정성태6/12/20068112    답변글 [답변]: Win32 platform과 .NET platform간의 성능이 어느정도 차이가 날까요?
390이현행6/6/20068298정말 답답해서 그렇습니다. [1]
389임경훈6/2/200618100sql과 oracle 사용시 파라메타 차이점
387창민 6/1/20069935안녕하세요.문제가 걸렸는데 해결기미가 안보여서 답답해서.. 혹시 아시면 문제 채질이라도...파일 다운로드1
388정성태6/1/20069647    답변글 [답변]: 안녕하세요.문제가 걸렸는데 해결기미가 안보여서 답답해서.. 혹시 아시면 문제 채질이라도...
385오윤섭5/31/20067390SmartClient 동적호출
386정성태6/1/20067787    답변글 [답변]: SmartClient 동적 호출
380윤용한5/29/20067957ATL Event에서 스크립트가 값을 다시 돌려주는 방법은?파일 다운로드1
381윤용한5/29/20067570    답변글 [답변]: ATL Event에서 스크립트가 값을 다시 돌려주는 방법은?
382윤용한5/29/20068129        답변글 [답변]: [답변]: ATL Event에서 스크립트가 값을 다시 돌려주는 방법은?
383정성태5/30/20068406            답변글 [답변]: [답변]: [답변]: ATL Event에서 스크립트가 값을 다시 돌려주는 방법은?
... 76  77  78  79  80  81  [82]  83  84  85  86  87  88  89  90  ...