Microsoft MVP성태의 닷넷 이야기
.NET Framework: 354. x64 - AspCompat과 STA COM 개체가 성능에 미치는 영향 [링크 복사], [링크+제목 복사],
조회: 20671
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 
(연관된 글이 1개 있습니다.)

x64 - AspCompat과 STA COM 개체가 성능에 미치는 영향

지난번에 x86에서 이 상황을 테스트 한 결과를 설명했는데요.

x86 - AspCompat과 STA COM 개체가 성능에 미치는 영향
; https://www.sysnet.pe.kr/2/0/1394

재미있게도, x64 프로세스에서는 상황이 달라집니다. 우선, AspCompat=true와 Page_Load에서 x64 STA COM 개체를 생성한 경우를 한번 볼까요?

// ==== default.aspx ====
<%@ Page AspCompat="true" Title="Home Page" Language="C#" MasterPageFile="~/Site.master" AutoEventWireup="true"
    CodeBehind="Default.aspx.cs" Inherits="WebApplication1._Default" %>

	... [HTML 생략]...

// ==== default.aspx.cs ====
using System;
using System.Web;
using System.Web.UI;
using System.Web.UI.WebControls;

namespace WebApplication1
{
    public partial class _Default : System.Web.UI.Page
    {
        protected void Page_Load(object sender, EventArgs e)
        {
            WebTestHelperLib.ComAptTestClass catc = new WebTestHelperLib.ComAptTestClass();

            catc.DoMethod();
        }
    }
}

default.aspx.cs 코드를 다음과 같이 변경시키고,

protected void Page_Load(object sender, EventArgs e)
{
    int tid;
    WebTestHelperLib.ComAptTestClass catc = new WebTestHelperLib.ComAptTestClass();
    int aptKind = catc.DoMethod3(5, out tid);

    StringBuilder sb = new StringBuilder();

    sb.AppendFormat("ctor Thread: {0}<br />", _pageTid);
    sb.AppendFormat("ctor Apt: {0}<br />", GetCurrentApt());
    sb.AppendFormat("Page_Load Thread: {0}<br />", AppDomain.GetCurrentThreadId());
    sb.AppendFormat("Page_Load Thread Apt: {0}<br />", GetCurrentApt());
    sb.AppendFormat("Com Thread: {0}<br />", tid);
    sb.AppendFormat("Com Apt: {0}<br />", aptKind);

    Label1.Text = sb.ToString();
}

public int GetCurrentApt()
{
    FieldInfo fieldInfo = typeof(Thread).GetField("DONT_USE_InternalThread", BindingFlags.NonPublic | BindingFlags.Instance);
    IntPtr objValue = (IntPtr)fieldInfo.GetValue(Thread.CurrentThread);

    if (IntPtr.Size == 4)
    {
        IntPtr teb = new IntPtr(Marshal.ReadInt32(objValue, 16 * 4));

        IntPtr reservedForOle = new IntPtr(teb.ToInt64() + 0xf80);
        long ReservedForOle = Marshal.ReadInt64(reservedForOle); // TEB.ReservedForOle
        if (ReservedForOle == 0)
        {
            return -1;
        }

        IntPtr pNativeApt = new IntPtr(ReservedForOle + 0x50);
        long NativeApt = Marshal.ReadInt64(pNativeApt); // SOleTlsData.pNativeApt

        IntPtr pAptKind = new IntPtr(NativeApt + 0x0c);
        int AptKind = Marshal.ReadInt32(pAptKind); // CComApartment._AptKind

        return AptKind;
    }
    else
    {
        IntPtr teb = new IntPtr(Marshal.ReadInt64(objValue, 16 * 6));
        IntPtr reservedForOle = new IntPtr(teb.ToInt64() + 0x1758);
        long ReservedForOle = Marshal.ReadInt64(reservedForOle); // TEB.ReservedForOle
        if (ReservedForOle == 0)
        {
            return -1;
        }

        IntPtr pNativeApt = new IntPtr(ReservedForOle + 0x80);
        long NativeApt = Marshal.ReadInt64(pNativeApt); // SOleTlsData.pNativeApt

        IntPtr pAptKind = new IntPtr(NativeApt + 0x10);
        int AptKind = Marshal.ReadInt32(pAptKind); // CComApartment._AptKind

        return AptKind;
    }
}

COM 개체에서 제공되는 DoMethod3 메서드에도 x64에 대한 고려를 추가합니다.

STDMETHODIMP CComAptTest::DoMethod3(LONG sleepSecond,LONG *tid, LONG *aptKind)
{
    ::Sleep(sleepSecond * 1000);

    *tid = ::GetCurrentThreadId();

    do 
    {
#if defined(_AMD64_)
        BYTE *pTeb = (BYTE *)NtCurrentTeb();
        __int64 *pOle = (__int64 *)(pTeb + 0x1758);

        if (*pOle == 0)
        {
            printf("No apartment\n");
            break;
        }

        __int64 *pNativeApt = (__int64 *)(*pOle + 0x80);
        *aptKind = *(int *)(*pNativeApt + 0x10);

#elif defined(_X86_)
        BYTE *pTeb = (BYTE *)NtCurrentTeb();
        int *pOle = (int *)(pTeb + 0xf80);

        if (*pOle == 0)
        {
            printf("No apartment\n");
            break;
        }

        int *pNativeApt = (int *)(*pOle + 0x50);
        *aptKind = *(int *)(*pNativeApt + 0x0c);

#endif
    } while (false);

    return S_OK;
}

자... 이렇게 하고 2개의 요청을 동시에 보내면 다음과 같은 결과를 얻을 수 있습니다.

ctor Thread: 34124
ctor Apt: 4
Page_Load Thread: 7836
Page_Load Thread Apt: 4
Com Thread: 7836
Com Apt: 4

ctor Thread: 27452
ctor Apt: 4
Page_Load Thread: 7836
Page_Load Thread Apt: 4
Com Thread: 7836
Com Apt: 4

오... 뭔가 바뀌지 않았나요? ctor Apt == 4 == STA인데요. 처음 요청을 34124, 27452 스레드로 받고 있는데 이것들이 모두 STA 스레드로 초기화되어 있습니다. 여기서 유추해 볼 수 있는 것은 STA COM 개체를 가진 웹 페이지를 처리할 수 있는 전용 STA 스레드 풀을 가지는 것으로 보입니다.

비록 STA로 초기화된 스레드 풀이긴 하지만 COM 개체가 멀티스레드 용이 아니기 때문에 다시 전용 7836 STA 스레드에 COM 메서드 호출을 직렬화하고 있습니다.

x64부터는, AspCompat=True로 지정한 웹 페이지와 그렇지 않은 웹 페이지들에 대해 각각 별도의 스레드 풀을 제공하고 있는 것입니다.




AspCompat=True 값을 설정하지 않은 경우에는 0x80004002 예외가 발생하므로 생략합니다.




AspCompat=True인 경우, STA COM 개체를 Page_Load가 아닌 생성자나 멤버 변수 정의 시에는 어떨까요? 다음은 그 결과입니다.

ctor Thread: 29200
ctor Apt: 4
Page_Load Thread: 13888
Page_Load Thread Apt: 4
Com Thread: 7836
Com Apt: 4

ctor Thread: 35820
ctor Apt: 4
Page_Load Thread: 13888
Page_Load Thread Apt: 4
Com Thread: 7836
Com Apt: 4

이것 역시 x86과 유사한 결과를 가지지만, 다른 점이 있다면 맨 처음 요청을 처리하는 ctor 스레드가 STA로 초기화된 스레드 풀의 스레드라는 점입니다. 덕분에 STA COM 개체를 Page_Load 이전 단계에서 생성한다고 해도 MTA를 위한 웹 페이지들의 요청에는 영향을 주지 않습니다. 게다가 STA 스레드 풀을 별도로 운영하여 사용자의 요청을 받아들이고는 곧바로 별도의 STA 스레드(위에서는 13888)로 요청을 전달하고는 다음 사용자의 요청을 곧바로 받아들이게 됩니다. 따라서, x86에서 발생했던 스레드 풀 고갈 현상이 x64에서는 발생하지 않습니다.




결론을 내려보면, x64에서는 COM 개체의 생성을 어느 때 해도 전체적인 성능에는 크게 영향을 미치지는 않습니다.

하지만, COM 개체가 기왕이면 MTA로 만들어지는 것이 전체적인 페이지 반응 속도 향상에 도움이 된다는 사실에는 변함이 없습니다.




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 6/27/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




... 61  62  63  64  65  66  67  68  69  70  71  72  [73]  74  75  ...
NoWriterDateCnt.TitleFile(s)
12111정성태1/12/202020600디버깅 기술: 155. C# - KernelMemoryIO 드라이버를 이용해 실행 프로그램을 숨기는 방법(DKOM: Direct Kernel Object Modification) [16]파일 다운로드1
12110정성태1/11/202019970디버깅 기술: 154. Patch Guard로 인해 블루 스크린(BSOD)가 발생하는 사례 [5]파일 다운로드1
12109정성태1/10/202016638오류 유형: 588. Driver 프로젝트 빌드 오류 - Inf2Cat error -2: "Inf2Cat, signability test failed."
12108정성태1/10/202017460오류 유형: 587. Kernel Driver 시작 시 127(The specified procedure could not be found.) 오류 메시지 발생
12107정성태1/10/202018660.NET Framework: 877. C# - 프로세스의 모든 핸들을 열람 - 두 번째 이야기
12106정성태1/8/202019676VC++: 136. C++ - OSR Driver Loader와 같은 Legacy 커널 드라이버 설치 프로그램 제작 [1]
12105정성태1/8/202018181디버깅 기술: 153. C# - PEB를 조작해 로드된 DLL을 숨기는 방법
12104정성태1/7/202019415DDK: 9. 커널 메모리를 읽고 쓰는 NT Legacy driver와 C# 클라이언트 프로그램 [4]
12103정성태1/7/202022537DDK: 8. Visual Studio 2019 + WDK Legacy Driver 제작- Hello World 예제 [1]파일 다운로드2
12102정성태1/6/202018837디버깅 기술: 152. User 권한(Ring 3)의 프로그램에서 _ETHREAD 주소(및 커널 메모리를 읽을 수 있다면 _EPROCESS 주소) 구하는 방법
12101정성태1/5/202019187.NET Framework: 876. C# - PEB(Process Environment Block)를 통해 로드된 모듈 목록 열람
12100정성태1/3/202016613.NET Framework: 875. .NET 3.5 이하에서 IntPtr.Add 사용
12099정성태1/3/202019468디버깅 기술: 151. Windows 10 - Process Explorer로 확인한 Handle 정보를 windbg에서 조회 [1]
12098정성태1/2/202019271.NET Framework: 874. C# - 커널 구조체의 Offset 값을 하드 코딩하지 않고 사용하는 방법 [3]
12097정성태1/2/202017376디버깅 기술: 150. windbg - Wow64, x86, x64에서의 커널 구조체(예: TEB) 구조체 확인
12096정성태12/30/201919975디버깅 기술: 149. C# - DbgEng.dll을 이용한 간단한 디버거 제작 [1]
12095정성태12/27/201921707VC++: 135. C++ - string_view의 동작 방식
12094정성태12/26/201919389.NET Framework: 873. C# - 코드를 통해 PDB 심벌 파일 다운로드 방법
12093정성태12/26/201918979.NET Framework: 872. C# - 로딩된 Native DLL의 export 함수 목록 출력파일 다운로드1
12092정성태12/25/201917690디버깅 기술: 148. cdb.exe를 이용해 (ntdll.dll 등에 정의된) 커널 구조체 출력하는 방법
12091정성태12/25/201920033디버깅 기술: 147. pdb 파일을 다운로드하기 위한 symchk.exe 실행에 필요한 최소 파일 [1]
12090정성태12/24/201920123.NET Framework: 871. .NET AnyCPU로 빌드된 PE 헤더의 로딩 전/후 차이점 [1]파일 다운로드1
12089정성태12/23/201919080디버깅 기술: 146. gflags와 _CrtIsMemoryBlock을 이용한 Heap 메모리 손상 여부 체크
12088정성태12/23/201918034Linux: 28. Linux - 윈도우의 "Run as different user" 기능을 shell에서 실행하는 방법
12087정성태12/21/201918550디버깅 기술: 145. windbg/sos - Dictionary의 entries 배열 내용을 모두 덤프하는 방법 (do_hashtable.py) [1]
12086정성태12/20/201921086디버깅 기술: 144. windbg - Marshal.FreeHGlobal에서 발생한 덤프 분석 사례
... 61  62  63  64  65  66  67  68  69  70  71  72  [73]  74  75  ...