Microsoft MVP성태의 닷넷 이야기
.NET Framework: 354. x64 - AspCompat과 STA COM 개체가 성능에 미치는 영향 [링크 복사], [링크+제목 복사],
조회: 14929
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 
(연관된 글이 1개 있습니다.)

x64 - AspCompat과 STA COM 개체가 성능에 미치는 영향

지난번에 x86에서 이 상황을 테스트 한 결과를 설명했는데요.

x86 - AspCompat과 STA COM 개체가 성능에 미치는 영향
; https://www.sysnet.pe.kr/2/0/1394

재미있게도, x64 프로세스에서는 상황이 달라집니다. 우선, AspCompat=true와 Page_Load에서 x64 STA COM 개체를 생성한 경우를 한번 볼까요?

// ==== default.aspx ====
<%@ Page AspCompat="true" Title="Home Page" Language="C#" MasterPageFile="~/Site.master" AutoEventWireup="true"
    CodeBehind="Default.aspx.cs" Inherits="WebApplication1._Default" %>

	... [HTML 생략]...

// ==== default.aspx.cs ====
using System;
using System.Web;
using System.Web.UI;
using System.Web.UI.WebControls;

namespace WebApplication1
{
    public partial class _Default : System.Web.UI.Page
    {
        protected void Page_Load(object sender, EventArgs e)
        {
            WebTestHelperLib.ComAptTestClass catc = new WebTestHelperLib.ComAptTestClass();

            catc.DoMethod();
        }
    }
}

default.aspx.cs 코드를 다음과 같이 변경시키고,

protected void Page_Load(object sender, EventArgs e)
{
    int tid;
    WebTestHelperLib.ComAptTestClass catc = new WebTestHelperLib.ComAptTestClass();
    int aptKind = catc.DoMethod3(5, out tid);

    StringBuilder sb = new StringBuilder();

    sb.AppendFormat("ctor Thread: {0}<br />", _pageTid);
    sb.AppendFormat("ctor Apt: {0}<br />", GetCurrentApt());
    sb.AppendFormat("Page_Load Thread: {0}<br />", AppDomain.GetCurrentThreadId());
    sb.AppendFormat("Page_Load Thread Apt: {0}<br />", GetCurrentApt());
    sb.AppendFormat("Com Thread: {0}<br />", tid);
    sb.AppendFormat("Com Apt: {0}<br />", aptKind);

    Label1.Text = sb.ToString();
}

public int GetCurrentApt()
{
    FieldInfo fieldInfo = typeof(Thread).GetField("DONT_USE_InternalThread", BindingFlags.NonPublic | BindingFlags.Instance);
    IntPtr objValue = (IntPtr)fieldInfo.GetValue(Thread.CurrentThread);

    if (IntPtr.Size == 4)
    {
        IntPtr teb = new IntPtr(Marshal.ReadInt32(objValue, 16 * 4));

        IntPtr reservedForOle = new IntPtr(teb.ToInt64() + 0xf80);
        long ReservedForOle = Marshal.ReadInt64(reservedForOle); // TEB.ReservedForOle
        if (ReservedForOle == 0)
        {
            return -1;
        }

        IntPtr pNativeApt = new IntPtr(ReservedForOle + 0x50);
        long NativeApt = Marshal.ReadInt64(pNativeApt); // SOleTlsData.pNativeApt

        IntPtr pAptKind = new IntPtr(NativeApt + 0x0c);
        int AptKind = Marshal.ReadInt32(pAptKind); // CComApartment._AptKind

        return AptKind;
    }
    else
    {
        IntPtr teb = new IntPtr(Marshal.ReadInt64(objValue, 16 * 6));
        IntPtr reservedForOle = new IntPtr(teb.ToInt64() + 0x1758);
        long ReservedForOle = Marshal.ReadInt64(reservedForOle); // TEB.ReservedForOle
        if (ReservedForOle == 0)
        {
            return -1;
        }

        IntPtr pNativeApt = new IntPtr(ReservedForOle + 0x80);
        long NativeApt = Marshal.ReadInt64(pNativeApt); // SOleTlsData.pNativeApt

        IntPtr pAptKind = new IntPtr(NativeApt + 0x10);
        int AptKind = Marshal.ReadInt32(pAptKind); // CComApartment._AptKind

        return AptKind;
    }
}

COM 개체에서 제공되는 DoMethod3 메서드에도 x64에 대한 고려를 추가합니다.

STDMETHODIMP CComAptTest::DoMethod3(LONG sleepSecond,LONG *tid, LONG *aptKind)
{
    ::Sleep(sleepSecond * 1000);

    *tid = ::GetCurrentThreadId();

    do 
    {
#if defined(_AMD64_)
        BYTE *pTeb = (BYTE *)NtCurrentTeb();
        __int64 *pOle = (__int64 *)(pTeb + 0x1758);

        if (*pOle == 0)
        {
            printf("No apartment\n");
            break;
        }

        __int64 *pNativeApt = (__int64 *)(*pOle + 0x80);
        *aptKind = *(int *)(*pNativeApt + 0x10);

#elif defined(_X86_)
        BYTE *pTeb = (BYTE *)NtCurrentTeb();
        int *pOle = (int *)(pTeb + 0xf80);

        if (*pOle == 0)
        {
            printf("No apartment\n");
            break;
        }

        int *pNativeApt = (int *)(*pOle + 0x50);
        *aptKind = *(int *)(*pNativeApt + 0x0c);

#endif
    } while (false);

    return S_OK;
}

자... 이렇게 하고 2개의 요청을 동시에 보내면 다음과 같은 결과를 얻을 수 있습니다.

ctor Thread: 34124
ctor Apt: 4
Page_Load Thread: 7836
Page_Load Thread Apt: 4
Com Thread: 7836
Com Apt: 4

ctor Thread: 27452
ctor Apt: 4
Page_Load Thread: 7836
Page_Load Thread Apt: 4
Com Thread: 7836
Com Apt: 4

오... 뭔가 바뀌지 않았나요? ctor Apt == 4 == STA인데요. 처음 요청을 34124, 27452 스레드로 받고 있는데 이것들이 모두 STA 스레드로 초기화되어 있습니다. 여기서 유추해 볼 수 있는 것은 STA COM 개체를 가진 웹 페이지를 처리할 수 있는 전용 STA 스레드 풀을 가지는 것으로 보입니다.

비록 STA로 초기화된 스레드 풀이긴 하지만 COM 개체가 멀티스레드 용이 아니기 때문에 다시 전용 7836 STA 스레드에 COM 메서드 호출을 직렬화하고 있습니다.

x64부터는, AspCompat=True로 지정한 웹 페이지와 그렇지 않은 웹 페이지들에 대해 각각 별도의 스레드 풀을 제공하고 있는 것입니다.




AspCompat=True 값을 설정하지 않은 경우에는 0x80004002 예외가 발생하므로 생략합니다.




AspCompat=True인 경우, STA COM 개체를 Page_Load가 아닌 생성자나 멤버 변수 정의 시에는 어떨까요? 다음은 그 결과입니다.

ctor Thread: 29200
ctor Apt: 4
Page_Load Thread: 13888
Page_Load Thread Apt: 4
Com Thread: 7836
Com Apt: 4

ctor Thread: 35820
ctor Apt: 4
Page_Load Thread: 13888
Page_Load Thread Apt: 4
Com Thread: 7836
Com Apt: 4

이것 역시 x86과 유사한 결과를 가지지만, 다른 점이 있다면 맨 처음 요청을 처리하는 ctor 스레드가 STA로 초기화된 스레드 풀의 스레드라는 점입니다. 덕분에 STA COM 개체를 Page_Load 이전 단계에서 생성한다고 해도 MTA를 위한 웹 페이지들의 요청에는 영향을 주지 않습니다. 게다가 STA 스레드 풀을 별도로 운영하여 사용자의 요청을 받아들이고는 곧바로 별도의 STA 스레드(위에서는 13888)로 요청을 전달하고는 다음 사용자의 요청을 곧바로 받아들이게 됩니다. 따라서, x86에서 발생했던 스레드 풀 고갈 현상이 x64에서는 발생하지 않습니다.




결론을 내려보면, x64에서는 COM 개체의 생성을 어느 때 해도 전체적인 성능에는 크게 영향을 미치지는 않습니다.

하지만, COM 개체가 기왕이면 MTA로 만들어지는 것이 전체적인 페이지 반응 속도 향상에 도움이 된다는 사실에는 변함이 없습니다.




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 6/27/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




... 31  32  33  [34]  35  36  37  38  39  40  41  42  43  44  45  ...
NoWriterDateCnt.TitleFile(s)
12818정성태8/31/20217919Windows: 198. 윈도우 - 작업 관리자에서 (tensorflow 등으로 인한) GPU 연산 부하 보는 방법
12817정성태8/31/202110674스크립트: 25. 파이썬 - 윈도우 환경에서 directml을 이용한 tensorflow의 AMD GPU 사용 방법
12816정성태8/30/202116096스크립트: 24. 파이썬 - tensorflow 2.6 NVidia GPU 사용 방법 [2]
12815정성태8/30/20219132개발 환경 구성: 602. WSL 2 - docker-desktop-data, docker-desktop (%LOCALAPPDATA%\Docker\wsl\data\ext4.vhdx) 파일을 다른 디렉터리로 옮기는 방법
12814정성태8/30/202111721.NET Framework: 1110. C# 11 - 인터페이스 내에 정적 추상 메서드 정의 가능 (DIM for Static Members) [2]파일 다운로드1
12813정성태8/29/20219663.NET Framework: 1109. C# 10 - (11) Lambda 개선파일 다운로드1
12812정성태8/28/20219417.NET Framework: 1108. C# 10 - (10) 개선된 #line 지시자
12811정성태8/27/20219534Linux: 44. 윈도우 개발자를 위한 리눅스 fork 동작 방식 설명 (파이썬 코드)
12810정성태8/27/20218284.NET Framework: 1107. .NET Core/5+에서 동적 컴파일한 C# 코드를 (Breakpoint도 활용하며) 디버깅하는 방법 - #line 지시자파일 다운로드1
12809정성태8/26/20218977.NET Framework: 1106. .NET Core/5+에서 C# 코드를 동적으로 컴파일/사용하는 방법 [1]파일 다운로드1
12808정성태8/25/202110198오류 유형: 758. go: ...: missing go.sum entry; to add it: go mod download ...
12807정성태8/25/202110261.NET Framework: 1105. C# 10 - (9) 비동기 메서드가 사용할 AsyncMethodBuilder 선택 가능파일 다운로드1
12806정성태8/24/20217803개발 환경 구성: 601. PyCharm - 다중 프로세스 디버깅 방법
12805정성태8/24/20219103.NET Framework: 1104. C# 10 - (8) 분해 구문에서 기존 변수의 재사용 가능파일 다운로드1
12804정성태8/24/20219720.NET Framework: 1103. C# 10 - (7) Source Generator V2 APIs
12803정성태8/23/20219553개발 환경 구성: 600. pip cache 디렉터리 옮기는 방법
12802정성태8/23/20219808.NET Framework: 1102. .NET Conf Mini 21.08 - WinUI 3 따라해 보기 [1]
12801정성태8/23/20219249.NET Framework: 1101. C# 10 - (6) record class 타입의 ToString 메서드를 sealed 처리 허용파일 다운로드1
12800정성태8/22/20219467개발 환경 구성: 599. PyCharm - (반대로) 원격 프로세스가 PyCharm에 디버그 연결하는 방법
12799정성태8/22/20219599.NET Framework: 1100. C# 10 - (5) 속성 패턴의 개선파일 다운로드1
12798정성태8/21/202111008개발 환경 구성: 598. PyCharm - 원격 프로세스를 디버그하는 방법
12797정성태8/21/20218649Windows: 197. TCP의 MSS(Maximum Segment Size) 크기는 고정된 것일까요?
12796정성태8/21/20219226.NET Framework: 1099. C# 10 - (4) 상수 문자열에 포맷 식 사용 가능파일 다운로드1
12795정성태8/20/20219902.NET Framework: 1098. .NET 6에 포함된 신규 BCL API - 스레드 관련
12794정성태8/20/20219341스크립트: 23. 파이썬 - WSGI를 만족하는 최소한의 구현 코드 및 PyCharm에서의 디버깅 방법 [1]
12793정성태8/20/202110126.NET Framework: 1097. C# 10 - (3) 개선된 변수 초기화 판정파일 다운로드1
... 31  32  33  [34]  35  36  37  38  39  40  41  42  43  44  45  ...