Microsoft MVP성태의 닷넷 이야기
.NET Framework: 354. x64 - AspCompat과 STA COM 개체가 성능에 미치는 영향 [링크 복사], [링크+제목 복사],
조회: 20513
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 
(연관된 글이 1개 있습니다.)

x64 - AspCompat과 STA COM 개체가 성능에 미치는 영향

지난번에 x86에서 이 상황을 테스트 한 결과를 설명했는데요.

x86 - AspCompat과 STA COM 개체가 성능에 미치는 영향
; https://www.sysnet.pe.kr/2/0/1394

재미있게도, x64 프로세스에서는 상황이 달라집니다. 우선, AspCompat=true와 Page_Load에서 x64 STA COM 개체를 생성한 경우를 한번 볼까요?

// ==== default.aspx ====
<%@ Page AspCompat="true" Title="Home Page" Language="C#" MasterPageFile="~/Site.master" AutoEventWireup="true"
    CodeBehind="Default.aspx.cs" Inherits="WebApplication1._Default" %>

	... [HTML 생략]...

// ==== default.aspx.cs ====
using System;
using System.Web;
using System.Web.UI;
using System.Web.UI.WebControls;

namespace WebApplication1
{
    public partial class _Default : System.Web.UI.Page
    {
        protected void Page_Load(object sender, EventArgs e)
        {
            WebTestHelperLib.ComAptTestClass catc = new WebTestHelperLib.ComAptTestClass();

            catc.DoMethod();
        }
    }
}

default.aspx.cs 코드를 다음과 같이 변경시키고,

protected void Page_Load(object sender, EventArgs e)
{
    int tid;
    WebTestHelperLib.ComAptTestClass catc = new WebTestHelperLib.ComAptTestClass();
    int aptKind = catc.DoMethod3(5, out tid);

    StringBuilder sb = new StringBuilder();

    sb.AppendFormat("ctor Thread: {0}<br />", _pageTid);
    sb.AppendFormat("ctor Apt: {0}<br />", GetCurrentApt());
    sb.AppendFormat("Page_Load Thread: {0}<br />", AppDomain.GetCurrentThreadId());
    sb.AppendFormat("Page_Load Thread Apt: {0}<br />", GetCurrentApt());
    sb.AppendFormat("Com Thread: {0}<br />", tid);
    sb.AppendFormat("Com Apt: {0}<br />", aptKind);

    Label1.Text = sb.ToString();
}

public int GetCurrentApt()
{
    FieldInfo fieldInfo = typeof(Thread).GetField("DONT_USE_InternalThread", BindingFlags.NonPublic | BindingFlags.Instance);
    IntPtr objValue = (IntPtr)fieldInfo.GetValue(Thread.CurrentThread);

    if (IntPtr.Size == 4)
    {
        IntPtr teb = new IntPtr(Marshal.ReadInt32(objValue, 16 * 4));

        IntPtr reservedForOle = new IntPtr(teb.ToInt64() + 0xf80);
        long ReservedForOle = Marshal.ReadInt64(reservedForOle); // TEB.ReservedForOle
        if (ReservedForOle == 0)
        {
            return -1;
        }

        IntPtr pNativeApt = new IntPtr(ReservedForOle + 0x50);
        long NativeApt = Marshal.ReadInt64(pNativeApt); // SOleTlsData.pNativeApt

        IntPtr pAptKind = new IntPtr(NativeApt + 0x0c);
        int AptKind = Marshal.ReadInt32(pAptKind); // CComApartment._AptKind

        return AptKind;
    }
    else
    {
        IntPtr teb = new IntPtr(Marshal.ReadInt64(objValue, 16 * 6));
        IntPtr reservedForOle = new IntPtr(teb.ToInt64() + 0x1758);
        long ReservedForOle = Marshal.ReadInt64(reservedForOle); // TEB.ReservedForOle
        if (ReservedForOle == 0)
        {
            return -1;
        }

        IntPtr pNativeApt = new IntPtr(ReservedForOle + 0x80);
        long NativeApt = Marshal.ReadInt64(pNativeApt); // SOleTlsData.pNativeApt

        IntPtr pAptKind = new IntPtr(NativeApt + 0x10);
        int AptKind = Marshal.ReadInt32(pAptKind); // CComApartment._AptKind

        return AptKind;
    }
}

COM 개체에서 제공되는 DoMethod3 메서드에도 x64에 대한 고려를 추가합니다.

STDMETHODIMP CComAptTest::DoMethod3(LONG sleepSecond,LONG *tid, LONG *aptKind)
{
    ::Sleep(sleepSecond * 1000);

    *tid = ::GetCurrentThreadId();

    do 
    {
#if defined(_AMD64_)
        BYTE *pTeb = (BYTE *)NtCurrentTeb();
        __int64 *pOle = (__int64 *)(pTeb + 0x1758);

        if (*pOle == 0)
        {
            printf("No apartment\n");
            break;
        }

        __int64 *pNativeApt = (__int64 *)(*pOle + 0x80);
        *aptKind = *(int *)(*pNativeApt + 0x10);

#elif defined(_X86_)
        BYTE *pTeb = (BYTE *)NtCurrentTeb();
        int *pOle = (int *)(pTeb + 0xf80);

        if (*pOle == 0)
        {
            printf("No apartment\n");
            break;
        }

        int *pNativeApt = (int *)(*pOle + 0x50);
        *aptKind = *(int *)(*pNativeApt + 0x0c);

#endif
    } while (false);

    return S_OK;
}

자... 이렇게 하고 2개의 요청을 동시에 보내면 다음과 같은 결과를 얻을 수 있습니다.

ctor Thread: 34124
ctor Apt: 4
Page_Load Thread: 7836
Page_Load Thread Apt: 4
Com Thread: 7836
Com Apt: 4

ctor Thread: 27452
ctor Apt: 4
Page_Load Thread: 7836
Page_Load Thread Apt: 4
Com Thread: 7836
Com Apt: 4

오... 뭔가 바뀌지 않았나요? ctor Apt == 4 == STA인데요. 처음 요청을 34124, 27452 스레드로 받고 있는데 이것들이 모두 STA 스레드로 초기화되어 있습니다. 여기서 유추해 볼 수 있는 것은 STA COM 개체를 가진 웹 페이지를 처리할 수 있는 전용 STA 스레드 풀을 가지는 것으로 보입니다.

비록 STA로 초기화된 스레드 풀이긴 하지만 COM 개체가 멀티스레드 용이 아니기 때문에 다시 전용 7836 STA 스레드에 COM 메서드 호출을 직렬화하고 있습니다.

x64부터는, AspCompat=True로 지정한 웹 페이지와 그렇지 않은 웹 페이지들에 대해 각각 별도의 스레드 풀을 제공하고 있는 것입니다.




AspCompat=True 값을 설정하지 않은 경우에는 0x80004002 예외가 발생하므로 생략합니다.




AspCompat=True인 경우, STA COM 개체를 Page_Load가 아닌 생성자나 멤버 변수 정의 시에는 어떨까요? 다음은 그 결과입니다.

ctor Thread: 29200
ctor Apt: 4
Page_Load Thread: 13888
Page_Load Thread Apt: 4
Com Thread: 7836
Com Apt: 4

ctor Thread: 35820
ctor Apt: 4
Page_Load Thread: 13888
Page_Load Thread Apt: 4
Com Thread: 7836
Com Apt: 4

이것 역시 x86과 유사한 결과를 가지지만, 다른 점이 있다면 맨 처음 요청을 처리하는 ctor 스레드가 STA로 초기화된 스레드 풀의 스레드라는 점입니다. 덕분에 STA COM 개체를 Page_Load 이전 단계에서 생성한다고 해도 MTA를 위한 웹 페이지들의 요청에는 영향을 주지 않습니다. 게다가 STA 스레드 풀을 별도로 운영하여 사용자의 요청을 받아들이고는 곧바로 별도의 STA 스레드(위에서는 13888)로 요청을 전달하고는 다음 사용자의 요청을 곧바로 받아들이게 됩니다. 따라서, x86에서 발생했던 스레드 풀 고갈 현상이 x64에서는 발생하지 않습니다.




결론을 내려보면, x64에서는 COM 개체의 생성을 어느 때 해도 전체적인 성능에는 크게 영향을 미치지는 않습니다.

하지만, COM 개체가 기왕이면 MTA로 만들어지는 것이 전체적인 페이지 반응 속도 향상에 도움이 된다는 사실에는 변함이 없습니다.




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 6/27/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




1  2  3  4  5  [6]  7  8  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
13793정성태10/28/20245135C/C++: 183. C++ - 윈도우에서 한글(및 유니코드)을 포함한 콘솔 프로그램을 컴파일 및 실행하는 방법
13792정성태10/27/20244633Linux: 99. Linux - 프로세스의 실행 파일 경로 확인
13791정성태10/27/20244900Windows: 267. Win32 API의 A(ANSI) 버전은 DBCS를 사용할까요?파일 다운로드1
13790정성태10/27/20244607Linux: 98. Ubuntu 22.04 - 리눅스 커널 빌드 및 업그레이드
13789정성태10/27/20244908Linux: 97. menuconfig에 CONFIG_DEBUG_INFO_BTF, CONFIG_DEBUG_INFO_BTF_MODULES 옵션이 없는 경우
13788정성태10/26/20244458Linux: 96. eBPF (bpf2go) - fentry, fexit를 이용한 트레이스
13787정성태10/26/20244951개발 환경 구성: 730. github - Linux 커널 repo를 윈도우 환경에서 git clone하는 방법 [1]
13786정성태10/26/20245203Windows: 266. Windows - 대소문자 구분이 가능한 파일 시스템
13785정성태10/23/20244983C/C++: 182. 윈도우가 운영하는 2개의 Code Page파일 다운로드1
13784정성태10/23/20245246Linux: 95. eBPF - kprobe를 이용한 트레이스
13783정성태10/23/20244859Linux: 94. eBPF - vmlinux.h 헤더 포함하는 방법 (bpf2go에서 사용)
13782정성태10/23/20244605Linux: 93. Ubuntu 22.04 - 커널 이미지로부터 커널 함수 역어셈블
13781정성태10/22/20244785오류 유형: 930. WSL + eBPF: modprobe: FATAL: Module kheaders not found in directory
13780정성태10/22/20245546Linux: 92. WSL 2 - 커널 이미지로부터 커널 함수 역어셈블
13779정성태10/22/20244840개발 환경 구성: 729. WSL 2 - Mariner VM 커널 이미지 업데이트 방법
13778정성태10/21/20245669C/C++: 181. C/C++ - 소스코드 파일의 인코딩, 바이너리 모듈 상태의 인코딩
13777정성태10/20/20244952Windows: 265. Win32 API의 W(유니코드) 버전은 UCS-2일까요? UTF-16 인코딩일까요?
13776정성태10/19/20245250C/C++: 180. C++ - 고수준 FILE I/O 함수에서의 Unicode stream 모드(_O_WTEXT, _O_U16TEXT, _O_U8TEXT)파일 다운로드1
13775정성태10/19/20245478개발 환경 구성: 728. 윈도우 환경의 개발자를 위한 UTF-8 환경 설정
13774정성태10/18/20245182Linux: 91. Container 환경에서 출력하는 eBPF bpf_get_current_pid_tgid의 pid가 존재하지 않는 이유
13773정성태10/18/20244871Linux: 90. pid 네임스페이스 구성으로 본 WSL 2 + docker-desktop
13772정성태10/17/20245144Linux: 89. pid 네임스페이스 구성으로 본 WSL 2 배포본의 계층 관계
13771정성태10/17/20245049Linux: 88. WSL 2 리눅스 배포본 내에서의 pid 네임스페이스 구성
13770정성태10/17/20245328Linux: 87. ps + grep 조합에서 grep 명령어를 사용한 프로세스를 출력에서 제거하는 방법
13769정성태10/15/20246114Linux: 86. Golang + bpf2go를 사용한 eBPF 기본 예제파일 다운로드1
13768정성태10/15/20245382C/C++: 179. C++ - _O_WTEXT, _O_U16TEXT, _O_U8TEXT의 Unicode stream 모드파일 다운로드2
1  2  3  4  5  [6]  7  8  9  10  11  12  13  14  15  ...