정성태
(연관된 글이 1개 있습니다.)

x64 - AspCompat과 STA COM 개체가 성능에 미치는 영향

지난번에 x86에서 이 상황을 테스트 한 결과를 설명했는데요.

x86 - AspCompat과 STA COM 개체가 성능에 미치는 영향

재미있게도, x64 프로세스에서는 상황이 달라집니다. 우선, AspCompat=true와 Page_Load에서 x64 STA COM 개체를 생성한 경우를 한번 볼까요?

// ==== default.aspx ====
<%@ Page AspCompat="true" Title="Home Page" Language="C#" MasterPageFile="~/Site.master" AutoEventWireup="true"
    CodeBehind="Default.aspx.cs" Inherits="WebApplication1._Default" %>

	... [HTML 생략]...

// ==== default.aspx.cs ====
using System;
using System.Web;
using System.Web.UI;
using System.Web.UI.WebControls;

namespace WebApplication1
    public partial class _Default : System.Web.UI.Page
        protected void Page_Load(object sender, EventArgs e)
            WebTestHelperLib.ComAptTestClass catc = new WebTestHelperLib.ComAptTestClass();


default.aspx.cs 코드를 다음과 같이 변경시키고,

protected void Page_Load(object sender, EventArgs e)
    int tid;
    WebTestHelperLib.ComAptTestClass catc = new WebTestHelperLib.ComAptTestClass();
    int aptKind = catc.DoMethod3(5, out tid);

    StringBuilder sb = new StringBuilder();

    sb.AppendFormat("ctor Thread: {0}<br />", _pageTid);
    sb.AppendFormat("ctor Apt: {0}<br />", GetCurrentApt());
    sb.AppendFormat("Page_Load Thread: {0}<br />", AppDomain.GetCurrentThreadId());
    sb.AppendFormat("Page_Load Thread Apt: {0}<br />", GetCurrentApt());
    sb.AppendFormat("Com Thread: {0}<br />", tid);
    sb.AppendFormat("Com Apt: {0}<br />", aptKind);

    Label1.Text = sb.ToString();

public int GetCurrentApt()
    FieldInfo fieldInfo = typeof(Thread).GetField("DONT_USE_InternalThread", BindingFlags.NonPublic | BindingFlags.Instance);
    IntPtr objValue = (IntPtr)fieldInfo.GetValue(Thread.CurrentThread);

    if (IntPtr.Size == 4)
        IntPtr teb = new IntPtr(Marshal.ReadInt32(objValue, 16 * 4));

        IntPtr reservedForOle = new IntPtr(teb.ToInt64() + 0xf80);
        long ReservedForOle = Marshal.ReadInt64(reservedForOle); // TEB.ReservedForOle
        if (ReservedForOle == 0)
            return -1;

        IntPtr pNativeApt = new IntPtr(ReservedForOle + 0x50);
        long NativeApt = Marshal.ReadInt64(pNativeApt); // SOleTlsData.pNativeApt

        IntPtr pAptKind = new IntPtr(NativeApt + 0x0c);
        int AptKind = Marshal.ReadInt32(pAptKind); // CComApartment._AptKind

        return AptKind;
        IntPtr teb = new IntPtr(Marshal.ReadInt64(objValue, 16 * 6));
        IntPtr reservedForOle = new IntPtr(teb.ToInt64() + 0x1758);
        long ReservedForOle = Marshal.ReadInt64(reservedForOle); // TEB.ReservedForOle
        if (ReservedForOle == 0)
            return -1;

        IntPtr pNativeApt = new IntPtr(ReservedForOle + 0x80);
        long NativeApt = Marshal.ReadInt64(pNativeApt); // SOleTlsData.pNativeApt

        IntPtr pAptKind = new IntPtr(NativeApt + 0x10);
        int AptKind = Marshal.ReadInt32(pAptKind); // CComApartment._AptKind

        return AptKind;

COM 개체에서 제공되는 DoMethod3 메서드에도 x64에 대한 고려를 추가합니다.

STDMETHODIMP CComAptTest::DoMethod3(LONG sleepSecond,LONG *tid, LONG *aptKind)
    ::Sleep(sleepSecond * 1000);

    *tid = ::GetCurrentThreadId();

#if defined(_AMD64_)
        BYTE *pTeb = (BYTE *)NtCurrentTeb();
        __int64 *pOle = (__int64 *)(pTeb + 0x1758);

        if (*pOle == 0)
            printf("No apartment\n");

        __int64 *pNativeApt = (__int64 *)(*pOle + 0x80);
        *aptKind = *(int *)(*pNativeApt + 0x10);

#elif defined(_X86_)
        BYTE *pTeb = (BYTE *)NtCurrentTeb();
        int *pOle = (int *)(pTeb + 0xf80);

        if (*pOle == 0)
            printf("No apartment\n");

        int *pNativeApt = (int *)(*pOle + 0x50);
        *aptKind = *(int *)(*pNativeApt + 0x0c);

    } while (false);

    return S_OK;

자... 이렇게 하고 2개의 요청을 동시에 보내면 다음과 같은 결과를 얻을 수 있습니다.

ctor Thread: 34124
ctor Apt: 4
Page_Load Thread: 7836
Page_Load Thread Apt: 4
Com Thread: 7836
Com Apt: 4

ctor Thread: 27452
ctor Apt: 4
Page_Load Thread: 7836
Page_Load Thread Apt: 4
Com Thread: 7836
Com Apt: 4

오... 뭔가 바뀌지 않았나요? ctor Apt == 4 == STA인데요. 처음 요청을 34124, 27452 스레드로 받고 있는데 이것들이 모두 STA 스레드로 초기화되어 있습니다. 여기서 유추해 볼 수 있는 것은 STA COM 개체를 가진 웹 페이지를 처리할 수 있는 전용 STA 스레드 풀을 가지는 것으로 보입니다.

비록 STA로 초기화된 스레드 풀이긴 하지만 COM 개체가 멀티스레드 용이 아니기 때문에 다시 전용 7836 STA 스레드에 COM 메서드 호출을 직렬화하고 있습니다.

x64부터는, AspCompat=True로 지정한 웹 페이지와 그렇지 않은 웹 페이지들에 대해 각각 별도의 스레드 풀을 제공하고 있는 것입니다.

AspCompat=True 값을 설정하지 않은 경우에는 0x80004002 예외가 발생하므로 생략합니다.

AspCompat=True인 경우, STA COM 개체를 Page_Load가 아닌 생성자나 멤버 변수 정의 시에는 어떨까요? 다음은 그 결과입니다.

ctor Thread: 29200
ctor Apt: 4
Page_Load Thread: 13888
Page_Load Thread Apt: 4
Com Thread: 7836
Com Apt: 4

ctor Thread: 35820
ctor Apt: 4
Page_Load Thread: 13888
Page_Load Thread Apt: 4
Com Thread: 7836
Com Apt: 4

이것 역시 x86과 유사한 결과를 가지지만, 다른 점이 있다면 맨 처음 요청을 처리하는 ctor 스레드가 STA로 초기화된 스레드 풀의 스레드라는 점입니다. 덕분에 STA COM 개체를 Page_Load 이전 단계에서 생성한다고 해도 MTA를 위한 웹 페이지들의 요청에는 영향을 주지 않습니다. 게다가 STA 스레드 풀을 별도로 운영하여 사용자의 요청을 받아들이고는 곧바로 별도의 STA 스레드(위에서는 13888)로 요청을 전달하고는 다음 사용자의 요청을 곧바로 받아들이게 됩니다. 따라서, x86에서 발생했던 스레드 풀 고갈 현상이 x64에서는 발생하지 않습니다.

결론을 내려보면, x64에서는 COM 개체의 생성을 어느 때 해도 전체적인 성능에는 크게 영향을 미치지는 않습니다.

하지만, COM 개체가 기왕이면 MTA로 만들어지는 것이 전체적인 페이지 반응 속도 향상에 도움이 된다는 사실에는 변함이 없습니다.

[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

by SeongTae Jeong


