Microsoft MVP성태의 닷넷 이야기
.NET Framework: 274. ReaderWriterLockSlim은 언제 쓰는 걸까요? [링크 복사], [링크+제목 복사],
조회: 29142
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
(연관된 글이 1개 있습니다.)

ReaderWriterLockSlim은 언제 쓰는 걸까요?


지난번 글에서 닷넷에서의 동기화 처리 방식에 대해서 설명을 했었지요.

.NET 참조 개체 인스턴스의 Object Header를 확인하는 방법
; https://www.sysnet.pe.kr/2/0/1175

일반적으로 C#에서는 다음과 같이 동기화를 합니다.

object lockInstance = new object();

lock (lockInstance)
{
   ... [공유자원 접근] ...
}

lock (...) 메커니즘은 배타적인 잠금(exclusive lock)을 걸어서 해당 자원을 보호하게 됩니다. 그런데, 가끔은 해당 자원에 대해서 거의 모든 스레드들이 '읽기'만 하고 가끔씩 '소수의 스레드'만 '쓰기' 작업을 한다고 했을 때 ex-lock은 왠지 아깝지 않은가 하는 생각이 들게 됩니다.

사실, lock이 필요한 이유는 상태를 변경시키는 '쓰기' 때문에 발생하는 것이지, '읽기' 만 발생하는 상황이라면 굳이 lock이 필요하지는 않습니다.

따라서 성능을 고려한다면, '읽기' 작업을 하는 스레드들 사이에서는 서로 방해를 하지 않고 있다가 '쓰기' 작업과의 연동에서만 '배타적 잠금'을 하는 것이 바람직합니다. 이런 경우가 바로 공유 잠금(shared lock)이라고 불리는 유형입니다.

어디... sh-lock이 ex-lock에 비해서 얼마나 성능이 향상되는지 한번 테스트를 해볼까요?

우선, 간단하게 카운트 루프를 도는 프로그램을 lock으로 보호해 보겠습니다.

void lockThread(object state)
{
    int counterIndex = (int)state;

    while (threadStop == false)
    {
        lock (lockCount)
        {
            counts[counterIndex]++;
        }
    }
}

위와 같은 역할을 하는 스레드를 5개 만들어서 실행하면,

for (int i = 0; i < count; i++)
{
    Thread newThread = new Thread(lockThread);
    newThread.IsBackground = true;
    newThread.Start(i);
}

counts[0...4] 배열의 카운트 값들이 스레드 내의 while 루프를 돌 때 마다 증가할 것입니다. 시간을 재서 초당 증가하는 횟수를 살펴 보니 다음과 같이 나옵니다.

11904819.7152496 
11949052.7475766 
11931037.5872447 
11933239.6103584 
11881933.1463757 

==> 초당 약 12,000,000번의 실행

그렇다면, 이제 스레드 함수에 ReaderWriterLockSlim을 사용해서 공유 잠금을 해보겠습니다.

Slim Reader/Writer (SRW) Locks 
; https://learn.microsoft.com/en-us/windows/win32/sync/slim-reader-writer--srw--locks

ReaderWriterLockSlim cacheLock = new ReaderWriterLockSlim();

void readerThread(object state)
{
    int countIndex = (int)state;
            
    while (threadStop == false)
    {
        cacheLock.EnterReadLock();

        try
        {
            counts[countIndex]++;
        }
        finally
        {
            cacheLock.ExitReadLock();
        }
    }
}

void writerThread(object state)
{
    int countIndex = (int)state;

    while (threadStop == false)
    {
        cacheLock.EnterWriteLock();

        try
        {
            counts[countIndex]++;
        }
        finally
        {
            cacheLock.ExitWriteLock();
        }
    }
}

5개의 스레드 생성 시에, 첫 번째 스레드에 대해서만 writerThread를 할당하고 나머지는 readerThread로 할당해 주었습니다.

for (int i = 0; i < count; i++)
{
    Thread newThread;
    
    if (i == 0)
    {
        newThread = new Thread(writerThread);
    }
    else
    {
        newThread = new Thread(readerThread);
    }

    newThread.IsBackground = true;
    newThread.Start(i);
}

자... 기대되는군요. ^^ 이렇게 하고 실행하면 ex-lock에 비해서 얼마나 성능 향상이 있을까요?

5439175.07101596 
5398816.34136504 
5390411.53317197 
5366829.75513943 
5351321.89442379 
5344019.70797552 
5334268.38922098 

==> 초당 약 5,500,000번의 실행

오호~~~ 예상 외인가요? 무조건 잠금을 하는 ex-lock이 12,000,000번의 성능을 보였던 것에 비하면 절반도 안되는 수치를 기록하고 있습니다. 혹시... 테스트를 뭔가 잘못한 걸까요?

아닙니다. 테스트는 정확하게 했습니다. 위와 같은 상황에서는 가벼운 ex-lock이 더 좋은 성능을 보일 수밖에 없습니다.




그렇다면, lock을 점유하는 시간이 다소 길어지면 어떤 현상이 발생할까요? 이를 위해 lock 점유를 흉내내기 위해 다음과 같이 1ms에 해당하는 Thread.Sleep 시간을 스레드에 추가해 봤습니다.

void lockThread(object state)
{
    int counterIndex = (int)state;

    while (threadStop == false)
    {
        lock (lockCount)
        {
            counts[counterIndex]++;
            Thread.Sleep(1);
        }
    }
}

겨우 1ms의 지연시간을 추가한 것 뿐인데, 초당 루프 증가 수는 다음과 같이 뚝 떨어졌습니다.

998.700954608068 
998.745307936315 
998.820608186942 
998.825143635559 
998.893010223893 

==> 초당 약 1,000번의 실행

그럼 sh-lock의 경우에는 어떨까요? 이번엔 정말 기대되는군요. ^^ 역시 동일하게 1ms의 지연 시간을 부여하고,

void readerThread(object state)
{
    int countIndex = (int)state;
            
    while (threadStop == false)
    {
        cacheLock.EnterReadLock();

        try
        {
            counts[countIndex]++;
            Thread.Sleep(1);
        }
        finally
        {
            cacheLock.ExitReadLock();
        }
    }
}

void writerThread(object state)
{
    int countIndex = (int)state;

    while (threadStop == false)
    {
        cacheLock.EnterWriteLock();

        try
        {
            counts[countIndex]++;
            Thread.Sleep(1);
        }
        finally
        {
            cacheLock.ExitWriteLock();
        }
    }
}

실행해 보면, 다음과 같은 결과를 얻을 수 있습니다.

1957.41883217647 
1900.581814786 
1912.05442748045 
1890.14059164164 
1908.65293256279 

==> 초당 약 1,900번의 실행

상황이 역전되었군요. 기대했던 데로 이번엔 ex-lock의 초당 약 1,000번도 안되는 성능에 비하면 2배 정도의 향상된 수치를 보여주고 있습니다.




이 쯤 되면, 이번 글의 제목에 썼던 내용에 대해서 어느 정도 답을 하실 수 있을 것입니다.

ReaderWriterLockSlim 클래스는, 다중 읽기/소수 쓰기의 상황에서 보호되어야 할 자원이 있는 경우에 사용할 수 있는데, 그 효과를 발휘하려면 잠금 구간 사이의 체류 시간이 있어야 합니다.

예를 들어, 다중 스레드로부터 보호해야 하는 영역에 변수 1~2개 정도 두고 하는 거라면 Interlocked.Increment / Interlocked.Decrement과 같은 것을 사용하거나 아예 가벼운 lock (...) 구문을 사용하시는 것이 성능을 위해 더욱 현명한 선택입니다.

허긴... 이렇게 머리로는 알고 있어도, ^^ 대부분의 성능 관련한 것들이 직접 측정을 하지 않으면 정확한 판단을 내릴 수 없는 경우가 많다는 것이... 문제라면 문제겠지요. ^^

(첨부된 파일은 위의 코드를 포함한 예제 프로젝트입니다.)




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 8/14/2024]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2011-11-22 11시08분
짧은 생각으로 무조건 ReaderWriterLockSlim 클래스가 성능이 더 우월할 것이다라는 생각을 실험결과로 깨주셨군요. ㅎㅎ 감사합니다.
도움 많이 되었습니다.
스포너
2011-11-23 12시56분
[아파야낫는다] CPU점유율이 100%와 0%가 나오네요
[guest]
2020-09-12 12시33분
[질문있습니다] ReaderThread 와 WriterThread를 구분해서 예시를 들어주셨는데 두가지 모두 counts[countIndex]++;로 값을 Write하고있네요. 혹시 오타이신건지 아니면 ReadLock WriteLock 둘다 쓰기도 가능한 방식인건지 궁금합니다.
그리고 WriteLock을 취득한 상태에서 Read를 하면 안되는건가요?
[guest]
2020-09-12 01시00분
본문을 보시면, 사실 lock을 했지만 그 안의 counts[counterIndex]는 각각의 스레드만 고유하게 접근하기 때문에 동기화 대상은 아닙니다. 그냥 내부 코드에서의 실행 횟수를 체크하기 위해 쓴 것이므로 그것을 위해 lock이 하는 일은 없습니다.

그래서 답변을 드리면,

1) ReadLock을 썼다고 해서 내부에서 어떤 값에 쓰기를 할 수 없는 것은 아닙니다. 단지, 그것이 다른 스레드에서 동시에 쓰기를 하는 대상, 즉 동기화 대상이라면 쓰기를 해서는 안 됩니다.

2) WriteLock 내에서는 동기화 대상에 대해 당연히 Read/Write 모두 가능합니다.
정성태

[1]  2  3  4  5  6  7  8  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
13945정성태6/7/2025459오류 유형: 960. 파이썬 + conda - mysqlclient 사용 시 "NameError: name '_mysql' is not defined" 에러
13944정성태6/7/2025481오류 유형: 959. The trust relationship between this workstation and the primary domain failed. - 네 번째 이야기
13943정성태6/6/2025736개발 환경 구성: 748. Windows + Foundry Local - 로컬에서 AI 모델 활용
13942정성태6/5/2025899오류 유형: 958. winget 설치 시 "0x80d02002 : unknown error"
13941정성태6/2/20251048닷넷: 2334. C# - cpuid 명령어를 이용한 CPU 제조사 문자열 가져오기파일 다운로드1
13940정성태6/1/20251426C/C++: 188. C++의 32비트 + Release 어셈블리 코드를 .NET으로 포팅할 때 주의할 점파일 다운로드1
13939정성태5/29/20251715오류 유형: 957. NVIDIA Triton Inference Server - version `GLIBCXX_3.4.32' not found (required by /opt/tritonserver/backends/python/triton_python_backend_stub)
13938정성태5/29/20251435개발 환경 구성: 747. 파이썬 - WSL/docker에 구성한 Triton 예제 개발 환경
13937정성태5/24/20251363개발 환경 구성: 746. Windows + WSL2 환경에서 (tensorflow 등의) NVIDIA GPU 인식
13936정성태5/23/20251189개발 환경 구성: 745. Linux / WSL 환경에 Miniconda 설치하기
13935정성태5/20/20251233파이썬 - pip 사용 시 "ImportError: cannot import name 'html5lib' from 'pip._vendor'" 오류
13934정성태5/20/20251712스크립트: 77. 파이썬 - 'urllib.request' 모듈의 명시적/암시적 로딩 차이
13933정성태5/19/20251291오류 유형: 956. Visual Studio 2022가 17.12 버전부터 업데이트 되지 않는다면?
13932정성태5/18/20251502스크립트: 76. 파이썬 - Version 문자열 다루기(semver 패키지)
13931정성태5/17/20251794스크립트: 75. 파이썬 - Cython 기본 예제 및 컴파일
13930정성태5/17/20251491개발 환경 구성: 744. 파이썬 - Windows embeddable package 환경에서 외부 패키지 사용하는 방법(ex: UFO² 환경 구성)
13929정성태5/16/20251520오류 유형: 955. 파이썬 - "Windows embeddable package" REPL 환경에서 "NameError: name 'exit' is not defined"
13928정성태5/15/20251559오류 유형: 954. UFO² - "'Invalid URL (POST /v1/chat/completions/chat/completions)'"
13927정성태5/15/20251545오류 유형: 953. OpenAI - The API request of HOST_AGENT failed: OpenAI API request exceeded rate limit: Error code: 429
13926정성태5/14/20251908개발 환경 구성: 743. LLM과 윈도우의 만남 - Desktop AgentOS UFO² 기본 환경 구성
13925정성태5/12/20252010닷넷: 2333. C# - (Console 유형의 프로젝트에서) Clipboard 연동파일 다운로드1
13924정성태5/8/20251760닷넷: 2332. C# - (JetBrains Omea Reader 대상으로) 런타임 시에 메서드 가로채기 [2]파일 다운로드1
13923정성태5/5/20251505스크립트: 74. 파이썬 - C# - Python.NET의 RunSimpleScript, Exec, Eval 차이점파일 다운로드1
13922정성태5/3/20251758스크립트: 73. 파이썬 - Windows embeddable package 버전에서 tkinter 환경 구성
13921정성태5/3/20252288오류 유형: 952. 듀얼 채널 메모리 정렬을 지키지 않은 컴퓨터의 Windows 비정상 종료 현상(Blue Screen) [2]
[1]  2  3  4  5  6  7  8  9  10  11  12  13  14  15  ...