Microsoft MVP성태의 닷넷 이야기
VC++: 81. 프로그래밍에서 borrowing의 개념 [링크 복사], [링크+제목 복사],
조회: 23429
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 

프로그래밍에서 borrowing의 개념

아래와 같은 글에서,

왜 많은 사람들이 Go 언어를 싫어할까?
; http://yisangwook.tumblr.com/post/100383515974/why-everyone-hates-go

Go에 없는 것으로 "there's no borrowing" 이라는 말이 나옵니다. 위의 글을 쓴 사람도 그걸 인용하면서 borrowing이 뭔지 궁금해 하는데요. 저도 궁금했습니다. ^^ (처음 봤습니다.)

모르는 개념을 하나씩 익히는 것도 좋으니 이참에 한번 찾아봤는데요. 다음의 글이 검색됩니다.

Rust 언어 튜토리얼 - 11 빌린 포인터
; http://sarojaba.github.io/rust-doc-korean/doc/tutorial.html

"
Rust의 빌린 포인터는 범용의 참조 타입이다. 소유된 박스와는 대조적으로, 소유된 박스의 홀더는 메모리 참조의 소유자이다. 빌린 포인터는 암묵적인 소유권이 절대 아니다. 포인터는 어떤 객체로든 빌려질 수 있고, 컴파일러는 객체의 생명주기보다 오래 살 수 없다는 것을 검증한다.
"


"왜 많은 사람들이 Go 언어를 싫어할까?" 글에서 Go 언어를 비판하는 사람들에 "Rust" 언어를 사용하는 층이 있다고 하니, 아마도 Rust 언어의 이 개념을 두고 한 이야기가 맞는 것 같습니다.

근데, 솔직히 "Rust 언어 튜토리얼 - 11 빌린 포인터"의 설명으로는 무슨 개념인지 감이 안 옵니다. 제가 이해력이 부족한 듯합니다. 그래서 좀 더 검색해 보니 다음의 글이 나옵니다.

Who Needs Garbage Collection? 글의 덧글 "Borrowing, or keeping"
; http://lambda-the-ultimate.org/node/5007

덧글의 설명이 제법 충실합니다.

Borrowing, or keeping

I'd been down this road before, years ago, in the context of trying to make C++ pointer-safe via reference counting without killing performance.
It's possible, but may be too unwieldy. I called Rust's "borrow" concept "keeping". "keep" becomes a qualifier on parameters, like "const".

More specifically, function parameters which are references or pointers would have four access permissions - read, write, keep, and delete. "Read" and "Write" are implied; "const" turns off write permission. That's standard C/C++. "Keep" permission means that a function can keep a copy of a parameter after the function returns. "delete" permission means the function can delete the object pointed to.

Lack of "keep" permission has several implications. Any copy of a pointer or reference must be to a scope that will not outlive the source scope. So you can copy a non-keep pointer/reference for use in an inner block, or pass it to another non-keep parameter. Rust does much the same thing.

In a reference counted system, it is not necessary to update reference counts for non-keep pointers. They must have had a non-zero reference count at scope entrance, and they will have the same reference count at scope exit. So there's a big overhead reduction for non-keep parameters.

It's possible to infer that a local copy of a pointer is non-keep. Iterators, for example, are almost always non-keep. Recognizing this eliminates most reference counting in inner loops.

All parameters to the standard C library functions and the Linux API are "non-keep". This is also true of most math libraries. "Non-keep" is the normal case for functions.

This is thus a way to do reference counting without excessive overhead. Most of the things that are done very frequently are done via non-keep parameters to functions.

A long, long time ago I tried to talk the people who were designing what would become Java into this. I was not successful.


이 글과 함께 다음의 소스 코드가 담긴 설명을 보니 그나마 이해되기 시작합니다.

A 30 minute introduction to Rust - Ownership
; http://words.steveklabnik.com/a-30-minute-introduction-to-rust




이쯤에서 제 나름대로 다시 정리해 볼까요? ^^ 다음의 코드를 보겠습니다.

int GetValue()
{
    return 5;
}

이를 깊게 들어가 보면 GetValue 함수가 반환될 때 "MOV EAX, 5", "ret" 라는 코드가 실행되는 것을 볼 수 있습니다. 즉, 반환값이 EAX 레지스터에 담기는 것입니다. GetValue 예제처럼 CPU 워드(WORD) 단위의 반환값이라면 상관없지만, 그것이 워드 범위를 넘어가면 문제가 됩니다. 그런 경우에는 CPU 레지스터에 담을 수 없기 때문에 메모리에 값을 보관 후 그 메모리를 가리키는 주소를 EAX에 담아 넘기는 방법이 사용됩니다.

일례로 다음과 같은 경우입니다.

#include "stdafx.h"

char *GetValues1()
{
    char buf[10] = "test1";
    return buf;
}

int _tmain(int argc, _TCHAR* argv[])
{
    char *result1 = GetValues1();
    printf("%s\n", result1);

    return 0;
}

/*
이 코드를 Visual C++ 2013 / Debug 빌드로 했을 때 화면에는 "test1"이 아닌 쓰레기 값이 출력됩니다. (Release 빌드시 최적화로 인해 극적으로 ^^; 정상값이 출력됩니다.)
*/

buf 변수는 10바이트의 영역이 확보되지만 이것은 CPU 레지스터에 담길 수 없는 용량입니다. 그래서 메모리에 상주하게 되고 EAX에는 buf의 메모리 주소가 담겨 반환됩니다.

여기서 문제는 그 메모리 주소가 스레드의 스택이라는 점입니다. 스택은 함수가 불릴 때마다 가변적으로 사용되는데, GetValues1 함수가 불렸을 때 C/C++ 컴파일러는 스택에 10바이트 공간을 예약하는 기계어를 출력해서 실행시 스택 공간을 확보하는 작업을 합니다. 하지만, GetValues 함수의 마지막 - "return buf"를 하는 시점에 확보된 10바이트 스택 영역은 다시 차감되고 이후의 메서드 호출에서 그 영역은 덮어 써질 수 있습니다. 쓰레기 값이 출력되는 것은 그 이유입니다.

C/C++에서는 이런 문제를 해결하기 위해 반드시 동적 할당을 해야 합니다.

char *GetValue()
{
    char *pBuf = new pBuf[5];
    strcpy_s(pBuf, 5, "test");
    return pBuf;
}

그리고, 이렇게 반환받은 메모리는 반드시 해제해야 합니다.

char *pValue = GetValue();
// ... pValue 사용
delete [] pValue; // 반드시 해제

말은 쉽지만, 이 때문에 C/C++ 개발자는 메모리 할당/해제에 따른 적지 않은 고통을 겪게 됩니다. 게다가 모든 코드를 자신이 작성한 경우라면 상관없지만 그렇지 않은 경우는 반드시 매뉴얼을 읽어봐야만, 그것이 반환받는 값을 호출 측에서 해제를 해야 하는지 알 수 있습니다. 예를 들어, 어떤 C/C++ 개발자는 호출자가 해제를 안해도 되게끔 다음과 같이 함수를 작성할 수도 있습니다.

char *GetValues2()
{
    static char buf[10] = "test1";
    return buf;
}

static이기 때문에(또는 전역 변수를 사용했을 수도 있는!) 이런 경우는 호출 측에서 메모리 해제를 해서는 안됩니다.

참고로, MSDN 문서에서 Win32 API 설명 중에 OUT 인자로 명시되는 경우를 볼 수 있는데요.

GetEnvironmentVariable function
; https://learn.microsoft.com/en-us/windows/win32/api/processenv/nf-processenv-getenvironmentvariablea

DWORD WINAPI GetEnvironmentVariable(
  _In_opt_   LPCTSTR lpName,
  _Out_opt_  LPTSTR lpBuffer,
  _In_       DWORD nSize
);

마이크로소프트의 경우, 이런 OUT 인자는 호출 측에서 반드시 메모리를 확보해서 전달하는 식으로 처리하고 있습니다. 즉, 다음과 같이 사용하라는 것입니다.

wchar_t buf[4096];
GetEnvironmentVariable(L"VAR", buf, 4096);

따라서 C/C++ 언어에서 포인터 변수가 다뤄질 때는, 반드시 그 할당의 주체를 확인해서 사용해야만 안전을 보장할 수 있습니다.




이런 문제를 Rust 언어에서는 borrow 개념을 통해 해결하고 있습니다. "A 30 minute introduction to Rust - Ownership" 글의 예제를,

fn dangling() -> &int {
    let i = 1234;
    return &i;
}

fn add_one() -> int {
    let num = dangling();
    return *num + 1;
}

C/C++ 코드로 바꿔 보면 이럴 텐데요.

int *dangling()
{
    int i = 1234;
    return &i;
}

int add_one()
{
    int *num = dangling();
    return *num + 1;
}

스택에 있는 값을 반환한다는 의미에서 이 코드는 위험한데도 불구하고 C/C++은 정상적으로 컴파일하는 반면, Rust 언어에서는 이를 감지하고 다음과 같은 컴파일 오류를 낸다고 합니다.

temp.rs:3:11: 3:13 error: borrowed value does not live long enough
temp.rs:3     return &i;

temp.rs:1:22: 4:1 note: borrowed pointer must be valid for the anonymous lifetime #1 defined on the block at 1:22...
temp.rs:1 fn dangling() -> &int {
temp.rs:2     let i = 1234;
temp.rs:3     return &i;
temp.rs:4 }

temp.rs:1:22: 4:1 note: ...but borrowed value is only valid for the block at 1:22
temp.rs:1 fn dangling() -> &int {      
temp.rs:2     let i = 1234;            
temp.rs:3     return &i;               
temp.rs:4  }                            
error: aborting due to previous error

그리고, 이 컴파일 오류를 접한 Rust 개발자는 (제가 몰랐던 바로 그 "borrowing"이라고 알려진) "빌린 포인터(borrowed pointer)" 구문을 이용해 다음과 같이 해결할 수 있다는 것입니다.

fn dangling() -> ~int {
    let i = ~1234;
    return i;
}

fn add_one() -> int {
    let num = dangling();
    return *num + 1;
}

이렇게 "~" 연산자를 이용해 "unique pointer"를 사용하면 Rust 컴파일러는 해당 변수 i의 값을 스택에 할당하지 않고 그것의 사용 해제 시점을 계산해 자동으로 할당/해제하는 코드를 (개발자 대신) 넣어주는 것입니다.

"borrowing"이란 것이 어느 상황을 가리키는 용어인지 이제 이해하시겠죠? ^^

여기서 다시 "Who Needs Garbage Collection? 글의 덧글 "Borrowing, or keeping"" 글의 내용을 보면 이런 문구가 나옵니다.

I called Rust's "borrow" concept "keeping". 

'빌려온다'라는 것보다는 '유지한다'는 것이 훨씬 좋은 설명이라는 것에 공감합니다. Rust의 "빌린 포인터(borrowed pointer)"는 컴파일러가 자동으로 해당 변수를 필요한 시점까지 유지해 주는 기능이라고 해석되는 것이 더 자연스럽습니다.




이 개념이 GC가 도입된 언어를 사용하는 개발자에게는 낯설을 수밖에 없습니다. 예를 들어, (자바도 마찬가지이고) C#으로 다음의 코드를 만들면,

char[] GetValues()
{
    char[] buf = { 't', 'e', 's', 't' };
    return buf;
}

buf 인스턴스는 GC 힙에 할당되고, 이후 GC에 의해 관리되어 사용되지 않는 시점에 다음번 가비지 컬렉션 수집에서 자동으로 해제되기 때문입니다. C/C++과 같은 해제의 부담이 없기 때문에 애당초 "borrowing" 개념이 필요없는 것입니다.




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 6/15/2023]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




... 121  122  123  124  125  126  127  128  129  130  131  132  [133]  134  135  ...
NoWriterDateCnt.TitleFile(s)
1730정성태8/11/201422164개발 환경 구성: 234. Royal TS의 터미널(Terminal) 연결에서 한글이 깨지는 현상 해결 방법
1729정성태8/11/201418223오류 유형: 236. SqlConnection - The requested Performance Counter is not a custom counter, it has to be initialized as ReadOnly.
1728정성태8/8/201430281.NET Framework: 453. C# - 오피스 파워포인트(Powerpoint) 파일을 WinForm에서 보는 방법파일 다운로드1
1727정성태8/6/201420511오류 유형: 235. SignalR 오류 메시지 - Counter 'Messages Bus Messages Published Total' does not exist in the specified Category. [2]
1726정성태8/6/201419398오류 유형: 234. IIS Express에서 COM+ 사용 시 SecurityException - "Requested registry access is not allowed" 발생
1725정성태8/6/201421350오류 유형: 233. Visual Studio 2013 Update3 적용 후 Microsoft.VisualStudio.Web.PageInspector.Runtime 모듈에 대한 FileNotFoundException 예외 발생
1724정성태8/5/201426102.NET Framework: 452. .NET System.Threading.Thread 개체에서 Native Thread Id를 구하는 방법 - 두 번째 이야기 [1]파일 다운로드1
1723정성태7/29/201458361개발 환경 구성: 233. DirectX 9 예제 프로젝트 빌드하는 방법 [3]파일 다운로드1
1722정성태7/25/201421058오류 유형: 232. IIS 500 Internal Server Error - NTFS 암호화된 폴더에 웹 애플리케이션이 위치한 경우
1721정성태7/24/201424068.NET Framework: 451. 함수형 프로그래밍 개념 - 리스트 해석(List Comprehension)과 순수 함수 [2]
1720정성태7/23/201422079개발 환경 구성: 232. C:\WINDOWS\system32\LogFiles\HTTPERR 폴더에 로그 파일을 남기지 않는 설정
1719정성태7/22/201426037Math: 13. 동전을 여러 더미로 나누는 경우의 수 세기(Partition Number) - 두 번째 이야기파일 다운로드1
1718정성태7/19/201435296Math: 12. HTML에서 수학 관련 기호/수식을 표현하기 위한 방법 - MathJax.js [4]
1716정성태7/17/201435007개발 환경 구성: 231. PC 용 무료 안드로이드 에뮬레이터 - genymotion
1715정성태7/13/201430604기타: 47. 운영체제 종료 후에도 USB 외장 하드의 전원이 꺼지지 않는 경우 [3]
1714정성태7/11/201420891VS.NET IDE: 92. Visual Studio 2013을 지원하는 IL Support 확장 도구
1713정성태7/11/201444606Windows: 98. 윈도우 시스템 디스크 용량 확보를 위한 "Package Cache" 폴더 이동 [1]
1712정성태7/10/201432861.NET Framework: 450. 영문 윈도우에서 C# 콘솔 프로그램의 유니코드 출력 방법 [3]
1711정성태7/10/201438051Windows: 97. cmd.exe 창에서 사용할 폰트를 추가하는 방법 [1]
1710정성태7/8/201430582개발 환경 구성: 230. 유니코드의 Surrogate Pair, Supplementary Characters가 뭘까요?파일 다운로드2
1709정성태7/8/201427387VS.NET IDE: 91. Visual Studio에서 32/64비트 IIS Express 실행하는 방법
1708정성태7/7/201424756VS.NET IDE: 90. Visual Studio - 사용자 정의 정적 분석 규칙 만드는 방법 [3]파일 다운로드1
1707정성태7/4/201423023.NET Framework: 449. C#에서 C++로 VARIANT 넘겨주는 방법파일 다운로드1
1706정성태7/3/201421430.NET Framework: 448. .NET SmartClient 컨트롤을 윈도우 8/2012에서 활성화하는 방법파일 다운로드1
1705정성태7/2/201435058VC++: 78. 보이어-무어(Boyer-Moore) 알고리즘이 정말 빠를까? [6]파일 다운로드1
1704정성태7/2/201421647.NET Framework: 447. w3wp.exe AppPool 재생(recycle)하는 방법 정리
... 121  122  123  124  125  126  127  128  129  130  131  132  [133]  134  135  ...