Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 

함수형 프로그래밍 개념 - 리스트 해석(List Comprehension)과 순수 함수

절차형 프로그래밍만 하다가 함수형 프로그래밍을 배우는 경우 용어에서 약간 멈칫하는 경우가 있습니다. 그냥 오늘은 혹시 도움이 되실까 싶어 2가지 정도 소개해 드릴까 합니다.

우선, 리스트 해석(List Comprehension)인데, 다음의 글을 보시면 이해가 화~~~악 됩니다.

Chapter 3. Comprehensions
; http://juehan.github.io/DiveIntoPython3_Korean_Translation/comprehensions.html

리스트 컴프리헨션(list comprehension)이란 특정 리스트의 각각의 원소에 어떤 함수를 적용한 후 그 결과를 받아 새로운 리스트로 만들 수 있는 아주 간편한 방법


위의 글에 소개된 파이썬 예제 코드를 보면 더욱 이해가 빠르겠지요.

a_list = [1, 9, 8, 4]
[elem * 2 for elem in a_list]  // a_list의 모든 요소에 * 2를 해서 새로운 리스트를 만듦

사실 C#에도 LINQ가 나오면서 어느 정도 이런 구문이 가능합니다. 그렇습니다. SELECT 구문이 바로 그것입니다.

List<int> list = new List<int>() { 1, 2, 3, 4 };
            
var list2 = from elem in list select elem * 2;

foreach (var item in list2)
{
    Console.WriteLine(item);
}

Entity Framework이 하도 유명해서 LINQ를 데이터베이스 접근 용도로만 아실 수 있는데, 엄밀히 LINQ는 C#에 어느 정도의 함수형 프로그래밍 요소를 가져온 기여도 무시할 수 없습니다.

이 외에, "Chapter 3. Comprehensions" 글을 보면 "comprehension"이란 단어가 컬렉션의 요소에 어떤 함수를 적용한 후 새로운 컬렉션을 반환하는 일반적인 용도로 쓰인다는 것을 알 수 있습니다. 즉, "Dictionary Comprehension" 등의 표현도 있다는 것이지요.




그다음, 순수 함수(Pure function)가 있습니다. "프로그래밍 클로저: Lisp" 책에 보면 순수 함수는 말 그대로 부수 효과(side effect)가 전혀 없는 함수를 말하며, 즉 오로지 인자에만 의존해서 결과가 만들어지고 반환 값으로만 외부 세계에 영향을 준다고 합니다. 이렇게 말하면 ^^ 잘 이해가 안되죠? 역시 코드를 곁들여 설명해 보겠습니다.

간단하게 예를 들어, 다음의 경우는 순수 함수가 아닙니다.

int GeneralMethod(int n)
{
    return n * DateTime.Now.Ticks;
}

GeneralMethod에 n == 1을 넣었을 때 항상 같은 값이 산출되는 것이 아니기 때문입니다. 순수 함수는, 언제나 동일한 입력 값이면 동일한 출력 값을 반환해야 합니다.

또한, 객체 내부 상태를 변경해서도 안됩니다. 이것은 어찌 보면 당연한 조건입니다. 객체의 내부 값을 변경하는 경우 해당 함수를 호출할 때마다 상태가 변경되므로 입력 값에 대한 출력 값이 '항상' 일치하지 않을 수 있기 때문입니다. (C++의 경우에는 const 함수가 적당한 예가 되겠군요.)

그런 의미에서 우리가 알고 있는 수학 함수라는 것들은 모두 '순수 함수'에 속합니다.

int a = Math.Abs(-5);

위의 C# 메서드는 5를 반환합니다. -5 입력 값이 들어오면, 무조건, 항상, 언제나 한결 같이 5를 반환합니다. 이것이 순수 함수입니다.

자연스럽게 순수 함수가 만연하게 되는 함수형 프로그래밍은 이런 특성으로 인해 절차형에 비해 호출에 대한 최적화가 가능합니다. 왜냐하면, Math.Abs 함수의 입력으로 -5가 들어왔다면 최초 한번은 해당 함수의 전체 코드를 실행해야 하지만, 이후부터는 입력값 -5에 대해 무조건 5를 반환하면 되기 때문입니다.

실제로 Clojure 언어에는 메모이제이션(memoization)이라는 구문이 제공됩니다. 예를 들어, 1초의 지연 시간을 일부러 포함한 다음의 clojure 함수를 정의한 후,

user=> (defn delay-print [] (Thread/sleep 1000) (println "done") 100)
#'user/delay-print

이 함수를 memoize 함수를 통해 메모이제이션을 수행하도록 할 수 있습니다.

user=> (def delay-print (memoize delay-print))
#'user/delay-print

그럼, delay-print 함수를 최초 실행했을 때는 1초의 지연 시간을 갖고 println 함수도 수행한 후 100의 정수값을 반환하지만,

user=> (delay-print)
done
100

이후에 다시 실행했을 때는 1초의 지연시간도, println 함수 수행도 없이 그냥 곧바로 100의 값을 반환합니다.

user=> (delay-print)
100

이걸 테스트 하다보면 nCr 조합의 값을 재귀호출을 통해 얻어내던 것이 생각납니다. ^^

동전을 여러 더미로 나누는 경우의 수 세기(Partition Number) - 두 번째 이야기
; https://www.sysnet.pe.kr/2/0/1719

위의 경우 C#으로 만든 이항 계수 재귀 함수가 가장 낮은 성능을 보여줬는데요. clojure의 경우 다음과 같이 memoize를 한번 해주면,

user=> (defn BC [n, r] (cond (or (= r 0) (= r n)) 1
                     :else (+ (BC (- n 1) (- r 1)) (BC (- n 1) r))
                )
)
#'user/BC

user=> (def BC (memoize BC))
#'user/BC

결과가 순식간에 출력됩니다.

user=> (time (BC 30 12))
"Elapsed time: 0.67197 msecs"
86493225

// 위의 time 함수는 수행 시간을 재주는 기능을 합니다.
// 만약, memoize를 하지 않으면 (제 컴퓨터 기준으로) 수행 시간이 15초 정도 소요됩니다.

아니, 그런데 위의 경우에는 (BC 30 12) 호출을 두 번째 한 것도 아닌데 어떻게 저리 빠른 실행 결과를 보여줄 수 있을까요? 왜냐하면, BC 함수가 재귀 호출이 되므로 내부의 호출 결과들이 모두 메모이제이션되기 때문에 내부 BC 함수 수행 중에 캐시된 결과값이 도움이 된 경우가 있었기 때문입니다.

만약 C#으로 순수 함수의 성능을 높이려면 일부러 결과를 캐시(cache)하는 작업을 해줘야 하는데 clojure의 경우 단순하게 memoize 함수의 사용으로 그것이 해결됩니다. (실제로 "동전을 여러 더미로 나누는 경우의 수 세기(Partition Number) - 두 번째 이야기" 글의 "Partition Number" 예제에서는 EulerFunction 타입의 P 메서드에 캐시를 추가해서 수행 속도를 높였습니다.)

그러고 보니 '순식간'에라는 표현으로 과거에 썼던 글이 하나 생각나는 군요.

함수형 언어의 코드가 그렇게 빠를까?
; https://www.sysnet.pe.kr/2/0/1324

솔직히, 위의 글을 쓰던 순간에는 함수형 언어에 대한 이해가 많이 부족했었는데요. 이제는 왜 함수형 언어들이 빠를 수가 있을까... 하는 것이 이해가 됩니다. 또한 위의 글에서 테스트 했던 haskell과 F#의 메모리 사용량도 이해가 됩니다. 어쩌면, 나름대로의 함수형 언어라는 특징을 기반으로 내부적인 수행 최적화를 더 할 수도 있었을 테고 그 일정 부분에는 메모이제이션과 같은 캐시 역할도 수반되었을지도 모르겠습니다.

암튼, 요즘 몇 가지 언어를 쭈욱 훑어보다 보니 이해의 폭이 넓어져서 좋은 것 같습니다. ^^




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 6/28/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2014-08-18 02시34분
파이썬 - 데코레이터를 통한 memoization
; http://soooprmx.com/wp/archives/5149
정성태
2023-04-06 09시48분
정성태

... 61  62  63  64  65  66  67  68  69  70  71  72  73  [74]  75  ...
NoWriterDateCnt.TitleFile(s)
12086정성태12/20/201920910디버깅 기술: 144. windbg - Marshal.FreeHGlobal에서 발생한 덤프 분석 사례
12085정성태12/20/201918874오류 유형: 586. iisreset - The data is invalid. (2147942413, 8007000d) 오류 발생 - 두 번째 이야기 [1]
12084정성태12/19/201919309디버깅 기술: 143. windbg/sos - Hashtable의 buckets 배열 내용을 모두 덤프하는 방법 (do_hashtable.py) [1]
12083정성태12/17/201922285Linux: 27. linux - lldb를 이용한 .NET Core 응용 프로그램의 메모리 덤프 분석 방법 [2]
12082정성태12/17/201920555오류 유형: 585. lsof: WARNING: can't stat() fuse.gvfsd-fuse file system
12081정성태12/16/201922407개발 환경 구성: 465. 로컬 PC에서 개발 중인 ASP.NET Core 웹 응용 프로그램을 다른 PC에서도 접근하는 방법 [5]
12080정성태12/16/201919569.NET Framework: 870. C# - 프로세스의 모든 핸들을 열람
12079정성태12/13/201921452오류 유형: 584. 원격 데스크톱(rdp) 환경에서 다중 또는 고용량 파일 복사 시 "Unspecified error" 오류 발생
12078정성태12/13/201921243Linux: 26. .NET Core 응용 프로그램을 위한 메모리 덤프 방법 [3]
12077정성태12/13/201920343Linux: 25. 자주 실행할 명령어 또는 초기 환경을 "~/.bashrc" 파일에 등록
12076정성태12/12/201918862디버깅 기술: 142. Linux - lldb 환경에서 sos 확장 명령어를 이용한 닷넷 프로세스 디버깅 - 배포 방법에 따른 차이
12075정성태12/11/201919666디버깅 기술: 141. Linux - lldb 환경에서 sos 확장 명령어를 이용한 닷넷 프로세스 디버깅
12074정성태12/10/201919337디버깅 기술: 140. windbg/Visual Studio - 값이 변경된 경우를 위한 정지점(BP) 설정(Data Breakpoint)
12073정성태12/10/201920869Linux: 24. Linux/C# - 실행 파일이 아닌 스크립트 형식의 명령어를 Process.Start로 실행하는 방법
12072정성태12/9/201917670오류 유형: 583. iisreset 수행 시 "No such interface supported" 오류
12071정성태12/9/201921182오류 유형: 582. 리눅스 디스크 공간 부족 및 safemode 부팅 방법
12070정성태12/9/201923108오류 유형: 581. resize2fs: Bad magic number in super-block while trying to open /dev/.../root
12069정성태12/2/201919488디버깅 기술: 139. windbg - x64 덤프 분석 시 메서드의 인자 또는 로컬 변수의 값을 확인하는 방법
12068정성태11/28/201928156디버깅 기술: 138. windbg와 Win32 API로 알아보는 Windows Heap 정보 분석 [3]파일 다운로드2
12067정성태11/27/201919565디버깅 기술: 137. 실제 사례를 통해 Debug Diagnostics 도구가 생성한 닷넷 웹 응용 프로그램의 성능 장애 보고서 설명 [1]파일 다운로드1
12066정성태11/27/201919226디버깅 기술: 136. windbg - C# PInvoke 호출 시 마샬링을 담당하는 함수 분석 - OracleCommand.ExecuteReader에서 OpsSql.Prepare2 PInvoke 호출 분석
12065정성태11/25/201917534디버깅 기술: 135. windbg - C# PInvoke 호출 시 마샬링을 담당하는 함수 분석파일 다운로드1
12064정성태11/25/201920460오류 유형: 580. HTTP Error 500.0/500.33 - ANCM In-Process Handler Load Failure
12063정성태11/21/201919384디버깅 기술: 134. windbg - RtlReportCriticalFailure로부터 parameters 정보 찾는 방법
12062정성태11/21/201918889디버깅 기술: 133. windbg - CoTaskMemFree/FreeCoTaskMem에서 발생한 덤프 분석 사례 - 두 번째 이야기
12061정성태11/20/201919324Windows: 167. CoTaskMemAlloc/CoTaskMemFree과 윈도우 Heap의 관계
... 61  62  63  64  65  66  67  68  69  70  71  72  73  [74]  75  ...