Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
(연관된 글이 3개 있습니다.)
(시리즈 글이 10개 있습니다.)
.NET Framework: 707. OpenCV 응용 프로그램을 C#으로 구현 - OpenCvSharp
; https://www.sysnet.pe.kr/2/0/11402

.NET Framework: 708. C# - OpenCvSharp을 이용한 동영상(avi, mp4, ...) 처리
; https://www.sysnet.pe.kr/2/0/11403

.NET Framework: 709. C# - OpenCvSharp을 이용한 동영상(avi, mp4, ...) 처리 + Direct2D
; https://www.sysnet.pe.kr/2/0/11404

.NET Framework: 710. C# - OpenCvSharp을 이용한 Webcam 영상 처리 + Direct2D
; https://www.sysnet.pe.kr/2/0/11405

.NET Framework: 711. C# - OpenCvSharp의 Mat 데이터 조작 방법
; https://www.sysnet.pe.kr/2/0/11406

.NET Framework: 723. C# - OpenCvSharp 사용 시 C/C++을 이용한 속도 향상 (for 루프 연산)
; https://www.sysnet.pe.kr/2/0/11422

VC++: 123. 내가 만든 코드보다 OpenCV의 속도가 월등히 빠른 이유
; https://www.sysnet.pe.kr/2/0/11423

.NET Framework: 781. C# - OpenCvSharp 사용 시 포인터를 이용한 속도 향상
; https://www.sysnet.pe.kr/2/0/11567

개발 환경 구성: 447. Visual Studio Code에서 OpenCvSharp 개발 환경 구성
; https://www.sysnet.pe.kr/2/0/11971

Graphics: 38. C# - OpenCvSharp.VideoWriter에 BMP 파일을 1초씩 출력하는 예제
; https://www.sysnet.pe.kr/2/0/12485




C# - OpenCvSharp 사용 시 C/C++을 이용한 속도 향상 (for 루프 연산)

지난 글에서,

C# - OpenCvSharp을 이용한 동영상(avi, mp4, ...) 처리 + Direct2D
; https://www.sysnet.pe.kr/2/0/11404

RGB 이미지를 RGBA로 변환하기 위해 C# 코딩을 했었는데요, 이게 꽤나 성능이 안 좋았습니다. 반면, OpenCvSharp의 Mat 타입에서 제공하는 CvtColor 연산은 놀라울 정도로 높은 성능을 보였습니다. 따라서 당연히 CvtColor 메서드를 비롯해 가능하면 OpenCV가 제공하는 함수를 사용하는 것이 좋겠지만, 그래도 때로는 사용자 정의 루프를 작성해야 할 때가 있습니다.

그럴 때 성능이 안 좋은 C# 코딩보다는 그 부분만을 C/C++로 대체해 OpenCV 수준의 성능으로 끌어올리는 것이 바람직한데요, 그런 경우 어떤 식으로 해야 OpenCV 정도까지 성능이 개선되는지 테스트를 해봤습니다. ^^

연산 대상은 "C# - OpenCvSharp을 이용한 동영상(avi, mp4, ...) 처리 + Direct2D" 글에서도 다뤘던 RGB to RGBA 코드입니다.




우선, 기준이 되는 OpenCV 연산을 다음과 같이 할 수 있습니다.

static void Main(string[] args)
{
    using (Mat mat = new Mat(new Size(1920, 1080), MatType.CV_8UC3))
    {
        Convert(mat);
    }
}

static int Convert(Mat mat)
{
    using (Mat dstMat = mat.CvtColor(ColorConversionCodes.BGR2BGRA))
    {
        return dstMat.Width;
    }
}

그다음 동일한 연산을 C#으로 직접 For loop로 구현을 했습니다.

static unsafe int Convert2(Mat srcMat)
{
    byte *srcPtr = (byte *)srcMat.Data;

    using (Mat dstMat = new Mat(new Size(1920, 1080), MatType.CV_8UC4))
    {
        byte *dstPtr = (byte *)dstMat.Data;

        for (int y = 0; y < srcMat.Height; y++)
        {
            for (int x = 0; x < srcMat.Width - 1; x++)
            {
                int* src = (int*)srcPtr;
                int* dst = (int*)dstPtr;

                *dst = *src;
                *(dstPtr + 3) = 0xff;

                srcPtr = srcPtr + 3;
                dstPtr = dstPtr + 4;
            }

            Buffer.MemoryCopy(srcPtr, dstPtr, 3, 3);
            *(dstPtr + 3) = 0xff;
        }
    }

    return 0;
}

역시 동일한 코드를 C/C++ DLL을 만들어 export 함수로 C#에서 다음과 같이 호출하는 식으로 구현했습니다.

// ==== C# ====
[DllImport("MemCopyLib.dll")]
public unsafe extern static void RGB2RGBA(byte* srcPtr, byte* dstPtr, int width, int height);

static unsafe int Convert3(Mat srcMat)
{
    byte* srcPtr = (byte*)srcMat.Data;
    using (Mat dstMat = new Mat(new Size(1920, 1080), MatType.CV_8UC4))
    {
        byte* dstPtr = (byte*)dstMat.Data;
        RGB2RGBA(srcPtr, dstPtr, srcMat.Width, srcMat.Height);
    }

    return 0;
}

// ==== C/C++ ====
__declspec(dllexport) void RGB2RGBA(BYTE *srcPtr, BYTE *dstPtr, int width, int height)
{
    for (int y = 0; y < height; y++)
    {
        for (int x = 0; x < width; x++)
        {
            memcpy(dstPtr, srcPtr, 3);
            *(dstPtr + 3) = 0xff;

            srcPtr = srcPtr + 3;
            dstPtr = dstPtr + 4;
        }
    }
}

이렇게 만들고 실행해 보면, 다음과 같은 성능 수치를 볼 수 있습니다.

// 각각 Release 빌드로 100회씩 실행했으며, JIT 컴파일 보정을 위해 1회를 미리 실행한 후 시간 측정

opencv(100) : 690
c# for(100) : 7120
C++ for(100) : 1284

보면 OpenCV의 Mat.CvtColor 메서드가 단연 빠르고, 약 2배 늦은 속도로 단순 C++ for 구문 속도가 나오며 C#은 그보다도 7배까지 느린 것을 볼 수 있습니다. 즉, 이미지 처리 시 무거운 for 루프를 처리하는 경우라면 C#보다는 C/C++에 작업을 맡기는 것을 충분히 고려할만합니다.




그렇다면 OpenCV의 처리가 왜 그토록 빠른 것일까요? 이에 대한 해답은 지난번에 소개했던 것처럼 다음의 글에서 찾아볼 수 있습니다.

OpenCV - 속도 분석 (1)
; https://laonple.blog.me/220861902363

즉, 병렬 처리입니다. 이를 위해 C/C++ 코드를 다음과 같이 병렬 처리로 바꾸면,

// i5-4670 코어 4개에서 테스트

#include <ppl.h>

using namespace concurrency;

__declspec(dllexport) void RGB2RGBA_Parallel(BYTE *srcPtr, BYTE *dstPtr, int width, int height)
{
    parallel_for (0, height, [&](size_t y)
    {
        BYTE *srcPtrY = srcPtr + (y * width * 3);
        BYTE *dstPtrY = dstPtr + (y * width * 4);

        for (size_t x = 0; x < width; x++)
        {
            memcpy(dstPtrY, srcPtrY, 3);
            *(dstPtrY + 3) = 0xff;

            srcPtrY = srcPtrY + 3;
            dstPtrY = dstPtrY + 4;
        }
    });
}

1284ms였던 것이 609ms까지 내려갑니다. OpenCV 속도가 690ms이니 충분히 빨라진 것입니다. (물론, OpenCV가 범용 처리를 하는 것을 고려했을 때 당연히 우리가 만든 C/C++ 코드가 저 정도는 빨라야 합니다.)

그렇다면 혹시 C# 코드도 병렬 처리를 하면 많이 빨라질까요?

// i5-4670 코어 4개에서 테스트
static unsafe int Convert3(Mat srcMat)
{
    byte* srcPtr = (byte*)srcMat.Data;

    using (Mat dstMat = new Mat(new Size(1920, 1080), MatType.CV_8UC4))
    {
        byte* dstPtr = (byte*)dstMat.Data;

        Parallel.For(0, srcMat.Height, (y) =>
        {
            byte* srcPtrY = srcPtr + (y * srcMat.Width * 3);
            byte* dstPtrY = dstPtr + (y * srcMat.Width * 4);

            for (int x = 0; x < srcMat.Width - 1; x++)
            {
                int* src = (int*)srcPtrY;
                int* dst = (int*)dstPtrY;

                *dst = *src;
                *(dstPtrY + 3) = 0xff;

                srcPtrY = srcPtrY + 3;
                dstPtrY = dstPtrY + 4;
            }

            Buffer.MemoryCopy(srcPtrY, dstPtrY, 3, 3);
            *(dstPtrY + 3) = 0xff;
        });
    }

    return 0;
}

테스트해보면, 단독 스레드일 때 7355ms인 것에 비하면 2036ms를 기록하며 확실히 빨라졌지만 이는 C/C++ 단독 스레드 처리일 때보다도 느린 수치입니다.

(첨부 파일은 이 글의 소스 코드를 포함합니다.)

참고로 다음은 성능 수치를 엑셀 그래프로 그린 것입니다. 훨씬 직관적이군요. ^^

for_loop_perf.png




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 9/26/2024]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2018-05-11 02시04분
내가 만든 코드보다 OpenCV의 속도가 월등히 빠른 이유
; http://www.sysnet.pe.kr/2/0/11423
정성태
2018-05-11 02시05분
CUDA로 작성한 RGB2RGBA 성능
; http://www.sysnet.pe.kr/2/0/11471
정성태
2018-06-05 07시24분
[qwe1234] unsafe 에서 포인터를 사용해서 메모리를 다루더라도 GC가 그 메모리 영역을 맘대로 relocate 하는 경우가 생겨서 fixed keyword를 써서 GC가 못 건드리게 해야 한다고 생각하는데 굳이 fixed를 사용하지 않아도 되나요???
[guest]
2018-06-05 10시59분
fixed하는 것은 "관리 메모리"로부터 unsafe 포인터를 구할 때 고정시키기 위해 사용하는 것입니다. OpenCvSharp의 Mat 클래스는 OpenCV 네이티브 모듈 내에서 할당한 비관리 메모리를 사용하므로 GC의 관리 대상이 아닙니다. 따라서 fixed 시킬 필요가 없습니다.
정성태

... 121  122  123  124  125  126  127  128  129  130  131  132  [133]  134  135  ...
NoWriterDateCnt.TitleFile(s)
1731정성태8/11/201427093개발 환경 구성: 235. 점(.)으로 시작하는 파일명을 탐색기에서 만드는 방법
1730정성태8/11/201422178개발 환경 구성: 234. Royal TS의 터미널(Terminal) 연결에서 한글이 깨지는 현상 해결 방법
1729정성태8/11/201418238오류 유형: 236. SqlConnection - The requested Performance Counter is not a custom counter, it has to be initialized as ReadOnly.
1728정성태8/8/201430332.NET Framework: 453. C# - 오피스 파워포인트(Powerpoint) 파일을 WinForm에서 보는 방법파일 다운로드1
1727정성태8/6/201420542오류 유형: 235. SignalR 오류 메시지 - Counter 'Messages Bus Messages Published Total' does not exist in the specified Category. [2]
1726정성태8/6/201419409오류 유형: 234. IIS Express에서 COM+ 사용 시 SecurityException - "Requested registry access is not allowed" 발생
1725정성태8/6/201421401오류 유형: 233. Visual Studio 2013 Update3 적용 후 Microsoft.VisualStudio.Web.PageInspector.Runtime 모듈에 대한 FileNotFoundException 예외 발생
1724정성태8/5/201426117.NET Framework: 452. .NET System.Threading.Thread 개체에서 Native Thread Id를 구하는 방법 - 두 번째 이야기 [1]파일 다운로드1
1723정성태7/29/201458398개발 환경 구성: 233. DirectX 9 예제 프로젝트 빌드하는 방법 [3]파일 다운로드1
1722정성태7/25/201421090오류 유형: 232. IIS 500 Internal Server Error - NTFS 암호화된 폴더에 웹 애플리케이션이 위치한 경우
1721정성태7/24/201424115.NET Framework: 451. 함수형 프로그래밍 개념 - 리스트 해석(List Comprehension)과 순수 함수 [2]
1720정성태7/23/201422102개발 환경 구성: 232. C:\WINDOWS\system32\LogFiles\HTTPERR 폴더에 로그 파일을 남기지 않는 설정
1719정성태7/22/201426071Math: 13. 동전을 여러 더미로 나누는 경우의 수 세기(Partition Number) - 두 번째 이야기파일 다운로드1
1718정성태7/19/201435324Math: 12. HTML에서 수학 관련 기호/수식을 표현하기 위한 방법 - MathJax.js [4]
1716정성태7/17/201435038개발 환경 구성: 231. PC 용 무료 안드로이드 에뮬레이터 - genymotion
1715정성태7/13/201430616기타: 47. 운영체제 종료 후에도 USB 외장 하드의 전원이 꺼지지 않는 경우 [3]
1714정성태7/11/201420892VS.NET IDE: 92. Visual Studio 2013을 지원하는 IL Support 확장 도구
1713정성태7/11/201444626Windows: 98. 윈도우 시스템 디스크 용량 확보를 위한 "Package Cache" 폴더 이동 [1]
1712정성태7/10/201432881.NET Framework: 450. 영문 윈도우에서 C# 콘솔 프로그램의 유니코드 출력 방법 [3]
1711정성태7/10/201438081Windows: 97. cmd.exe 창에서 사용할 폰트를 추가하는 방법 [1]
1710정성태7/8/201430590개발 환경 구성: 230. 유니코드의 Surrogate Pair, Supplementary Characters가 뭘까요?파일 다운로드2
1709정성태7/8/201427425VS.NET IDE: 91. Visual Studio에서 32/64비트 IIS Express 실행하는 방법
1708정성태7/7/201424780VS.NET IDE: 90. Visual Studio - 사용자 정의 정적 분석 규칙 만드는 방법 [3]파일 다운로드1
1707정성태7/4/201423054.NET Framework: 449. C#에서 C++로 VARIANT 넘겨주는 방법파일 다운로드1
1706정성태7/3/201421440.NET Framework: 448. .NET SmartClient 컨트롤을 윈도우 8/2012에서 활성화하는 방법파일 다운로드1
1705정성태7/2/201435146VC++: 78. 보이어-무어(Boyer-Moore) 알고리즘이 정말 빠를까? [6]파일 다운로드1
... 121  122  123  124  125  126  127  128  129  130  131  132  [133]  134  135  ...