Microsoft MVP성태의 닷넷 이야기
글쓴 사람
홈페이지
첨부 파일

C# - OpenCvSharp 사용 시 포인터를 이용한 속도 향상

아래의 글을 쓴 이후,

내가 만든 코드보다 OpenCV의 속도가 월등히 빠른 이유
; https://www.sysnet.pe.kr/2/0/11423

그래도 C#의 성능을 어떻게 좀 높일 수 있을까... 생각하다가 그냥 포인터 연산을 사용해 보기로 했습니다. 지난 글에서도 봤듯이 포인터 연산이라고 해서 무조건 빠른 것은 아닙니다.

C# - System.Span<T> 성능
; https://www.sysnet.pe.kr/2/0/11535

위의 결과에도 나오지만 단순 배열의 경우 포인터 연산과 비교해도 속도에서 결코 뒤지지 않습니다. 단지, OpenCvSharp의 경우에는 개별 요소를 제네릭 메서드로 경유하는 것이기 때문에 포인터를 직접 사용하는 것이 더 나을 수 있겠다는 생각이었습니다.




변환 코드는 다음의 제네릭 버전(At, Set)인 C# 메서드를,

static int Convert2(Mat srcMat, Mat kernel, Window window)
{
    int iMin, iVal;

    using (Mat dstMat = srcMat.Clone())
    {
        for (int i = 0; i < srcMat.Rows - 2; i++)
        {
            for (int j = 0; j < srcMat.Cols - 2; j++)
            {
                iMin = 0xFFF;

                for (int ii = 0; ii < kernel.Rows; ii++)
                {
                    for (int jj = 0; jj < kernel.Cols; jj++)
                    {
                        if (kernel.At<byte>(ii, jj) != 0)
                        {
                            iVal = srcMat.At<byte>(i + ii, j + jj);
                            if (iMin > iVal)
                            {
                                iMin = iVal;
                            }
                        }
                    }
                }

                dstMat.Set<byte>(i + 1, j + 1, (byte)iMin);
            }
        }
    }

    return 0;
}

포인터 연산으로 바꾼 것입니다.

static unsafe int Convert3(Mat srcMat, Mat kernel, Window window)
{
    int iMin, iVal;

    byte* kernelPtr = kernel.DataPointer;
    long kernelStep = kernel.Step();
    int kernelElemSize = kernel.ElemSize();

    byte* srcPtr = srcMat.DataPointer;
    long srcStep = srcMat.Step();
    int srcElemSize = srcMat.ElemSize();

    using (Mat dstMat = srcMat.Clone())
    {
        byte *dstPtr = dstMat.DataPointer;
        long dstStep = dstMat.Step();
        int dstElemSize = dstMat.ElemSize();

        for (int i = 0; i < srcMat.Rows - 2; i++)
        {
            for (int j = 0; j < srcMat.Cols - 2; j++)
            {
                iMin = 0xFFF;

                for (int ii = 0; ii < kernel.Rows; ii++)
                {
                    for (int jj = 0; jj < kernel.Cols; jj++)
                    {
                        if (*(kernelPtr + (ii) * kernelStep + (jj) * kernelElemSize) != 0)
                        {
                            iVal = *(srcPtr + (i + ii) * srcStep + (j + jj) * srcElemSize);
                            if (iMin > iVal)
                            {
                                iMin = iVal;
                            }
                        }
                    }
                }

                *(dstPtr + ((i + 1) * dstStep + (j + 1) * dstElemSize)) = (byte)iMin;
            }
        }

        if (window != null)
        {
            window.ShowImage(dstMat);
        }
    }

    return 0;
}

테스트 결과는, OpenCvSharp의 제네릭 메서드 버전이 얼마나 낮은 성능을 보이는지 극명하게 나타내고 있습니다.

[CPU i5-4670 4-core]

OpenCvSharp 제네릭 At, Set :  26,550ms
C# unsafe ptr              :   1,341ms
C# unsafe ptr parallel     :     285ms
C++                        :      51ms

엄청난 차이입니다. ^^; 물론, 그래도 C++의 51ms에 비하면 많이 느리지만 26초 걸리던 것을 1초 정도로 줄였으니 현실적으로 봤을 때 가벼운 목적으로 제작하는 프로그램이라면 C++의 힘을 빌리지 않아도 될 수준까지는 내려갔습니다.

따라서 OpenCvSharp에서 제네릭 메서드 버전의 사용은 지양하는 것이 좋습니다.

(첨부 파일은 이 글의 예제 코드를 포함합니다.)




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]





[최초 등록일: ]
[최종 수정일: 6/29/2018 ]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer@outlook.com

비밀번호

댓글 쓴 사람
 




... 16  17  18  19  20  21  22  [23]  24  25  26  27  28  29  30  ...
NoWriterDateCnt.TitleFile(s)
11599정성태7/10/20181822Math: 42. GeoGebra 기하 (19) - 두 원의 안과 밖으로 접하는 직선파일 다운로드1
11598정성태7/10/20181752Windows: 147. 시스템 복구 디스크를 USB 디스크에 만드는 방법
11597정성태8/9/20182103사물인터넷: 17. Thinary Electronic - ATmega328PB 아두이노 호환 보드의 개발 환경 구성
11596정성태7/10/20181888기타: 72. 과거의 용어 설명 - OWIN
11595정성태11/20/20184563사물인터넷: 16. New NodeMcu v3 아두이노 호환 보드의 기본 개발 환경 구성
11594정성태7/8/20182457Math: 41. GeoGebra 기하 (18) - 원의 중심 및 접선파일 다운로드1
11593정성태7/8/20182128Math: 40. GeoGebra 기하 (17) - 각의 복사파일 다운로드1
11591정성태7/7/20182065Math: 39. GeoGebra 기하 (16) - 삼각형의 방심과 방접원파일 다운로드1
11590정성태7/7/20181762Math: 38. GeoGebra 기하 (15) - 삼각형의 수심파일 다운로드1
11589정성태7/7/20182452.NET Framework: 787. object로 형변환된 인스턴스를 원래의 타입 인자로 제네릭 메서드를 호출하는 방법 [2]파일 다운로드1
11588정성태12/19/20192140디버깅 기술: 116. windbg 분석 사례 - ASP.NET 웹 응용 프로그램의 CPU 100% 현상
11587정성태7/5/20181939.NET Framework: 786. ASP.NET - HttpCookieCollection을 다중 스레드에서 사용할 경우 무한 루프 현상
11586정성태7/5/20182332Math: 37. GeoGebra 기하 (14) - 삼각형의 무게 중심파일 다운로드1
11585정성태7/5/20182374Math: 36. GeoGebra 기하 (13) - 삼각형의 외심과 외접하는 원파일 다운로드1
11584정성태7/5/20182728Math: 35. GeoGebra 기하 (12) - 삼각형의 내심과 내접하는 원파일 다운로드1
11583정성태7/5/20181753.NET Framework: 785. public으로 노출되지 않은 다른 어셈블리의 delegate 인스턴스를 Reflection으로 생성하는 방법파일 다운로드1
11582정성태5/8/20192882.NET Framework: 784. C# - 제네릭 인자를 가진 타입을 생성하는 방법 [1]파일 다운로드1
11581정성태7/4/20182681Math: 34. GeoGebra 기하 (11) - 3대 작도 불능 문제의 하나인 임의 각의 3등분파일 다운로드1
11580정성태7/4/20182068Math: 33. GeoGebra 기하 (10) - 직각의 3등분파일 다운로드1
11579정성태7/4/20182203Math: 32. GeoGebra 기하 (9) - 임의의 선분을 한 변으로 갖는 정삼각형파일 다운로드1
11578정성태7/3/20182121Math: 31. GeoGebra 기하 (8) - 호(Arc)의 이등분파일 다운로드1
11577정성태7/3/20182423Math: 30. GeoGebra 기하 (7) - 각의 이등분파일 다운로드1
11576정성태7/3/20182171Math: 29. GeoGebra 기하 (6) - 대수의 4칙 연산파일 다운로드1
11575정성태7/2/20182490Math: 28. GeoGebra 기하 (5) - 선분을 n 등분하는 방법파일 다운로드1
11574정성태7/2/20182104Math: 27. GeoGebra 기하 (4) - 선분을 n 배 늘이는 방법파일 다운로드1
11573정성태7/2/20182084Math: 26. GeoGebra 기하 (3) - 평행선
... 16  17  18  19  20  21  22  [23]  24  25  26  27  28  29  30  ...