Microsoft MVP성태의 닷넷 이야기
.NET Framework: 781. C# - OpenCvSharp 사용 시 포인터를 이용한 속도 향상 [링크 복사], [링크+제목 복사],
조회: 11760
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일

(시리즈 글이 10개 있습니다.)
.NET Framework: 707. OpenCV 응용 프로그램을 C#으로 구현 - OpenCvSharp
; https://www.sysnet.pe.kr/2/0/11402

.NET Framework: 708. C# - OpenCvSharp을 이용한 동영상(avi, mp4, ...) 처리
; https://www.sysnet.pe.kr/2/0/11403

.NET Framework: 709. C# - OpenCvSharp을 이용한 동영상(avi, mp4, ...) 처리 + Direct2D
; https://www.sysnet.pe.kr/2/0/11404

.NET Framework: 710. C# - OpenCvSharp을 이용한 Webcam 영상 처리 + Direct2D
; https://www.sysnet.pe.kr/2/0/11405

.NET Framework: 711. C# - OpenCvSharp의 Mat 데이터 조작 방법
; https://www.sysnet.pe.kr/2/0/11406

.NET Framework: 723. C# - OpenCvSharp 사용 시 C/C++을 이용한 속도 향상 (for 루프 연산)
; https://www.sysnet.pe.kr/2/0/11422

VC++: 123. 내가 만든 코드보다 OpenCV의 속도가 월등히 빠른 이유
; https://www.sysnet.pe.kr/2/0/11423

.NET Framework: 781. C# - OpenCvSharp 사용 시 포인터를 이용한 속도 향상
; https://www.sysnet.pe.kr/2/0/11567

개발 환경 구성: 447. Visual Studio Code에서 OpenCvSharp 개발 환경 구성
; https://www.sysnet.pe.kr/2/0/11971

Graphics: 38. C# - OpenCvSharp.VideoWriter에 BMP 파일을 1초씩 출력하는 예제
; https://www.sysnet.pe.kr/2/0/12485




C# - OpenCvSharp 사용 시 포인터를 이용한 속도 향상

아래의 글을 쓴 이후,

내가 만든 코드보다 OpenCV의 속도가 월등히 빠른 이유
; https://www.sysnet.pe.kr/2/0/11423

그래도 C#의 성능을 어떻게 좀 높일 수 있을까... 생각하다가 그냥 포인터 연산을 사용해 보기로 했습니다. 지난 글에서도 봤듯이 포인터 연산이라고 해서 무조건 빠른 것은 아닙니다.

C# - System.Span<T> 성능
; https://www.sysnet.pe.kr/2/0/11535

위의 결과에도 나오지만 단순 배열의 경우 포인터 연산과 비교해도 속도에서 결코 뒤지지 않습니다. 단지, OpenCvSharp의 경우에는 개별 요소를 제네릭 메서드로 경유하는 것이기 때문에 포인터를 직접 사용하는 것이 더 나을 수 있겠다는 생각이었습니다.




변환 코드는 다음의 제네릭 버전(At, Set)인 C# 메서드를,

static int Convert2(Mat srcMat, Mat kernel, Window window)
{
    int iMin, iVal;

    using (Mat dstMat = srcMat.Clone())
    {
        for (int i = 0; i < srcMat.Rows - 2; i++)
        {
            for (int j = 0; j < srcMat.Cols - 2; j++)
            {
                iMin = 0xFFF;

                for (int ii = 0; ii < kernel.Rows; ii++)
                {
                    for (int jj = 0; jj < kernel.Cols; jj++)
                    {
                        if (kernel.At<byte>(ii, jj) != 0)
                        {
                            iVal = srcMat.At<byte>(i + ii, j + jj);
                            if (iMin > iVal)
                            {
                                iMin = iVal;
                            }
                        }
                    }
                }

                dstMat.Set<byte>(i + 1, j + 1, (byte)iMin);
            }
        }
    }

    return 0;
}

포인터 연산으로 바꾼 것입니다.

static unsafe int Convert3(Mat srcMat, Mat kernel, Window window)
{
    int iMin, iVal;

    byte* kernelPtr = kernel.DataPointer;
    long kernelStep = kernel.Step();
    int kernelElemSize = kernel.ElemSize();

    byte* srcPtr = srcMat.DataPointer;
    long srcStep = srcMat.Step();
    int srcElemSize = srcMat.ElemSize();

    using (Mat dstMat = srcMat.Clone())
    {
        byte *dstPtr = dstMat.DataPointer;
        long dstStep = dstMat.Step();
        int dstElemSize = dstMat.ElemSize();

        for (int i = 0; i < srcMat.Rows - 2; i++)
        {
            for (int j = 0; j < srcMat.Cols - 2; j++)
            {
                iMin = 0xFFF;

                for (int ii = 0; ii < kernel.Rows; ii++)
                {
                    for (int jj = 0; jj < kernel.Cols; jj++)
                    {
                        if (*(kernelPtr + (ii) * kernelStep + (jj) * kernelElemSize) != 0)
                        {
                            iVal = *(srcPtr + (i + ii) * srcStep + (j + jj) * srcElemSize);
                            if (iMin > iVal)
                            {
                                iMin = iVal;
                            }
                        }
                    }
                }

                *(dstPtr + ((i + 1) * dstStep + (j + 1) * dstElemSize)) = (byte)iMin;
            }
        }

        if (window != null)
        {
            window.ShowImage(dstMat);
        }
    }

    return 0;
}

테스트 결과는, OpenCvSharp의 제네릭 메서드 버전이 얼마나 낮은 성능을 보이는지 극명하게 나타내고 있습니다.

[CPU i5-4670 4-core]

OpenCvSharp 제네릭 At, Set :  26,550ms
C# unsafe ptr              :   1,341ms
C# unsafe ptr parallel     :     285ms
C++                        :      51ms

엄청난 차이입니다. ^^; 물론, 그래도 C++의 51ms에 비하면 많이 느리지만 26초 걸리던 것을 1초 정도로 줄였으니 현실적으로 봤을 때 가벼운 목적으로 제작하는 프로그램이라면 C++의 힘을 빌리지 않아도 될 수준까지는 내려갔습니다.

따라서 OpenCvSharp에서 제네릭 메서드 버전의 사용은 지양하는 것이 좋습니다.

(첨부 파일은 이 글의 예제 코드를 포함합니다.)




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 9/8/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




... 16  17  18  19  20  21  22  [23]  24  25  26  27  28  29  30  ...
NoWriterDateCnt.TitleFile(s)
13056정성태5/12/20226461.NET Framework: 2009. C# - async/await 그리고 스레드 (2) MyTask의 호출 흐름 [2]파일 다운로드1
13055정성태5/11/20229410.NET Framework: 2008. C# - async/await 그리고 스레드 (1) MyTask로 재현 [11]파일 다운로드1
13054정성태5/11/20226883.NET Framework: 2007. C# - 10진수 숫자를 담은 문자열을 숫자로 변환하는 방법 [11]파일 다운로드1
13053정성태5/10/20226544.NET Framework: 2006. C# - GC.KeepAlive 메서드의 역할
13052정성태5/9/20226557.NET Framework: 2005. C# - 생성한 참조 개체가 언제 GC의 정리 대상이 될까요?
13051정성태5/8/20226522.NET Framework: 2004. C# XingAPI - ACF 검색 결과로 구한 CSV 파일을 통해 퀀트 종목 찾기파일 다운로드1
13050정성태5/6/20226544.NET Framework: 2003. C# - COM 개체의 이벤트 핸들러에서 발생하는 예외에 대한 CLR의 특별 대우파일 다운로드1
13049정성태5/6/20225518오류 유형: 811. GoLand - Error: Cannot find package
13048정성태5/6/20226646오류 유형: 810. "ASUS TUF GAMING B550M-PLUS (WI-FI)" 모델에서 블루투스 장치가 인식이 안 되는 문제
13047정성태5/6/20226628오류 유형: 809. Speech Recognition could not start
13046정성태5/5/20226939.NET Framework: 2002. C# XingAPI - ACF 파일을 이용한 퀀트 종목 찾기(t1857)
13045정성태5/5/20226987.NET Framework: 2001. C# XingAPI - 주식 종목에 따른 PBR, PER, ROE 구하는 방법(t3341 예제)
13044정성태5/4/20226432오류 유형: 808. error : clang++ exited with code 127
13043정성태5/3/20226097오류 유형: 807. C# - 닷넷 응용 프로그램에서 Informix DB 사용 시 오류 메시지 정리
13042정성태5/3/20226461.NET Framework: 2000. C# - 닷넷 응용 프로그램에서 Informix DB 사용 방법파일 다운로드1
13041정성태4/28/20226742개발 환경 구성: 642. Informix 데이터베이스 docker 환경 구성
13040정성태4/27/20227243VC++: 156. 비주얼 스튜디오 - Linux C/C++ 프로젝트에서 openssl 링크하는 방법
13039정성태4/27/20228060.NET Framework: 1999. C# - Playwright를 이용한 간단한 브라우저 제어 실습
13038정성태4/26/20225926오류 유형: 806. twine 실행 시 ConfigParser.ParsingError: File contains parsing errors: /root/.pypirc
13037정성태4/25/20226248.NET Framework: 1998. Azure Functions를 사용한 간단한 실습
13036정성태4/24/20227007.NET Framework: 1997. C# - nano 시간을 가져오는 방법 [2]
13035정성태4/22/20227595Windows: 204. Windows 10부터 바뀐 QueryPerformanceFrequency, QueryPerformanceCounter
13034정성태4/21/20226949.NET Framework: 1996. C# XingAPI - 주식 종목에 따른 PBR, PER, ROE, ROA 구하는 방법(t3320, t8430 예제)파일 다운로드1
13033정성태4/18/20227571.NET Framework: 1195. C# - Thread.Yield와 Thread.Sleep(0)의 차이점(?)
13032정성태4/17/20227297오류 유형: 805. Github의 50MB 파일 크기 제한 - warning: GH001: Large files detected. You may want to try Git Large File Storage
13031정성태4/15/20226820.NET Framework: 1194. C# - IdealProcessor와 ProcessorAffinity의 차이점
... 16  17  18  19  20  21  22  [23]  24  25  26  27  28  29  30  ...