(시리즈 글이 10개 있습니다.)

.NET Framework: 707. OpenCV 응용 프로그램을 C#으로 구현 - OpenCvSharp
; https://www.sysnet.pe.kr/2/0/11402

.NET Framework: 708. C# - OpenCvSharp을 이용한 동영상(avi, mp4, ...) 처리
; https://www.sysnet.pe.kr/2/0/11403

.NET Framework: 709. C# - OpenCvSharp을 이용한 동영상(avi, mp4, ...) 처리 + Direct2D
; https://www.sysnet.pe.kr/2/0/11404

.NET Framework: 710. C# - OpenCvSharp을 이용한 Webcam 영상 처리 + Direct2D
; https://www.sysnet.pe.kr/2/0/11405

.NET Framework: 711. C# - OpenCvSharp의 Mat 데이터 조작 방법
; https://www.sysnet.pe.kr/2/0/11406

.NET Framework: 723. C# - OpenCvSharp 사용 시 C/C++을 이용한 속도 향상 (for 루프 연산)
; https://www.sysnet.pe.kr/2/0/11422

VC++: 123. 내가 만든 코드보다 OpenCV의 속도가 월등히 빠른 이유
; https://www.sysnet.pe.kr/2/0/11423

.NET Framework: 781. C# - OpenCvSharp 사용 시 포인터를 이용한 속도 향상
; https://www.sysnet.pe.kr/2/0/11567

개발 환경 구성: 447. Visual Studio Code에서 OpenCvSharp 개발 환경 구성
; https://www.sysnet.pe.kr/2/0/11971

Graphics: 38. C# - OpenCvSharp.VideoWriter에 BMP 파일을 1초씩 출력하는 예제
; https://www.sysnet.pe.kr/2/0/12485

C# - OpenCvSharp 사용 시 포인터를 이용한 속도 향상

아래의 글을 쓴 이후,

내가 만든 코드보다 OpenCV의 속도가 월등히 빠른 이유
; https://www.sysnet.pe.kr/2/0/11423

그래도 C#의 성능을 어떻게 좀 높일 수 있을까... 생각하다가 그냥 포인터 연산을 사용해 보기로 했습니다. 지난 글에서도 봤듯이 포인터 연산이라고 해서 무조건 빠른 것은 아닙니다.

C# - System.Span<T> 성능
; https://www.sysnet.pe.kr/2/0/11535

위의 결과에도 나오지만 단순 배열의 경우 포인터 연산과 비교해도 속도에서 결코 뒤지지 않습니다. 단지, OpenCvSharp의 경우에는 개별 요소를 제네릭 메서드로 경유하는 것이기 때문에 포인터를 직접 사용하는 것이 더 나을 수 있겠다는 생각이었습니다.

변환 코드는 다음의 제네릭 버전(At, Set)인 C# 메서드를,

static int Convert2(Mat srcMat, Mat kernel, Window window)
{
    int iMin, iVal;

    using (Mat dstMat = srcMat.Clone())
    {
        for (int i = 0; i < srcMat.Rows - 2; i++)
        {
            for (int j = 0; j < srcMat.Cols - 2; j++)
            {
                iMin = 0xFFF;

                for (int ii = 0; ii < kernel.Rows; ii++)
                {
                    for (int jj = 0; jj < kernel.Cols; jj++)
                    {
                        if (kernel.At<byte>(ii, jj) != 0)
                        {
                            iVal = srcMat.At<byte>(i + ii, j + jj);
                            if (iMin > iVal)
                            {
                                iMin = iVal;
                            }
                        }
                    }
                }

                dstMat.Set<byte>(i + 1, j + 1, (byte)iMin);
            }
        }
    }

    return 0;
}

포인터 연산으로 바꾼 것입니다.

static unsafe int Convert3(Mat srcMat, Mat kernel, Window window)
{
    int iMin, iVal;

    byte* kernelPtr = kernel.DataPointer;
    long kernelStep = kernel.Step();
    int kernelElemSize = kernel.ElemSize();

    byte* srcPtr = srcMat.DataPointer;
    long srcStep = srcMat.Step();
    int srcElemSize = srcMat.ElemSize();

    using (Mat dstMat = srcMat.Clone())
    {
        byte *dstPtr = dstMat.DataPointer;
        long dstStep = dstMat.Step();
        int dstElemSize = dstMat.ElemSize();

        for (int i = 0; i < srcMat.Rows - 2; i++)
        {
            for (int j = 0; j < srcMat.Cols - 2; j++)
            {
                iMin = 0xFFF;

                for (int ii = 0; ii < kernel.Rows; ii++)
                {
                    for (int jj = 0; jj < kernel.Cols; jj++)
                    {
                        if (*(kernelPtr + (ii) * kernelStep + (jj) * kernelElemSize) != 0)
                        {
                            iVal = *(srcPtr + (i + ii) * srcStep + (j + jj) * srcElemSize);
                            if (iMin > iVal)
                            {
                                iMin = iVal;
                            }
                        }
                    }
                }

                *(dstPtr + ((i + 1) * dstStep + (j + 1) * dstElemSize)) = (byte)iMin;
            }
        }

        if (window != null)
        {
            window.ShowImage(dstMat);
        }
    }

    return 0;
}

테스트 결과는, OpenCvSharp의 제네릭 메서드 버전이 얼마나 낮은 성능을 보이는지 극명하게 나타내고 있습니다.

[CPU i5-4670 4-core]

OpenCvSharp 제네릭 At, Set :  26,550ms
C# unsafe ptr              :   1,341ms
C# unsafe ptr parallel     :     285ms
C++                        :      51ms

엄청난 차이입니다. ^^; 물론, 그래도 C++의 51ms에 비하면 많이 느리지만 26초 걸리던 것을 1초 정도로 줄였으니 현실적으로 봤을 때 가벼운 목적으로 제작하는 프로그램이라면 C++의 힘을 빌리지 않아도 될 수준까지는 내려갔습니다.

따라서 OpenCvSharp에서 제네릭 메서드 버전의 사용은 지양하는 것이 좋습니다.

(첨부 파일은 이 글의 예제 코드를 포함합니다.)

[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[다음 글] Math: 23. GeoGebra 기하 - 컴퍼스와 자를 이용한 작도 프로그램
[이전 글] .NET Framework: 780. C# - JIRA REST API 사용 정리 (1) Basic 인증

[최초 등록일: 6/28/2018]
[최종 수정일: 9/8/2021]

이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.

by SeongTae Jeong, mailto:techsharer at outlook.com

No	Writer	Date	Cnt.	Title	File(s)
13281	정성태	3/12/2023	16522	Windows: 225. 윈도우 바탕화면의 아이콘들이 넓게 퍼지는 경우 [2]
13280	정성태	3/9/2023	19187	개발 환경 구성: 670. WSL 2에서 호스팅 중인 TCP 서버를 외부에서 접근하는 방법
13279	정성태	3/9/2023	18667	오류 유형: 851. 파이썬 ModuleNotFoundError: No module named '_cffi_backend'
13278	정성태	3/8/2023	18746	개발 환경 구성: 669. WSL 2의 (init이 아닌) systemd 지원 [1]
13277	정성태	3/6/2023	19194	개발 환경 구성: 668. 코드 사인용 인증서 신청 및 적용 방법(예: Digicert)
13276	정성태	3/5/2023	18942	.NET Framework: 2102. C# 11 - ref struct/ref field를 위해 새롭게 도입된 scoped 예약어 [1]
13275	정성태	3/3/2023	19611	.NET Framework: 2101. C# 11의 ref 필드 설명
13274	정성태	3/2/2023	18994	.NET Framework: 2100. C# - ref 필드로 ref struct 타입을 허용하지 않는 이유
13273	정성태	2/28/2023	16170	.NET Framework: 2099. C# - 관리 포인터로서의 ref 예약어 의미
13272	정성태	2/27/2023	17050	오류 유형: 850. SSMS - mdf 파일을 Attach 시킬 때 Operating system error 5: "5(Access is denied.)" 에러
13271	정성태	2/25/2023	17008	오류 유형: 849. Sql Server Configuration Manager가 시작 메뉴에 없는 경우
13270	정성태	2/24/2023	16774	.NET Framework: 2098. dotnet build에 /p 옵션을 적용 시 유의점
13269	정성태	2/23/2023	17931	스크립트: 46. 파이썬 - uvicorn의 콘솔 출력을 UDP로 전송
13268	정성태	2/22/2023	17237	개발 환경 구성: 667. WSL 2 내부에서 열고 있는 UDP 서버를 호스트 측에서 접속하는 방법
13267	정성태	2/21/2023	19493	.NET Framework: 2097. C# - 비동기 소켓 사용 시 메모리 해제가 finalizer 단계에서 발생하는 사례	1
13266	정성태	2/20/2023	17109	오류 유형: 848. .NET Core/5+ - Process terminated. Couldn't find a valid ICU package installed on the system
13265	정성태	2/18/2023	18951	.NET Framework: 2096. .NET Core/5+ - PublishSingleFile 유형에 대한 runtimeconfig.json 설정
13264	정성태	2/17/2023	21799	스크립트: 45. 파이썬 - uvicorn 사용자 정의 Logger 작성
13263	정성태	2/16/2023	17250	개발 환경 구성: 666. 최신 버전의 ilasm.exe/ildasm.exe 사용하는 방법
13262	정성태	2/15/2023	20099	디버깅 기술: 191. dnSpy를 이용한 (소스 코드가 없는) 닷넷 응용 프로그램 디버깅 방법 [1]
13261	정성태	2/15/2023	19094	Windows: 224. Visual Studio - 영문 폰트가 Fullwidth Latin Character로 바뀌는 문제 [1]
13260	정성태	2/14/2023	18336	오류 유형: 847. ilasm.exe 컴파일 오류 - error : syntax error at token '-' in ... -inf
13259	정성태	2/14/2023	16464	.NET Framework: 2095. C# - .NET5부터 도입된 CollectionsMarshal
13258	정성태	2/13/2023	19361	오류 유형: 846. .NET Framework 4.8 Developer Pack 설치 실패 - 0x81f40001
13257	정성태	2/13/2023	18957	.NET Framework: 2094. C# - Job에 Process 포함하는 방법 [2]	1
13256	정성태	2/10/2023	17043	개발 환경 구성: 665. WSL 2의 네트워크 통신 방법 - 두 번째 이야기

AD BLOCK 해제 요청

C# - OpenCvSharp 사용 시 포인터를 이용한 속도 향상