Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (seongtaejeong at gmail.com)
홈페이지
첨부 파일

(시리즈 글이 11개 있습니다.)
.NET Framework: 388. 일반 닷넷 프로젝트에서 WinRT API를 호출하는 방법
; https://www.sysnet.pe.kr/2/0/1508

.NET Framework: 613. 윈도우 데스크톱 응용 프로그램(예: Console)에서 알림 메시지(Toast notifications) 띄우기
; https://www.sysnet.pe.kr/2/0/11073

.NET Framework: 623. C# - PeerFinder를 이용한 Wi-Fi Direct 데이터 통신 예제
; https://www.sysnet.pe.kr/2/0/11106

.NET Framework: 678. 데스크톱 윈도우 응용 프로그램에서 UWP 라이브러리를 이용한 비디오 장치 열람하는 방법
; https://www.sysnet.pe.kr/2/0/11284

.NET Framework: 715. C# - Windows 10 운영체제의 데스크톱 앱에서 TTS(SpeechSynthesizer) 사용하는 방법
; https://www.sysnet.pe.kr/2/0/11412

.NET Framework: 722. C# - Windows 10 운영체제의 데스크톱 앱에서 음성인식(SpeechRecognizer) 사용하는 방법
; https://www.sysnet.pe.kr/2/0/11420

.NET Framework: 804. WPF(또는 WinForm)에서 UWP UI 구성 요소 사용하는 방법
; https://www.sysnet.pe.kr/2/0/11799

.NET Framework: 852. WPF/WinForm에서 UWP의 기능을 이용해 Bluetooth 기기와 Pairing하는 방법
; https://www.sysnet.pe.kr/2/0/12001

.NET Framework: 991. .NET 5 응용 프로그램에서 WinRT API 호출
; https://www.sysnet.pe.kr/2/0/12470

닷넷: 2157. C# - WinRT 기능을 이용해 윈도우에서 실행 중인 Media App 제어
; https://www.sysnet.pe.kr/2/0/13438

닷넷: 2362. C# - Windows.Media.Ocr: 윈도우 운영체제에 포함된 OCR(Optical Character Recognition)
; https://www.sysnet.pe.kr/2/0/14012




C# - Windows.Media.Ocr: 윈도우 운영체제에 포함된 OCR(Optical Character Recognition)

이것도 역시 WinRT API로 제공하고 있기 때문에 프로젝트의 TargetFramework 설정을 먼저 변경해야만,

<Project Sdk="Microsoft.NET.Sdk">

    <PropertyGroup>
        <OutputType>Exe</OutputType>
        <TargetFramework>net8.0-windows10.0.17763.0</TargetFramework>
        <ImplicitUsings>enable</ImplicitUsings>
        <Nullable>enable</Nullable>
    </PropertyGroup>

</Project>

OCR 관련 API를 사용할 수 있습니다.

// Windows.Media.Ocr Namespace
// https://learn.microsoft.com/en-us/uwp/api/windows.media.ocr?view=winrt-22621

// Optical Character Recognition (OCR) for Windows 10
// https://blogs.windows.com/windowsdeveloper/2016/02/08/optical-character-recognition-ocr-for-windows-10/

using Windows.Media.Ocr;

namespace ConsoleApp1;

internal class Program
{
    static void Main(string[] args)
    {
        InitializeOcrLanguages();
    }

    private static void InitializeOcrLanguages()
    {
        try
        {
            var supportedLanguages = OcrEngine.AvailableRecognizerLanguages;
            foreach (var language in supportedLanguages)
            {
                Console.WriteLine($"{language.DisplayName} ({language.LanguageTag})");
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error initializing OCR languages: {ex.Message}");
        }
    }
}

/* 출력 결과:
English (United States) (en-US)
Korean (ko) (ko)
*/

제 컴퓨터에서는 2개의 OCR 언어가 지원된다고 나오는데요, 왜냐하면 Windows Settings에서 해당 구성 요소를 설치했기 때문입니다.

참고로, 자신의 시스템에 설치된 언어와 그것의 OCR 지원 여부를 다음의 PowerShell 명령어로도 확인할 수 있습니다.

// Query for OCR language packs
// ; https://learn.microsoft.com/en-us/windows/powertoys/text-extractor#query-for-ocr-language-packs

// 관리자 권한으로 PowerShell 실행

PS C:\Windows\System32> Get-WindowsCapability -Online | Where-Object { $_.Name -Like 'Language.OCR*' }
...[생략]...

Name  : Language.OCR~~~en-US~0.0.1.0
State : Installed

...[생략]...

Name  : Language.OCR~~~ko-KR~0.0.1.0
State : Installed

...[생략]...

그다음 원하는 언어로 OCR 엔진을 초기화한 후,

var languageTag = new Windows.Globalization.Language("ko");
var ocrEngine = OcrEngine.TryCreateFromLanguage(languageTag);

if (ocrEngine == null)
{
    Console.WriteLine($"OCR engine could not be created for language: {languageTag}");
    return;
}

Console.WriteLine();
Console.WriteLine($"OCR engine created for language: {ocrEngine.RecognizerLanguage.DisplayName}");

SoftwareBitmap 개체를 OCR 엔진에 전달하면 텍스트를 인식할 수 있습니다.

var softwareBitmap = await ImageFromPath("test_img.png");

var ocrResult = await ocrEngine.RecognizeAsync(softwareBitmap);

Console.WriteLine(ocrResult.Text); // 인식한 텍스트 출력

// https://stackoverflow.com/questions/56469760/convert-a-system-drawing-bitmap-to-windows-graphics-imaging-softwarebitmap
private static async Task<SoftwareBitmap> ImageFromPath(string path)
{
    using var bitmap = new System.Drawing.Bitmap(path);
    using (var stream 
        = new Windows.Storage.Streams.InMemoryRandomAccessStream())
    {
        bitmap.Save(stream.AsStream(), ImageFormat.Jpeg);
        Windows.Graphics.Imaging.BitmapDecoder decoder = await Windows.Graphics.Imaging.BitmapDecoder.CreateAsync(stream);
        return await decoder.GetSoftwareBitmapAsync();
    }
}

간단하죠? ^^ 하지만 윈도우 운영체제에 (무료) 포함된 기능인만큼 다소 실망스러운 부분이 있는데요, 인식률이 과히 좋은 편은 아닙니다. 그러니까... 예전 "음성인식(SpeechRecognizer)" 기능이 그랬던 것처럼,

C# - Windows 10 운영체제의 데스크톱 앱에서 음성인식(SpeechRecognizer) 사용하는 방법
; https://www.sysnet.pe.kr/2/0/11420

재미 삼아 사용해 볼 정도입니다. (혹시나 GrayScale, Canny 등의 전처리를 하면 조금 나아질지는 모르겠습니다. ^^)

(첨부 파일은 이 글의 예제 코드를 포함합니다.)




아래의 글을 보면,

Window Media OCR library For OCR
; https://codefrydev.in/Updates/application/ocr/window-media-ocr/

Windows의 PowerToys에 포함된 "Text Extractor" 유틸리티 소스 코드를 사용한 라이브러리도 공개하고 있는데요,

git clone https://github.com/codefrydev/OCR.git

하지만, 결국 그것도 Windows.Media.Ocr을 사용하고 있으므로 이 글의 내용과 크게 다르진 않습니다. (달리 말하면, Windows Media OCR의 인식률 테스트를 "Text Extractor"로도 할 수 있습니다.)




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 9/10/2025]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




... 121  [122]  123  124  125  126  127  128  129  130  131  132  133  134  135  ...
NoWriterDateCnt.TitleFile(s)
10964정성태5/12/201626853오류 유형: 331. ASP.NET에서 System.BadImageFormatException 예외가 발생하는 경우
10963정성태5/11/201628442VS.NET IDE: 107. Visual Studio 2015의 "DTAR_..." 특수 폴더가 생성되는 문제파일 다운로드2
10962정성태5/11/201627207오류 유형: 330. Visual Studio 단위 테스트 시 DisconnectedContext 예외 발생
10961정성태5/11/201627703.NET Framework: 583. 문제 재현 - Managed Debugging Assistant 'DisconnectedContext' has detected a problem in '...'파일 다운로드1
10960정성태5/10/201626419오류 유형: 329. ATL 메서드 추가 마법사 창에서 8ce0000b 오류 발생
10959정성태5/9/201627905.NET Framework: 582. CLR Profiler - 별도 정의한 .NET 코드를 호출하도록 IL 코드 변경파일 다운로드1
10958정성태5/6/201656232개발 환경 구성: 284. "Let's Encrypt"에서 제공하는 무료 SSL 인증서를 IIS에 적용하는 방법 (1) [3]
10957정성태5/3/201630036오류 유형: 328. 윈도우 백업 시 오류 - 0x80780166 두 번째 이야기 [1]
10956정성태5/3/201626946Windows: 117. BitLocker - This device can't use a Trusted Platform Module.
10955정성태5/3/201633958.NET Framework: 581. C# - 순열(Permutation) 예제 코드파일 다운로드2
10954정성태5/3/201634694.NET Framework: 580. C# - 조합(Combination) 예제 코드 [2]파일 다운로드1
10953정성태5/2/201622157.NET Framework: 579. Assembly.LoadFrom으로 로드된 어셈블리의 JIT 컴파일 코드 공유?파일 다운로드1
10952정성태5/2/201625928.NET Framework: 578. 도메인 중립적인 어셈블리가 비-도메인 중립적인 어셈블리를 참조하는 경우파일 다운로드1
10951정성태5/2/201623617.NET Framework: 577. CLR Profiler로 살펴보는 SharedDomain의 모듈 로드 동작파일 다운로드1
10950정성태5/2/201632169.NET Framework: 576. 기본적인 CLR Profiler 소스 코드 설명 [2]파일 다운로드2
10949정성태4/28/201622277.NET Framework: 575. SharedDomain과 JIT 컴파일파일 다운로드1
10948정성태4/28/201628003.NET Framework: 574. .NET - 눈으로 확인하는 SharedDomain의 동작 방식 [3]파일 다운로드1
10947정성태4/27/201626281.NET Framework: 573. .NET CLR4 보안 모델 - 4. CLR4 보안 모델에서의 조건부 APTCA 역할파일 다운로드1
10946정성태4/26/201628421VS.NET IDE: 106. Visual Studio 2015 확장 - INI 파일을 위한 사용자 정의 포맷 기능 (Syntax Highlighting)파일 다운로드1
10945정성태4/26/201620482오류 유형: 327. VSIX 프로젝트 빌드 시 The "VsTemplatePaths" task could not be loaded from the assembly 오류 발생
10944정성태4/22/201623381디버깅 기술: 80. windbg - 풀 덤프 파일로부터 텍스트 파일의 내용을 찾는 방법
10943정성태4/22/201628551디버깅 기술: 79. windbg - 풀 덤프 파일로부터 .NET DLL을 추출/저장하는 방법 [1]
10942정성태4/19/201623529디버깅 기술: 78. windbg 사례 - .NET 예외가 발생한 시점의 오류 분석 [1]
10941정성태4/19/201622625오류 유형: 326. Error MSB8020 - The build tools for v120_xp (Platform Toolset = 'v120_xp') cannot be found.
10940정성태4/18/201627315Windows: 116. 프로세스 풀 덤프 시간을 줄여 주는 Process Reflection [3]
10939정성태4/18/201627869.NET Framework: 572. .NET APM 비동기 호출의 Begin...과 End... 조합 [3]파일 다운로드1
... 121  [122]  123  124  125  126  127  128  129  130  131  132  133  134  135  ...