Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (seongtaejeong at gmail.com)
홈페이지
첨부 파일

C# - Windows.Media.Ocr: 윈도우 운영체제에 포함된 OCR(Optical Character Recognition)

이것도 역시 WinRT API로 제공하고 있기 때문에 프로젝트의 TargetFramework 설정을 먼저 변경해야만,

<Project Sdk="Microsoft.NET.Sdk">

    <PropertyGroup>
        <OutputType>Exe</OutputType>
        <TargetFramework>net8.0-windows10.0.17763.0</TargetFramework>
        <ImplicitUsings>enable</ImplicitUsings>
        <Nullable>enable</Nullable>
    </PropertyGroup>

</Project>

OCR 관련 API를 사용할 수 있습니다.

// Windows.Media.Ocr Namespace
// https://learn.microsoft.com/en-us/uwp/api/windows.media.ocr?view=winrt-22621

// Optical Character Recognition (OCR) for Windows 10
// https://blogs.windows.com/windowsdeveloper/2016/02/08/optical-character-recognition-ocr-for-windows-10/

using Windows.Media.Ocr;

namespace ConsoleApp1;

internal class Program
{
    static void Main(string[] args)
    {
        InitializeOcrLanguages();
    }

    private static void InitializeOcrLanguages()
    {
        try
        {
            var supportedLanguages = OcrEngine.AvailableRecognizerLanguages;
            foreach (var language in supportedLanguages)
            {
                Console.WriteLine($"{language.DisplayName} ({language.LanguageTag})");
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error initializing OCR languages: {ex.Message}");
        }
    }
}

/* 출력 결과:
English (United States) (en-US)
Korean (ko) (ko)
*/

제 컴퓨터에서는 2개의 OCR 언어가 지원된다고 나오는데요, 왜냐하면 Windows Settings에서 해당 구성 요소를 설치했기 때문입니다.

참고로, 자신의 시스템에 설치된 언어와 그것의 OCR 지원 여부를 다음의 PowerShell 명령어로도 확인할 수 있습니다.

// Query for OCR language packs
// ; https://learn.microsoft.com/en-us/windows/powertoys/text-extractor#query-for-ocr-language-packs

// 관리자 권한으로 PowerShell 실행

PS C:\Windows\System32> Get-WindowsCapability -Online | Where-Object { $_.Name -Like 'Language.OCR*' }
...[생략]...

Name  : Language.OCR~~~en-US~0.0.1.0
State : Installed

...[생략]...

Name  : Language.OCR~~~ko-KR~0.0.1.0
State : Installed

...[생략]...

그다음 원하는 언어로 OCR 엔진을 초기화한 후,

var languageTag = new Windows.Globalization.Language("ko");
var ocrEngine = OcrEngine.TryCreateFromLanguage(languageTag);

if (ocrEngine == null)
{
    Console.WriteLine($"OCR engine could not be created for language: {languageTag}");
    return;
}

Console.WriteLine();
Console.WriteLine($"OCR engine created for language: {ocrEngine.RecognizerLanguage.DisplayName}");

SoftwareBitmap 개체를 OCR 엔진에 전달하면 텍스트를 인식할 수 있습니다.

var softwareBitmap = await ImageFromPath("test_img.png");

var ocrResult = await ocrEngine.RecognizeAsync(softwareBitmap);

Console.WriteLine(ocrResult.Text); // 인식한 텍스트 출력

// https://stackoverflow.com/questions/56469760/convert-a-system-drawing-bitmap-to-windows-graphics-imaging-softwarebitmap
private static async Task<SoftwareBitmap> ImageFromPath(string path)
{
    using var bitmap = new System.Drawing.Bitmap(path);
    using (var stream 
        = new Windows.Storage.Streams.InMemoryRandomAccessStream())
    {
        bitmap.Save(stream.AsStream(), ImageFormat.Jpeg);
        Windows.Graphics.Imaging.BitmapDecoder decoder = await Windows.Graphics.Imaging.BitmapDecoder.CreateAsync(stream);
        return await decoder.GetSoftwareBitmapAsync();
    }
}

간단하죠? ^^ 하지만 윈도우 운영체제에 (무료) 포함된 기능인만큼 다소 실망스러운 부분이 있는데요, 인식률이 과히 좋은 편은 아닙니다. 그러니까... 예전 "음성인식(SpeechRecognizer)" 기능이 그랬던 것처럼,

C# - Windows 10 운영체제의 데스크톱 앱에서 음성인식(SpeechRecognizer) 사용하는 방법
; https://www.sysnet.pe.kr/2/0/11420

재미 삼아 사용해 볼 정도입니다. (혹시나 GrayScale, Canny 등의 전처리를 하면 조금 나아질지는 모르겠습니다. ^^)

(첨부 파일은 이 글의 예제 코드를 포함합니다.)




아래의 글을 보면,

Window Media OCR library For OCR
; https://codefrydev.in/Updates/application/ocr/window-media-ocr/

Windows의 PowerToys에 포함된 "Text Extractor" 유틸리티 소스 코드를 사용한 라이브러리도 공개하고 있는데요,

git clone https://github.com/codefrydev/OCR.git

하지만, 결국 그것도 Windows.Media.Ocr을 사용하고 있으므로 이 글의 내용과 크게 다르진 않습니다. (달리 말하면, Windows Media OCR의 인식률 테스트를 "Text Extractor"로도 할 수 있습니다.)




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 9/10/2025]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




[1]  2  3  4  5  6  7  8  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
14012정성태9/9/202524닷넷: 2362. C# - Windows.Media.Ocr: 윈도우 운영체제에 포함된 OCR(Optical Character Recognition)파일 다운로드1
14011정성태9/7/2025583닷넷: 2361. C# - Linux 환경의 readlink 호출
14010정성태9/1/20251116오류 유형: 983. apt update 시 "The repository 'http://deb.debian.org/debian buster Release' does not have a Release file." 오류
14009정성태8/28/20251177닷넷: 2360. C# 14 - (11) Expression Tree에 선택적 인수와 명명된 인수 허용파일 다운로드1
14008정성태8/26/20251481닷넷: 2359. C# 14 - (10) 복합 대입 연산자의 오버로드 지원파일 다운로드1
14007정성태8/25/20251907닷넷: 2358. C# - 현재 빌드에 적용 중인 컴파일러 버전 확인 방법 (#error version)
14006정성태8/23/20252243Linux: 121. Linux - snap 패키지 관리자로 설치한 소프트웨어의 디렉터리 접근 제한
14005정성태8/21/20251772오류 유형: 982. sudo: unable to load /usr/libexec/sudo/sudoers.so: libssl.so.3: cannot open shared object file: No such file or directory
14004정성태8/21/20251936오류 유형: 981. dotnet 실행 시 No usable version of the libssl was found
14003정성태8/21/20252091닷넷: 2357. C# 14 - (9) 새로운 지시자 추가 (Ignored directives)
14002정성태8/20/20252248오류 유형: 980. C# - appsettings.json 파일의 설정값이 적용 안 된다면?
14001정성태8/19/20253180닷넷: 2356. .NET SDK 10 - 단일 소스 코드 파일을 빌드/실행하는 기능을 "dotnet" 명령어에 추가 [1]
14000정성태8/18/20252354오류 유형: 979. ERROR: failed to solve: failed to read dockerfile: open Dockerfile: no such file or directory
13999정성태8/15/20252349닷넷: 2355. C# 14 - (8) null 조건부 연산자 개선 - 대입문에도 사용 가능파일 다운로드1
13998정성태8/14/20252298닷넷: 2354. C# 14 - (7) 확장 메서드에 정적 메서드와 속성 지원을 위한 전용 구문 추가파일 다운로드1
13997정성태8/14/20252376Linux: 120. docker 컨테이너로 매핑된 볼륨에 컨테이너 측의 사용자 ID를 유지하면서 복사하는 방법
13996정성태8/13/20251878오류 유형: 978. Unable to find the requested .Net Framework Data Provider.
13995정성태8/13/20252025개발 환경 구성: 754. Visual C++ - 리눅스 빌드를 위한 Ubuntu 18 docker 컨테이너 설정
13994정성태8/12/20251847오류 유형: 977. SQL Server - User, group, or role '...' already exists in the current database. (Microsoft SQL Server, Error: 15023)
13993정성태8/11/20252627오류 유형: 976. Microsoft.ML.OnnxRuntimeGenAI 패키지 사용 시 "cublasLt64_12.dll" which is missing. (Error 126: "The specified module could not be found.") 오류
13992정성태8/11/20252690닷넷: 2353. C# - Foundry Local을 이용한 gpt-oss-20b 모델 사용파일 다운로드1
13991정성태8/9/20252410오류 유형: 975. winget - Foundry Local 패키지 업데이트가 안 되는 문제
13990정성태8/8/20251922Windows: 283. Time zone 설정이 없는 Windows Server 2025
13989정성태8/8/20252540닷넷: 2352. C# - Windows S-mode 환경인지 체크하는 방법파일 다운로드1
13988정성태8/8/20252595오류 유형: 974. 비주얼 스튜디오 업데이트 시 잠김 파일 경고 - Visual Studio Standard Collector Service 150 (VSStandardCollectorService150)
[1]  2  3  4  5  6  7  8  9  10  11  12  13  14  15  ...