Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (seongtaejeong at gmail.com)
홈페이지
첨부 파일

(시리즈 글이 11개 있습니다.)
.NET Framework: 388. 일반 닷넷 프로젝트에서 WinRT API를 호출하는 방법
; https://www.sysnet.pe.kr/2/0/1508

.NET Framework: 613. 윈도우 데스크톱 응용 프로그램(예: Console)에서 알림 메시지(Toast notifications) 띄우기
; https://www.sysnet.pe.kr/2/0/11073

.NET Framework: 623. C# - PeerFinder를 이용한 Wi-Fi Direct 데이터 통신 예제
; https://www.sysnet.pe.kr/2/0/11106

.NET Framework: 678. 데스크톱 윈도우 응용 프로그램에서 UWP 라이브러리를 이용한 비디오 장치 열람하는 방법
; https://www.sysnet.pe.kr/2/0/11284

.NET Framework: 715. C# - Windows 10 운영체제의 데스크톱 앱에서 TTS(SpeechSynthesizer) 사용하는 방법
; https://www.sysnet.pe.kr/2/0/11412

.NET Framework: 722. C# - Windows 10 운영체제의 데스크톱 앱에서 음성인식(SpeechRecognizer) 사용하는 방법
; https://www.sysnet.pe.kr/2/0/11420

.NET Framework: 804. WPF(또는 WinForm)에서 UWP UI 구성 요소 사용하는 방법
; https://www.sysnet.pe.kr/2/0/11799

.NET Framework: 852. WPF/WinForm에서 UWP의 기능을 이용해 Bluetooth 기기와 Pairing하는 방법
; https://www.sysnet.pe.kr/2/0/12001

.NET Framework: 991. .NET 5 응용 프로그램에서 WinRT API 호출
; https://www.sysnet.pe.kr/2/0/12470

닷넷: 2157. C# - WinRT 기능을 이용해 윈도우에서 실행 중인 Media App 제어
; https://www.sysnet.pe.kr/2/0/13438

닷넷: 2362. C# - Windows.Media.Ocr: 윈도우 운영체제에 포함된 OCR(Optical Character Recognition)
; https://www.sysnet.pe.kr/2/0/14012




C# - Windows.Media.Ocr: 윈도우 운영체제에 포함된 OCR(Optical Character Recognition)

이것도 역시 WinRT API로 제공하고 있기 때문에 프로젝트의 TargetFramework 설정을 먼저 변경해야만,

<Project Sdk="Microsoft.NET.Sdk">

    <PropertyGroup>
        <OutputType>Exe</OutputType>
        <TargetFramework>net8.0-windows10.0.17763.0</TargetFramework>
        <ImplicitUsings>enable</ImplicitUsings>
        <Nullable>enable</Nullable>
    </PropertyGroup>

</Project>

OCR 관련 API를 사용할 수 있습니다.

// Windows.Media.Ocr Namespace
// https://learn.microsoft.com/en-us/uwp/api/windows.media.ocr?view=winrt-22621

// Optical Character Recognition (OCR) for Windows 10
// https://blogs.windows.com/windowsdeveloper/2016/02/08/optical-character-recognition-ocr-for-windows-10/

using Windows.Media.Ocr;

namespace ConsoleApp1;

internal class Program
{
    static void Main(string[] args)
    {
        InitializeOcrLanguages();
    }

    private static void InitializeOcrLanguages()
    {
        try
        {
            var supportedLanguages = OcrEngine.AvailableRecognizerLanguages;
            foreach (var language in supportedLanguages)
            {
                Console.WriteLine($"{language.DisplayName} ({language.LanguageTag})");
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error initializing OCR languages: {ex.Message}");
        }
    }
}

/* 출력 결과:
English (United States) (en-US)
Korean (ko) (ko)
*/

제 컴퓨터에서는 2개의 OCR 언어가 지원된다고 나오는데요, 왜냐하면 Windows Settings에서 해당 구성 요소를 설치했기 때문입니다.

참고로, 자신의 시스템에 설치된 언어와 그것의 OCR 지원 여부를 다음의 PowerShell 명령어로도 확인할 수 있습니다.

// Query for OCR language packs
// ; https://learn.microsoft.com/en-us/windows/powertoys/text-extractor#query-for-ocr-language-packs

// 관리자 권한으로 PowerShell 실행

PS C:\Windows\System32> Get-WindowsCapability -Online | Where-Object { $_.Name -Like 'Language.OCR*' }
...[생략]...

Name  : Language.OCR~~~en-US~0.0.1.0
State : Installed

...[생략]...

Name  : Language.OCR~~~ko-KR~0.0.1.0
State : Installed

...[생략]...

그다음 원하는 언어로 OCR 엔진을 초기화한 후,

var languageTag = new Windows.Globalization.Language("ko");
var ocrEngine = OcrEngine.TryCreateFromLanguage(languageTag);

if (ocrEngine == null)
{
    Console.WriteLine($"OCR engine could not be created for language: {languageTag}");
    return;
}

Console.WriteLine();
Console.WriteLine($"OCR engine created for language: {ocrEngine.RecognizerLanguage.DisplayName}");

SoftwareBitmap 개체를 OCR 엔진에 전달하면 텍스트를 인식할 수 있습니다.

var softwareBitmap = await ImageFromPath("test_img.png");

var ocrResult = await ocrEngine.RecognizeAsync(softwareBitmap);

Console.WriteLine(ocrResult.Text); // 인식한 텍스트 출력

// https://stackoverflow.com/questions/56469760/convert-a-system-drawing-bitmap-to-windows-graphics-imaging-softwarebitmap
private static async Task<SoftwareBitmap> ImageFromPath(string path)
{
    using var bitmap = new System.Drawing.Bitmap(path);
    using (var stream 
        = new Windows.Storage.Streams.InMemoryRandomAccessStream())
    {
        bitmap.Save(stream.AsStream(), ImageFormat.Jpeg);
        Windows.Graphics.Imaging.BitmapDecoder decoder = await Windows.Graphics.Imaging.BitmapDecoder.CreateAsync(stream);
        return await decoder.GetSoftwareBitmapAsync();
    }
}

간단하죠? ^^ 하지만 윈도우 운영체제에 (무료) 포함된 기능인만큼 다소 실망스러운 부분이 있는데요, 인식률이 과히 좋은 편은 아닙니다. 그러니까... 예전 "음성인식(SpeechRecognizer)" 기능이 그랬던 것처럼,

C# - Windows 10 운영체제의 데스크톱 앱에서 음성인식(SpeechRecognizer) 사용하는 방법
; https://www.sysnet.pe.kr/2/0/11420

재미 삼아 사용해 볼 정도입니다. (혹시나 GrayScale, Canny 등의 전처리를 하면 조금 나아질지는 모르겠습니다. ^^)

(첨부 파일은 이 글의 예제 코드를 포함합니다.)




아래의 글을 보면,

Window Media OCR library For OCR
; https://codefrydev.in/Updates/application/ocr/window-media-ocr/

Windows의 PowerToys에 포함된 "Text Extractor" 유틸리티 소스 코드를 사용한 라이브러리도 공개하고 있는데요,

git clone https://github.com/codefrydev/OCR.git

하지만, 결국 그것도 Windows.Media.Ocr을 사용하고 있으므로 이 글의 내용과 크게 다르진 않습니다. (달리 말하면, Windows Media OCR의 인식률 테스트를 "Text Extractor"로도 할 수 있습니다.)




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 9/10/2025]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




... 61  62  63  64  65  66  67  68  69  70  71  [72]  73  74  75  ...
NoWriterDateCnt.TitleFile(s)
12226정성태6/11/202025977개발 환경 구성: 493. OpenVPN의 네트워크 구성 [4]파일 다운로드1
12225정성태6/11/202023070개발 환경 구성: 492. 윈도우에 OpenVPN 설치 - 클라이언트 측 구성
12224정성태6/11/202032550개발 환경 구성: 491. 윈도우에 OpenVPN 설치 - 서버 측 구성 [1]
12223정성태6/9/202030407.NET Framework: 908. C# - Source Generator 소개 [10]파일 다운로드2
12222정성태6/3/202021271VS.NET IDE: 146. error information: "CryptQueryObject" (-2147024893/0x80070003)
12221정성태6/3/202020944Windows: 170. 비어 있지 않은 디렉터리로 symbolic link(junction) 연결하는 방법
12220정성태6/3/202025745.NET Framework: 907. C# DLL로부터 TLB 및 C/C++ 헤더 파일(TLH)을 생성하는 방법
12219정성태6/1/202024023.NET Framework: 906. C# - lock (this), lock (typeof(...))를 사용하면 안 되는 이유파일 다운로드1
12218정성태5/27/202022397.NET Framework: 905. C# - DirectX 게임 클라이언트 실행 중 키보드 입력을 감지하는 방법 [3]
12217정성태5/24/202021046오류 유형: 615. Transaction count after EXECUTE indicates a mismatching number of BEGIN and COMMIT statements. Previous count = 0, current count = 1.
12216정성태5/15/202024197.NET Framework: 904. USB/IP PROJECT를 이용해 C#으로 USB Keyboard 가상 장치 만들기 [14]파일 다운로드1
12215정성태5/12/202029980개발 환경 구성: 490. C# - (Wireshark의) USBPcap을 이용한 USB 패킷 모니터링 [10]파일 다운로드1
12214정성태5/5/202023033개발 환경 구성: 489. 정식 인증서가 있는 경우 Device Driver 서명하는 방법 (2) - UEFI/SecureBoot [1]
12213정성태5/3/202022826개발 환경 구성: 488. (User-mode 코드로 가상 USB 장치를 만들 수 있는) USB/IP PROJECT 소개
12212정성태5/1/202020092개발 환경 구성: 487. UEFI / Secure Boot 상태인지 확인하는 방법
12211정성태4/27/202022968개발 환경 구성: 486. WSL에서 Makefile로 공개된 리눅스 환경의 C/C++ 소스 코드 빌드
12210정성태4/20/202025130.NET Framework: 903. .NET Framework의 Strong-named 어셈블리 바인딩 (1) - app.config을 이용한 바인딩 리디렉션 [1]파일 다운로드1
12209정성태4/13/202020375오류 유형: 614. 리눅스 환경에서 C/C++ 프로그램이 Segmentation fault 에러가 발생한 경우 (2)
12208정성태4/12/202018475Linux: 29. 리눅스 환경에서 C/C++ 프로그램이 Segmentation fault 에러가 발생한 경우
12207정성태4/2/202019850스크립트: 19. Windows PowerShell의 NonInteractive 모드
12206정성태4/2/202021230오류 유형: 613. 파일 잠금이 바로 안 풀린다면? - The process cannot access the file '...' because it is being used by another process.
12205정성태4/2/202018292스크립트: 18. Powershell에서는 cmd.exe의 명령어를 지원하진 않습니다.
12204정성태4/1/202019267스크립트: 17. Powershell 명령어에 ';' (semi-colon) 문자가 포함된 경우
12203정성태3/18/202022351오류 유형: 612. warning: 'C:\ProgramData/Git/config' has a dubious owner: '...'.
12202정성태3/18/202025892개발 환경 구성: 486. .NET Framework 프로젝트를 위한 GitLab CI/CD Runner 구성
12201정성태3/18/202022365오류 유형: 611. git-credential-manager.exe: Using credentials for username "Personal Access Token". [1]
... 61  62  63  64  65  66  67  68  69  70  71  [72]  73  74  75  ...