Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (seongtaejeong at gmail.com)
홈페이지
첨부 파일

(시리즈 글이 11개 있습니다.)
.NET Framework: 388. 일반 닷넷 프로젝트에서 WinRT API를 호출하는 방법
; https://www.sysnet.pe.kr/2/0/1508

.NET Framework: 613. 윈도우 데스크톱 응용 프로그램(예: Console)에서 알림 메시지(Toast notifications) 띄우기
; https://www.sysnet.pe.kr/2/0/11073

.NET Framework: 623. C# - PeerFinder를 이용한 Wi-Fi Direct 데이터 통신 예제
; https://www.sysnet.pe.kr/2/0/11106

.NET Framework: 678. 데스크톱 윈도우 응용 프로그램에서 UWP 라이브러리를 이용한 비디오 장치 열람하는 방법
; https://www.sysnet.pe.kr/2/0/11284

.NET Framework: 715. C# - Windows 10 운영체제의 데스크톱 앱에서 TTS(SpeechSynthesizer) 사용하는 방법
; https://www.sysnet.pe.kr/2/0/11412

.NET Framework: 722. C# - Windows 10 운영체제의 데스크톱 앱에서 음성인식(SpeechRecognizer) 사용하는 방법
; https://www.sysnet.pe.kr/2/0/11420

.NET Framework: 804. WPF(또는 WinForm)에서 UWP UI 구성 요소 사용하는 방법
; https://www.sysnet.pe.kr/2/0/11799

.NET Framework: 852. WPF/WinForm에서 UWP의 기능을 이용해 Bluetooth 기기와 Pairing하는 방법
; https://www.sysnet.pe.kr/2/0/12001

.NET Framework: 991. .NET 5 응용 프로그램에서 WinRT API 호출
; https://www.sysnet.pe.kr/2/0/12470

닷넷: 2157. C# - WinRT 기능을 이용해 윈도우에서 실행 중인 Media App 제어
; https://www.sysnet.pe.kr/2/0/13438

닷넷: 2362. C# - Windows.Media.Ocr: 윈도우 운영체제에 포함된 OCR(Optical Character Recognition)
; https://www.sysnet.pe.kr/2/0/14012




C# - Windows.Media.Ocr: 윈도우 운영체제에 포함된 OCR(Optical Character Recognition)

이것도 역시 WinRT API로 제공하고 있기 때문에 프로젝트의 TargetFramework 설정을 먼저 변경해야만,

<Project Sdk="Microsoft.NET.Sdk">

    <PropertyGroup>
        <OutputType>Exe</OutputType>
        <TargetFramework>net8.0-windows10.0.17763.0</TargetFramework>
        <ImplicitUsings>enable</ImplicitUsings>
        <Nullable>enable</Nullable>
    </PropertyGroup>

</Project>

OCR 관련 API를 사용할 수 있습니다.

// Windows.Media.Ocr Namespace
// https://learn.microsoft.com/en-us/uwp/api/windows.media.ocr?view=winrt-22621

// Optical Character Recognition (OCR) for Windows 10
// https://blogs.windows.com/windowsdeveloper/2016/02/08/optical-character-recognition-ocr-for-windows-10/

using Windows.Media.Ocr;

namespace ConsoleApp1;

internal class Program
{
    static void Main(string[] args)
    {
        InitializeOcrLanguages();
    }

    private static void InitializeOcrLanguages()
    {
        try
        {
            var supportedLanguages = OcrEngine.AvailableRecognizerLanguages;
            foreach (var language in supportedLanguages)
            {
                Console.WriteLine($"{language.DisplayName} ({language.LanguageTag})");
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error initializing OCR languages: {ex.Message}");
        }
    }
}

/* 출력 결과:
English (United States) (en-US)
Korean (ko) (ko)
*/

제 컴퓨터에서는 2개의 OCR 언어가 지원된다고 나오는데요, 왜냐하면 Windows Settings에서 해당 구성 요소를 설치했기 때문입니다.

참고로, 자신의 시스템에 설치된 언어와 그것의 OCR 지원 여부를 다음의 PowerShell 명령어로도 확인할 수 있습니다.

// Query for OCR language packs
// ; https://learn.microsoft.com/en-us/windows/powertoys/text-extractor#query-for-ocr-language-packs

// 관리자 권한으로 PowerShell 실행

PS C:\Windows\System32> Get-WindowsCapability -Online | Where-Object { $_.Name -Like 'Language.OCR*' }
...[생략]...

Name  : Language.OCR~~~en-US~0.0.1.0
State : Installed

...[생략]...

Name  : Language.OCR~~~ko-KR~0.0.1.0
State : Installed

...[생략]...

그다음 원하는 언어로 OCR 엔진을 초기화한 후,

var languageTag = new Windows.Globalization.Language("ko");
var ocrEngine = OcrEngine.TryCreateFromLanguage(languageTag);

if (ocrEngine == null)
{
    Console.WriteLine($"OCR engine could not be created for language: {languageTag}");
    return;
}

Console.WriteLine();
Console.WriteLine($"OCR engine created for language: {ocrEngine.RecognizerLanguage.DisplayName}");

SoftwareBitmap 개체를 OCR 엔진에 전달하면 텍스트를 인식할 수 있습니다.

var softwareBitmap = await ImageFromPath("test_img.png");

var ocrResult = await ocrEngine.RecognizeAsync(softwareBitmap);

Console.WriteLine(ocrResult.Text); // 인식한 텍스트 출력

// https://stackoverflow.com/questions/56469760/convert-a-system-drawing-bitmap-to-windows-graphics-imaging-softwarebitmap
private static async Task<SoftwareBitmap> ImageFromPath(string path)
{
    using var bitmap = new System.Drawing.Bitmap(path);
    using (var stream 
        = new Windows.Storage.Streams.InMemoryRandomAccessStream())
    {
        bitmap.Save(stream.AsStream(), ImageFormat.Jpeg);
        Windows.Graphics.Imaging.BitmapDecoder decoder = await Windows.Graphics.Imaging.BitmapDecoder.CreateAsync(stream);
        return await decoder.GetSoftwareBitmapAsync();
    }
}

간단하죠? ^^ 하지만 윈도우 운영체제에 (무료) 포함된 기능인만큼 다소 실망스러운 부분이 있는데요, 인식률이 과히 좋은 편은 아닙니다. 그러니까... 예전 "음성인식(SpeechRecognizer)" 기능이 그랬던 것처럼,

C# - Windows 10 운영체제의 데스크톱 앱에서 음성인식(SpeechRecognizer) 사용하는 방법
; https://www.sysnet.pe.kr/2/0/11420

재미 삼아 사용해 볼 정도입니다. (혹시나 GrayScale, Canny 등의 전처리를 하면 조금 나아질지는 모르겠습니다. ^^)

(첨부 파일은 이 글의 예제 코드를 포함합니다.)




아래의 글을 보면,

Window Media OCR library For OCR
; https://codefrydev.in/Updates/application/ocr/window-media-ocr/

Windows의 PowerToys에 포함된 "Text Extractor" 유틸리티 소스 코드를 사용한 라이브러리도 공개하고 있는데요,

git clone https://github.com/codefrydev/OCR.git

하지만, 결국 그것도 Windows.Media.Ocr을 사용하고 있으므로 이 글의 내용과 크게 다르진 않습니다. (달리 말하면, Windows Media OCR의 인식률 테스트를 "Text Extractor"로도 할 수 있습니다.)




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 9/10/2025]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




... 61  62  63  64  65  66  67  68  [69]  70  71  72  73  74  75  ...
NoWriterDateCnt.TitleFile(s)
12304정성태8/31/202022058개발 환경 구성: 505. 윈도우 - (네트워크 어댑터의 우선순위로 인한) 열거되는 IP 주소 순서를 조정하는 방법
12303정성태8/30/202022388개발 환경 구성: 504. ETW - 닷넷 프레임워크 기반의 응용 프로그램을 위한 명령행 도구 etrace 소개
12302정성태8/30/202022534.NET Framework: 936. C# - ETW 관련 Win32 API 사용 예제 코드 (5) - Private Logger파일 다운로드1
12301정성태8/30/202020782오류 유형: 641. error MSB4044: The "Fody.WeavingTask" task was not given a value for the required parameter "IntermediateDir".
12300정성태8/29/202022590.NET Framework: 935. C# - ETW 관련 Win32 API 사용 예제 코드 (4) CLR ETW Consumer파일 다운로드1
12299정성태8/27/202022624.NET Framework: 934. C# - ETW 관련 Win32 API 사용 예제 코드 (3) ETW Consumer 구현파일 다운로드1
12298정성태8/27/202022571오류 유형: 640. livekd - Could not resolve symbols for ntoskrnl.exe: MmPfnDatabase
12297정성태8/25/202022333개발 환경 구성: 503. SHA256 테스트 인증서 생성 방법
12296정성태8/24/202023620.NET Framework: 933. C# - ETW 관련 Win32 API 사용 예제 코드 (2) NT Kernel Logger파일 다운로드1
12295정성태8/24/202022100오류 유형: 639. Bitvise - Address is already in use; bind() in ListeningSocket::StartListening() failed: Windows error 10013: An attempt was made to access a socket ,,,
12293정성태8/24/202023121Windows: 171. "Administered port exclusions" 설명
12292정성태8/20/202027028.NET Framework: 932. C# - ETW 관련 Win32 API 사용 예제 코드 (1)파일 다운로드2
12291정성태8/15/202022532오류 유형: 638. error 1297: Device driver does not install on any devices, use primitive driver if this is intended.
12290정성태8/11/202024518.NET Framework: 931. C# - IP 주소에 따른 국가별 위치 확인 [8]파일 다운로드1
12289정성태8/6/202021458개발 환경 구성: 502. Portainer에 윈도우 컨테이너를 등록하는 방법
12288정성태8/5/202017944오류 유형: 637. WCF - The protocol 'net.tcp' does not have an implementation of HostedTransportConfiguration type registered.
12287정성태8/5/202021446오류 유형: 636. C# - libdl.so를 DllImport로 연결 시 docker container 내에서 System.DllNotFoundException 예외 발생
12286정성태8/5/202023298개발 환경 구성: 501. .NET Core 용 container 이미지 만들 때 unzip이 필요한 경우
12285정성태8/4/202020939오류 유형: 635. 윈도우 10 업데이트 - 0xc1900209 [2]
12284정성태8/4/202020469디버깅 기술: 169. Hyper-V의 VM에 대한 메모리 덤프를 뜨는 방법
12283정성태8/3/202023121디버깅 기술: 168. windbg - 필터 드라이버 확인하는 확장 명령어(!fltkd) [2]
12282정성태8/2/202019562디버깅 기술: 167. windbg 디버깅 사례: AppDomain 간의 static 변수 사용으로 인한 crash (2)
12281정성태8/2/202024191개발 환경 구성: 500. (PDB 연결이 없는) DLL의 소스 코드 디버깅을 dotPeek 도구로 해결하는 방법
12280정성태8/2/202020744오류 유형: 634. 오라클 (평생) 무료 클라우드 VM 생성 후 SSH 접속 시 키 오류 발생 [2]
12279정성태7/29/202024181개발 환경 구성: 499. 닷넷에서 접근해보는 InterSystems의 Cache 데이터베이스파일 다운로드1
12278정성태7/23/202019674VS.NET IDE: 149. ("Binary was not built with debug information" 상태로) 소스 코드 디버깅이 안되는 경우
... 61  62  63  64  65  66  67  68  [69]  70  71  72  73  74  75  ...