Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (seongtaejeong at gmail.com)
홈페이지
첨부 파일
 

(시리즈 글이 12개 있습니다.)
.NET Framework: 326. 유니코드와 한글 - 유니코드와 닷넷을 이용한 한글 처리
; https://www.sysnet.pe.kr/2/0/1294

.NET Framework: 411. 유니코드의 "compatibility character"가 뭘까요?
; https://www.sysnet.pe.kr/2/0/1607

.NET Framework: 429. C# - 유니코드 한글 문자열을 ks_c_5601-1987로 변환하는 방법
; https://www.sysnet.pe.kr/2/0/1657

개발 환경 구성: 230. 유니코드의 Surrogate Pair, Supplementary Characters가 뭘까요?
; https://www.sysnet.pe.kr/2/0/1710

.NET Framework: 450. 영문 윈도우에서 C# 콘솔 프로그램의 유니코드 출력 방법
; https://www.sysnet.pe.kr/2/0/1712

.NET Framework: 794. C# - 같은 모양, 다른 값의 한글 자음을 비교하는 호환 분해
; https://www.sysnet.pe.kr/2/0/11710

개발 환경 구성: 407. 유니코드와 한글 - "Hangul Compatibility Jamo"
; https://www.sysnet.pe.kr/2/0/11724

Windows: 176. Raymond Chen이 한글날에 밝히는 윈도우의 한글 자모 분리 현상
; https://www.sysnet.pe.kr/2/0/12369

닷넷: 2307. C# - 윈도우에서 한글(및 유니코드)을 포함한 콘솔 프로그램을 컴파일 및 실행하는 방법
; https://www.sysnet.pe.kr/2/0/13794

개발 환경 구성: 731. 유니코드 - 출력 예시 및 폰트 찾기
; https://www.sysnet.pe.kr/2/0/13798

개발 환경 구성: 732. 모바일 웹 브라우저에서 유니코드 문자가 표시되지 않는 경우
; https://www.sysnet.pe.kr/2/0/13799

닷넷: 2310. .NET의 Rune 타입과 emoji 표현
; https://www.sysnet.pe.kr/2/0/13813




C# - 윈도우에서 한글(및 유니코드)을 포함한 콘솔 프로그램을 컴파일 및 실행하는 방법

(이 글에 포함된 일부 유니코드 문자는 모바일 웹 브라우저에서는 정상적으로 안 보일 수 있습니다.)




지난 글에 대해,

C++ - 윈도우에서 한글(및 유니코드)을 포함한 콘솔 프로그램을 컴파일 및 실행하는 방법
; https://www.sysnet.pe.kr/2/0/13793

C# 버전으로 설명해 보겠습니다. ^^

우선, C#은 "소스코드 파일의 인코딩"만 해결이 된다면 "바이너리 모듈 상태의 인코딩"도 자연스럽게 해결이 됩니다. 게다가 현실적으로, 비주얼 스튜디오는 C# 파일을 UTF-8로 인코딩해 저장하기 때문에 일반적인 경우라면 이에 관해 신경 쓸 필요가 없습니다.

문제는 실행 환경인데요, 예를 들어 다음과 같은 코드를 작성하고,

internal class Program
{
    private static void Main(string[] args)
    {
        string text = "한글\ud803\udc80";
        Console.WriteLine(text);
    }
}

코드 페이지가 437, 949, 65001 각각으로 설정된 콘솔에서 실행하면 다음과 같은 결과를 얻을 수 있습니다.

[코드 페이지: 437]
????

[코드 페이지: 949]
한글??

[코드 페이지: 65001]
한글𐲀

이것은 마치 WideCharToMultiByte 함수를 사용해 변환한 것처럼 보입니다. 일단 C# 모듈은 UTF-16으로 컴파일돼 있고 내부적으로 W 버전의 API를 사용해 출력할 텐데요, 따라서 CP437에는 대응 문자가 없기 때문에 fallback 문자로 '?'를 글자당 출력한 것입니다.

반면 CP949의 경우, 마찬가지로 WideCharToMultiByte가 호출된 것과 같은데요, 단지 CP949에는 한글 문자는 있기 때문에 그것까지는 출력이 되었지만, 이후 '𐲀' 문자 변환은 실패해 역시 '?'로 대체된 것입니다.

마지막으로, 65001 환경에서는 모두 잘 출력이 되었는데, C++에서 wchar_t로 _O_U8TEXT 모드로 출력했을 때와 같은 결과입니다.




그렇다면, 모든 환경에서 잘 나오게 하려면 어떻게 해야 할까요?

이에 대해서는 예전에도 한번 설명했는데요, 바로 OutputEncoding을 지정하면 됩니다.

Console.OutputEncoding = System.Text.Encoding.Unicode;
string text = "한글\ud803\udc80";
Console.WriteLine(text);

그럼 각각의 모든 코드 페이지에서 동일하게 출력됩니다.

[코드 페이지: 437, 949, 65001 모두 동일]
한글𐲀

재미있는 건, Encoding을 UTF-8로 지정해도 잘 된다는 점입니다.

Console.OutputEncoding = System.Text.Encoding.UTF8;
string text = "한글\ud803\udc80";
Console.WriteLine(text);

이것 역시, C++에서 W 버전을 사용할 때 표준 출력을 _O_U16TEXT 및 _O_U8TEXT로 설정해도 모두 잘 나왔다는 것과 같은 결과입니다.




참고로, 리눅스 환경에서의 C# 콘솔 출력은 어떻게 될까요? ^^

(아마도 대부분) 리눅스는 UTF-8을 기본으로 하고 있을 텐데 Console.OutputEncoding을 System.Text.Encoding.Unicode로 설정한 경우에는 출력이 깨져 나옵니다. 반면 System.Text.Encoding.UTF8로 설정하거나, 아예 변경을 하지 않으면 정상적으로 출력이 됩니다.

따라서, 윈도우/리눅스 환경을 모두 고려한다면 기왕이면 System.Text.Encoding.UTF8로 설정하는 것이 가장 좋을 듯합니다. ^^




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 11/2/2024]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




... [31]  32  33  34  35  36  37  38  39  40  41  42  43  44  45  ...
NoWriterDateCnt.TitleFile(s)
13162정성태11/15/202215721.NET Framework: 2069. .NET 7 - AOT(ahead-of-time) 컴파일 [1]
13161정성태11/14/202214373.NET Framework: 2068. C# - PublishSingleFile로 배포한 이미지의 역어셈블 가능 여부 (난독화 필요성) [4]
13160정성태11/11/202214332.NET Framework: 2067. C# - PublishSingleFile 적용 시 native/managed 모듈 통합 옵션
13159정성태11/10/202217652.NET Framework: 2066. C# - PublishSingleFile과 관련된 옵션 [3]
13158정성태11/9/202213351오류 유형: 826. Workload definition 'wasm-tools' in manifest 'microsoft.net.workload.mono.toolchain' [...] conflicts with manifest 'microsoft.net.workload.mono.toolchain.net7'
13157정성태11/8/202214380.NET Framework: 2065. C# - Mutex의 비동기 버전파일 다운로드1
13156정성태11/7/202215973.NET Framework: 2064. C# - Mutex와 Semaphore/SemaphoreSlim 차이점파일 다운로드1
13155정성태11/4/202214222디버깅 기술: 183. TCP 동시 접속 (연결이 아닌) 시도를 1개로 제한한 서버
13154정성태11/3/202214696.NET Framework: 2063. .NET 5+부터 지원되는 GC.GetGCMemoryInfo파일 다운로드1
13153정성태11/2/202216017.NET Framework: 2062. C# - 코드로 재현하는 소켓 상태(SYN_SENT, SYN_RECV)
13152정성태11/1/202214916.NET Framework: 2061. ASP.NET Core - DI로 추가한 클래스의 초기화 방법 [1]
13151정성태10/31/202214371C/C++: 161. Windows 11 환경에서 raw socket 테스트하는 방법파일 다운로드1
13150정성태10/30/202213264C/C++: 160. Visual Studio 2022로 빌드한 C++ 프로그램을 위한 다른 PC에서 실행하는 방법
13149정성태10/27/202213840오류 유형: 825. C# - CLR ETW 이벤트 수신이 GCHeapStats_V1/V2에 대해 안 되는 문제파일 다운로드1
13148정성태10/26/202213761오류 유형: 824. msbuild 에러 - error NETSDK1005: Assets file '...\project.assets.json' doesn't have a target for 'net5.0'. Ensure that restore has run and that you have included 'net5.0' in the TargetFramew
13147정성태10/25/202213043오류 유형: 823. Visual Studio 2022 - Unable to attach to CoreCLR. The debugger's protocol is incompatible with the debuggee.
13146정성태10/24/202214342.NET Framework: 2060. C# - Java의 Xmx와 유사한 힙 메모리 최댓값 제어 옵션 HeapHardLimit
13145정성태10/21/202214986오류 유형: 822. db2 - Password validation for user db2inst1 failed with rc = -2146500508
13144정성태10/20/202214673.NET Framework: 2059. ClrMD를 이용해 윈도우 환경의 메모리 덤프로부터 닷넷 모듈을 추출하는 방법파일 다운로드1
13143정성태10/19/202215609오류 유형: 821. windbg/sos - Error code - 0x000021BE
13142정성태10/18/202220409도서: 시작하세요! C# 12 프로그래밍
13141정성태10/17/202216139.NET Framework: 2058. [in,out] 배열을 C#에서 C/C++로 넘기는 방법 - 세 번째 이야기파일 다운로드1
13140정성태10/11/202215537C/C++: 159. C/C++ - 리눅스 환경에서 u16string 문자열을 출력하는 방법 [2]
13139정성태10/9/202213634.NET Framework: 2057. 리눅스 환경의 .NET Core 3/5+ 메모리 덤프로부터 모든 닷넷 모듈을 추출하는 방법파일 다운로드1
13138정성태10/8/202216227.NET Framework: 2056. C# - await 비동기 호출을 기대한 메서드가 동기로 호출되었을 때의 부작용 [1]
13137정성태10/8/202214146.NET Framework: 2055. 리눅스 환경의 .NET Core 3/5+ 메모리 덤프로부터 닷넷 모듈을 추출하는 방법
... [31]  32  33  34  35  36  37  38  39  40  41  42  43  44  45  ...