Microsoft MVP성태의 닷넷 이야기
.NET Framework: 350. String 데이터를 Stream으로 변환하는 방법 [링크 복사], [링크+제목 복사],
조회: 25132
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 
(연관된 글이 1개 있습니다.)

String 데이터를 Stream으로 변환하는 방법

사실 이게 하나의 글로 씌여지기에는 좀 단순한 문제이긴 합니다. ^^

검색만 해보면 다음과 같은 식으로 2가지 방법이 나오는데요.

// 방법 1: Encoding 타입 사용
string test = "ab";

byte[] byteArray = Encoding.UTF8.GetBytes(test);
MemoryStream stream1 = new MemoryStream(byteArray);

// 방법 2: StreamWriter 사용
MemoryStream stream2 = new MemoryStream();
StreamWriter sw = new StreamWriter(stream2, Encoding.UTF8);
sw.Write(test);
sw.Flush();
stream2.Position = 0;

그런데, 전자와 후자는 결과가 틀립니다. 실제로 한번 출력을 해볼까요? ^^

foreach (byte aByte in stream1.ToArray())
{
    Console.Write(aByte.ToString("x") + ", ");
}

Console.WriteLine();

foreach (byte aByte in stream2.ToArray())
{
    Console.Write(aByte.ToString("x") + ", ");
}

// 출력 결과
61, 62,
ef, bb, bf, 61, 62,

보시는 것처럼 StreamWriter는 3바이트가 더 출력됩니다. 이게 뭔지 혹시 감이 오세요? ^^ 그렇습니다. StreamWriter는 BOM(Byte Order Mark)을 함께 출력합니다.

보통 이것이 문제가 되지 않을 수 있지만, BOM 인식을 간과하는 특정 클래스가 있다면 상황이 달라집니다. 바로 DataContractJsonSerializer가 그 예입니다. 예를 들어, 아래와 같이 stream을 건네주면,

public class Test
{
    public string id { get; set; }
}

string test = "{ \"id\": \"ab\" }";

MemoryStream stream2 = ...[BOM을 쓰는 방식]...;

DataContractJsonSerializer dcjs = new DataContractJsonSerializer(typeof(Test));
Test user2 = dcjs.ReadObject(stream2) as Test;

BOM 데이터를 해석하려고 시도하는 바람에 "System.Runtime.Serialization.SerializationException" 예외가 발생합니다.

System.Runtime.Serialization.SerializationException was unhandled
  HResult=-2146233076
  Message=There was an error deserializing the object of type ConsoleApplication1.Test. Encountered unexpected character 'i'.
  Source=System.Runtime.Serialization
  StackTrace:
       at System.Runtime.Serialization.XmlObjectSerializer.ReadObjectHandleExceptions(XmlReaderDelegator reader, Boolean verifyObjectName, DataContractResolver dataContractResolver)
       at System.Runtime.Serialization.Json.DataContractJsonSerializer.ReadObject(XmlDictionaryReader reader)
       at System.Runtime.Serialization.Json.DataContractJsonSerializer.ReadObject(Stream stream)
       at ConsoleApplication1.Program.Main(String[] args) in d:\...\Program.cs:line 45
       at System.AppDomain._nExecuteAssembly(RuntimeAssembly assembly, String[] args)
       at System.AppDomain.ExecuteAssembly(String assemblyFile, Evidence assemblySecurity, String[] args)
		...[생략]...
  InnerException: System.Xml.XmlException
       HResult=-2146232000
       Message=Encountered unexpected character 'i'.
       Source=System.Runtime.Serialization
       LineNumber=0
       LinePosition=0
       StackTrace:
            at System.Xml.XmlExceptionHelper.ThrowXmlException(XmlDictionaryReader reader, XmlException exception)
            at System.Runtime.Serialization.Json.XmlJsonReader.ReadAttributes()
            ...[생략]...
            at System.Runtime.Serialization.XmlObjectSerializer.InternalReadObject(XmlReaderDelegator reader, Boolean verifyObjectName, DataContractResolver dataContractResolver)
            at System.Runtime.Serialization.XmlObjectSerializer.ReadObjectHandleExceptions(XmlReaderDelegator reader, Boolean verifyObjectName, DataContractResolver dataContractResolver)
       InnerException: 

물론, "Encoding.UTF8.GetBytes"를 이용하여 BOM을 제거한 stream을 넘겨주면 오류가 발생하지 않습니다.




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 10/28/2024]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2014-06-11 03시56분
[김영준] 인코딩 설정시 BOM을 설정을 지정할 수도 있습니다. ^^

bool isBOM = false;
StreamWriter sw = new StreamWriter(stream2, new UTF8Encoding(isBOM) );
[guest]
2014-06-11 11시52분
@김영준 좋은 의견 감사드립니다. ^^
정성태

... [46]  47  48  49  50  51  52  53  54  55  56  57  58  59  60  ...
NoWriterDateCnt.TitleFile(s)
12821정성태9/1/202115418.NET Framework: 1112. C# - .NET 6부터 공개된 ISpanFormattable 사용법
12820정성태9/1/202117115VC++: 147. Golang - try/catch에 대응하는 panic/recover [1]파일 다운로드1
12819정성태8/31/202117642.NET Framework: 1111. C# - FormattableString 타입
12818정성태8/31/202114658Windows: 198. 윈도우 - 작업 관리자에서 (tensorflow 등으로 인한) GPU 연산 부하 보는 방법
12817정성태8/31/202118531스크립트: 25. 파이썬 - 윈도우 환경에서 directml을 이용한 tensorflow의 AMD GPU 사용 방법
12816정성태8/30/202125104스크립트: 24. 파이썬 - tensorflow 2.6 NVidia GPU 사용 방법 [2]
12815정성태8/30/202116860개발 환경 구성: 602. WSL 2 - docker-desktop-data, docker-desktop (%LOCALAPPDATA%\Docker\wsl\data\ext4.vhdx) 파일을 다른 디렉터리로 옮기는 방법
12814정성태8/30/202121811.NET Framework: 1110. C# 11 - 인터페이스 내에 정적 추상 메서드 정의 가능 (DIM for Static Members) [2]파일 다운로드1
12813정성태8/29/202118697.NET Framework: 1109. C# 10 - (11) Lambda 개선파일 다운로드1
12812정성태8/28/202117988.NET Framework: 1108. C# 10 - (10) 개선된 #line 지시자
12811정성태8/27/202117909Linux: 44. 윈도우 개발자를 위한 리눅스 fork 동작 방식 설명 (파이썬 코드)
12810정성태8/27/202117070.NET Framework: 1107. .NET Core/5+에서 동적 컴파일한 C# 코드를 (Breakpoint도 활용하며) 디버깅하는 방법 - #line 지시자파일 다운로드1
12809정성태8/26/202116510.NET Framework: 1106. .NET Core/5+에서 C# 코드를 동적으로 컴파일/사용하는 방법 [1]파일 다운로드1
12808정성태8/25/202118718오류 유형: 758. go: ...: missing go.sum entry; to add it: go mod download ...
12807정성태8/25/202119523.NET Framework: 1105. C# 10 - (9) 비동기 메서드가 사용할 AsyncMethodBuilder 선택 가능파일 다운로드1
12806정성태8/24/202115774개발 환경 구성: 601. PyCharm - 다중 프로세스 디버깅 방법
12805정성태8/24/202117313.NET Framework: 1104. C# 10 - (8) 분해 구문에서 기존 변수의 재사용 가능파일 다운로드1
12804정성태8/24/202117262.NET Framework: 1103. C# 10 - (7) Source Generator V2 APIs
12803정성태8/23/202117846개발 환경 구성: 600. pip cache 디렉터리 옮기는 방법
12802정성태8/23/202118615.NET Framework: 1102. .NET Conf Mini 21.08 - WinUI 3 따라해 보기 [1]
12801정성태8/23/202118191.NET Framework: 1101. C# 10 - (6) record class 타입의 ToString 메서드를 sealed 처리 허용파일 다운로드1
12800정성태8/22/202118556개발 환경 구성: 599. PyCharm - (반대로) 원격 프로세스가 PyCharm에 디버그 연결하는 방법
12799정성태8/22/202119069.NET Framework: 1100. C# 10 - (5) 속성 패턴의 개선파일 다운로드1
12798정성태8/21/202119679개발 환경 구성: 598. PyCharm - 원격 프로세스를 디버그하는 방법
12797정성태8/21/202117749Windows: 197. TCP의 MSS(Maximum Segment Size) 크기는 고정된 것일까요?
12796정성태8/21/202118739.NET Framework: 1099. C# 10 - (4) 상수 문자열에 포맷 식 사용 가능파일 다운로드1
... [46]  47  48  49  50  51  52  53  54  55  56  57  58  59  60  ...