(연관된 글이 1개 있습니다.)

String 데이터를 Stream으로 변환하는 방법

사실 이게 하나의 글로 씌여지기에는 좀 단순한 문제이긴 합니다. ^^

검색만 해보면 다음과 같은 식으로 2가지 방법이 나오는데요.

// 방법 1: Encoding 타입 사용
string test = "ab";

byte[] byteArray = Encoding.UTF8.GetBytes(test);
MemoryStream stream1 = new MemoryStream(byteArray);

// 방법 2: StreamWriter 사용
MemoryStream stream2 = new MemoryStream();
StreamWriter sw = new StreamWriter(stream2, Encoding.UTF8);
stream2.Position = 0;

그런데, 전자와 후자는 결과가 틀립니다. 실제로 한번 출력을 해볼까요? ^^

foreach (byte aByte in stream1.ToArray())
    Console.Write(aByte.ToString("x") + ", ");


foreach (byte aByte in stream2.ToArray())
    Console.Write(aByte.ToString("x") + ", ");

// 출력 결과
61, 62,
ef, bb, bf, 61, 62,

보시는 것처럼 StreamWriter는 3바이트가 더 출력됩니다. 이게 뭔지 혹시 감이 오세요? ^^ 그렇습니다. StreamWriter는 BOM(Byte Order Mark)을 함께 출력합니다.

보통 이것이 문제가 되지 않을 수 있지만, BOM 인식을 간과하는 특정 클래스가 있다면 상황이 달라집니다. 바로 DataContractJsonSerializer가 그 예입니다. 예를 들어, 아래와 같이 stream을 건네주면,

public class Test
    public string id { get; set; }

string test = "{ \"id\": \"ab\" }";

MemoryStream stream2 = ...[BOM 을 쓰는 방식]...;

DataContractJsonSerializer dcjs = new DataContractJsonSerializer(typeof(Test));
Test user2 = dcjs.ReadObject(stream2) as Test;

BOM 데이터를 해석하려고 시도하는 바람에 "System.Runtime.Serialization.SerializationException" 예외가 발생합니다.

System.Runtime.Serialization.SerializationException was unhandled
  Message=There was an error deserializing the object of type ConsoleApplication1.Test. Encountered unexpected character 'i'.
       at System.Runtime.Serialization.XmlObjectSerializer.ReadObjectHandleExceptions(XmlReaderDelegator reader, Boolean verifyObjectName, DataContractResolver dataContractResolver)
       at System.Runtime.Serialization.Json.DataContractJsonSerializer.ReadObject(XmlDictionaryReader reader)
       at System.Runtime.Serialization.Json.DataContractJsonSerializer.ReadObject(Stream stream)
       at ConsoleApplication1.Program.Main(String[] args) in d:\...\Program.cs:line 45
       at System.AppDomain._nExecuteAssembly(RuntimeAssembly assembly, String[] args)
       at System.AppDomain.ExecuteAssembly(String assemblyFile, Evidence assemblySecurity, String[] args)
  InnerException: System.Xml.XmlException
       Message=Encountered unexpected character 'i'.
            at System.Xml.XmlExceptionHelper.ThrowXmlException(XmlDictionaryReader reader, XmlException exception)
            at System.Runtime.Serialization.Json.XmlJsonReader.ReadAttributes()
            at System.Runtime.Serialization.XmlObjectSerializer.InternalReadObject(XmlReaderDelegator reader, Boolean verifyObjectName, DataContractResolver dataContractResolver)
            at System.Runtime.Serialization.XmlObjectSerializer.ReadObjectHandleExceptions(XmlReaderDelegator reader, Boolean verifyObjectName, DataContractResolver dataContractResolver)

물론, "Encoding.UTF8.GetBytes" 를 이용하여 BOM을 제거한 stream을 넘겨주면 오류가 발생하지 않습니다.

[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]

[최초 등록일: ]
[최종 수정일: 12/20/2012]

2014-06-11 03시56분
[김영준] 인코딩 설정시 BOM을 설정을 지정할 수도 있습니다. ^^

bool isBOM = false;
StreamWriter sw = new StreamWriter(stream2, new UTF8Encoding(isBOM) );
2014-06-11 11시52분
@김영준 좋은 의견 감사드립니다. ^^

