String 데이터를 Stream으로 변환하는 방법
사실 이게 하나의 글로 씌여지기에는 좀 단순한 문제이긴 합니다. ^^
검색만 해보면 다음과 같은 식으로 2가지 방법이 나오는데요.
// 방법 1: Encoding 타입 사용
string test = "ab";
byte[] byteArray = Encoding.UTF8.GetBytes(test);
MemoryStream stream1 = new MemoryStream(byteArray);
// 방법 2: StreamWriter 사용
MemoryStream stream2 = new MemoryStream();
StreamWriter sw = new StreamWriter(stream2, Encoding.UTF8);
sw.Write(test);
sw.Flush();
stream2.Position = 0;
그런데, 전자와 후자는 결과가 틀립니다. 실제로 한번 출력을 해볼까요? ^^
foreach (byte aByte in stream1.ToArray())
{
Console.Write(aByte.ToString("x") + ", ");
}
Console.WriteLine();
foreach (byte aByte in stream2.ToArray())
{
Console.Write(aByte.ToString("x") + ", ");
}
// 출력 결과
61, 62,
ef, bb, bf, 61, 62,
보시는 것처럼 StreamWriter는 3바이트가 더 출력됩니다. 이게 뭔지 혹시 감이 오세요? ^^ 그렇습니다. StreamWriter는 BOM(Byte Order Mark)을 함께 출력합니다.
보통 이것이 문제가 되지 않을 수 있지만, BOM 인식을 간과하는 특정 클래스가 있다면 상황이 달라집니다. 바로 DataContractJsonSerializer가 그 예입니다. 예를 들어, 아래와 같이 stream을 건네주면,
public class Test
{
public string id { get; set; }
}
string test = "{ \"id\": \"ab\" }";
MemoryStream stream2 = ...[BOM을 쓰는 방식]...;
DataContractJsonSerializer dcjs = new DataContractJsonSerializer(typeof(Test));
Test user2 = dcjs.ReadObject(stream2) as Test;
BOM 데이터를 해석하려고 시도하는 바람에 "System.Runtime.Serialization.SerializationException" 예외가 발생합니다.
System.Runtime.Serialization.SerializationException was unhandled
HResult=-2146233076
Message=There was an error deserializing the object of type ConsoleApplication1.Test. Encountered unexpected character 'i'.
Source=System.Runtime.Serialization
StackTrace:
at System.Runtime.Serialization.XmlObjectSerializer.ReadObjectHandleExceptions(XmlReaderDelegator reader, Boolean verifyObjectName, DataContractResolver dataContractResolver)
at System.Runtime.Serialization.Json.DataContractJsonSerializer.ReadObject(XmlDictionaryReader reader)
at System.Runtime.Serialization.Json.DataContractJsonSerializer.ReadObject(Stream stream)
at ConsoleApplication1.Program.Main(String[] args) in d:\...\Program.cs:line 45
at System.AppDomain._nExecuteAssembly(RuntimeAssembly assembly, String[] args)
at System.AppDomain.ExecuteAssembly(String assemblyFile, Evidence assemblySecurity, String[] args)
...[생략]...
InnerException: System.Xml.XmlException
HResult=-2146232000
Message=Encountered unexpected character 'i'.
Source=System.Runtime.Serialization
LineNumber=0
LinePosition=0
StackTrace:
at System.Xml.XmlExceptionHelper.ThrowXmlException(XmlDictionaryReader reader, XmlException exception)
at System.Runtime.Serialization.Json.XmlJsonReader.ReadAttributes()
...[생략]...
at System.Runtime.Serialization.XmlObjectSerializer.InternalReadObject(XmlReaderDelegator reader, Boolean verifyObjectName, DataContractResolver dataContractResolver)
at System.Runtime.Serialization.XmlObjectSerializer.ReadObjectHandleExceptions(XmlReaderDelegator reader, Boolean verifyObjectName, DataContractResolver dataContractResolver)
InnerException:
물론, "Encoding.UTF8.GetBytes"를 이용하여 BOM을 제거한 stream을 넘겨주면 오류가 발생하지 않습니다.
[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]