Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (seongtaejeong at gmail.com)
홈페이지
첨부 파일
 

(시리즈 글이 9개 있습니다.)
.NET Framework: 351. JavaScriptSerializer, DataContractJsonSerializer, Json.NET
; https://www.sysnet.pe.kr/2/0/1391

.NET Framework: 661. Json.NET의 DeserializeObject 수행 시 속성 이름을 동적으로 바꾸는 방법
; https://www.sysnet.pe.kr/2/0/11224

.NET Framework: 756. JSON의 escape sequence 문자 처리 방식
; https://www.sysnet.pe.kr/2/0/11532

사물인터넷: 54. 아두이노 환경에서의 JSON 파서(ArduinoJson) 사용법
; https://www.sysnet.pe.kr/2/0/11766

.NET Framework: 1073. C# - JSON 역/직렬화 시 리플렉션 손실을 없애는 JsonSrcGen
; https://www.sysnet.pe.kr/2/0/12688

.NET Framework: 2087. .NET 6부터 SourceGenerator와 통합된 System.Text.Json
; https://www.sysnet.pe.kr/2/0/13214

.NET Framework: 2115. System.Text.Json의 역직렬화 시 필드/속성 주의
; https://www.sysnet.pe.kr/2/0/13342

닷넷: 2261. C# - 구글 OAuth의 JWT (JSON Web Tokens) 해석
; https://www.sysnet.pe.kr/2/0/13623

닷넷: 2265. C# - System.Text.Json의 기본적인 (한글 등에서의) escape 처리
; https://www.sysnet.pe.kr/2/0/13644




C# - System.Text.Json의 기본적인 (한글 등에서의) escape 처리

Json.NET의 경우,

Json.NET
; https://www.newtonsoft.com/json

아래의 한글이 포함된 문자열을 직렬화하면,

using Newtonsoft.Json;

namespace ConsoleApp2;

// Install-Package Newtonsoft.Json
internal class Program
{
    static void Main(string[] args)
    {
        MyClass mc = new MyClass { Name = "\"<테스트>\"", Age = 20 };
        string text = JsonConvert.SerializeObject(mc, Formatting.Indented);
        File.WriteAllText("data.json", text);
    }
}

public class MyClass
{
    public string Name { get; set; } = "";
    public int Age { get; set; } = 1;
}

이런 결과가 나옵니다.

{
  "Name": "\"<테스트>\"",
  "Age": 20
}

반면, .NET에 내장된 System.Text.Json을 사용하면

internal class Program
{
    static JsonSerializerOptions jsonOptions = new()
    {
        WriteIndented = true
    };

    static void Main(string[] args)
    {
        MyClass mc = new MyClass { Name = "\"<테스트>\"", Age = 20 };

        string txt = JsonSerializer.Serialize(mc, jsonOptions);
        File.WriteAllText("data.json", txt);
    }
}

이렇게 나옵니다.

{
  "Name": "\u0022\u003C\uD14C\uC2A4\uD2B8\u003E\u0022",
  "Age": 20
}

이에 대해서는 이미 마이크로소프트의 공식 문서에서 자세하게 설명하고 있습니다.

System.Text.Json을 사용하여 문자 인코딩을 사용자 지정하는 방법
; https://learn.microsoft.com/ko-kr/dotnet/standard/serialization/system-text-json/character-encoding

위의 문서에서 제시하는 가장 간단한 방법으로 "모든 문자 직렬화"가 있는데요, 이 옵션을 사용하면,

static JsonSerializerOptions jsonOptions = new()
{
    Encoder = JavaScriptEncoder.UnsafeRelaxedJsonEscaping,
    WriteIndented = true
};

이제 출력은 (Json.NET과 동일하게) 다음과 같이 바뀝니다.

{
  "Name": "\"<테스트>\"",
  "Age": 20
}

하지만, 이 옵션에는 (문서에 명시한) 보안 주의 사항이 있으므로 별로 마음에 들지 않는데요, 사실 우리가 원하는 것은 한글과 일반 영숫자만 escape 처리가 안 되는 정도면 만족할 수 있으므로 다음과 같이 선택적으로 Encoder를 구성해 지정하는 것도 좋은 선택입니다.

static JsonSerializerOptions jsonOptions = new()
{
    Encoder = JavaScriptEncoder.Create(
        UnicodeRanges.BasicLatin, // 일반 영숫자
        UnicodeRanges.HangulCompatibilityJamo, // 이하 한글 관련 문자
        UnicodeRanges.HangulJamo,
        UnicodeRanges.HangulJamoExtendedA,
        UnicodeRanges.HangulJamoExtendedB,
        UnicodeRanges.HangulSyllables
        ),
    WriteIndented = true
};

그럼 출력은 다시 이렇게 바뀝니다.

{
  "Name": "\u0022\u003C테스트\u003E\u0022",
  "Age": 20
}

보는 바와 같이 HTML 구분 문자를 모두 escape 처리하기 때문에 보안에 걸릴 걱정을 하지 않아도 됩니다.




만약, 일본어나 중국어 등에 대해서도 저런 escape 처리를 없애야 한다면 UnicodeRanges를 일일이 추가하기보다는 그냥 All을 선택하는 것도 좋습니다.

static JsonSerializerOptions jsonOptions = new()
{
    Encoder = JavaScriptEncoder.Create(UnicodeRanges.All),
    WriteIndented = true
};

그래도 HTML 구분 문자들은 여전히 escape 처리를 한다는 점에서 JavaScriptEncoder.UnsafeRelaxedJsonEscaping 옵션과는 다른 장점이 있습니다.

그나저나, 이 글을 쓰면서 예전에 겪었던 상황이 떠오르는군요. ^^

curl - json_parse_exception / Invalid UTF-8 start byte
; https://www.sysnet.pe.kr/2/0/12307

그 당시 json 데이터를 curl에서 보내기 위해 이런 식으로 구성했는데요,

curl -X POST "http://localhost:9200/_analyze" -H "Content-Type: application/json" -d "{ \"tokenizer\": \"nori_tokenizer\", \"text\": \"논쟁이 주를 이룹니다.\" }"

일일이 "\"" 글자를 escape 처리하는 것이 귀찮았는데 어찌 보면 System.Text.Json으로 저 Json 데이터를 구성했다면 문제가 없었을 것입니다.




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 6/13/2024]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2024-10-19 12시17분
What’s new in System.Text.Json in .NET 9
; https://devblogs.microsoft.com/dotnet/system-text-json-in-dotnet-9/
정성태

... 106  [107]  108  109  110  111  112  113  114  115  116  117  118  119  120  ...
NoWriterDateCnt.TitleFile(s)
11250정성태7/13/201720805디버깅 기술: 87. windbg 분석 - webengine4.dll의 MgdExplicitFlush에서 발생한 System.AccessViolationException의 crash 문제 [1]
11249정성태7/12/201718630오류 유형: 410. LoadLibrary("[...].dll") failed - The specified procedure could not be found.
11248정성태7/12/201725101오류 유형: 409. pip install pefile - 'cp949' codec can't decode byte 0xe2 in position 208687: illegal multibyte sequence
11247정성태7/12/201719480오류 유형: 408. SqlConnection 객체 생성 시 무한 대기 문제파일 다운로드1
11246정성태7/11/201718193VS.NET IDE: 118. Visual Studio - 다중 폴더에 포함된 파일들에 대한 "Copy to Output Directory"를 한 번에 설정하는 방법
11245정성태7/10/201723788개발 환경 구성: 321. Visual Studio Emulator for Android 소개 [2]
11244정성태7/10/201723363오류 유형: 407. Visual Studio에서 ASP.NET Core 실행할 때 dotnet.exe 프로세스의 -532462766 오류 발생 [1]
11243정성태7/10/201720064.NET Framework: 666. dotnet.exe - 윈도우 운영체제에서의 .NET Core 버전 찾기 규칙
11242정성태7/8/201720303제니퍼 .NET: 27. 제니퍼 닷넷 적용 사례 (7) - 노후된 스토리지 장비로 인한 웹 서비스 Hang (멈춤) 현상
11241정성태7/8/201719039오류 유형: 406. Xamarin 빌드 에러 XA5209, APT0000
11240정성태7/7/201721974.NET Framework: 665. ClickOnce를 웹 브라우저를 이용하지 않고 쿼리 문자열을 전달하면서 실행하는 방법 [3]파일 다운로드1
11239정성태7/6/201723497.NET Framework: 664. Protocol Handler - 웹 브라우저에서 데스크톱 응용 프로그램을 실행하는 방법 [5]파일 다운로드1
11238정성태7/6/201720993오류 유형: 405. NT 서비스 시작 시 "Error 1067: The process terminated unexpectedly." 오류 발생 [2]
11237정성태7/5/201722630.NET Framework: 663. C# - PDB 파일 경로를 PE 파일로부터 얻는 방법파일 다운로드1
11236정성태7/4/201725925.NET Framework: 662. C# - VHD/VHDX 가상 디스크를 마운트하지 않고 파일을 복사하는 방법파일 다운로드1
11235정성태6/29/201720095Math: 20. Matlab/Octave로 Gram-Schmidt 정규 직교 집합 구하는 방법
11234정성태6/29/201717408오류 유형: 404. SharePoint 2013 설치 과정에서 "The username is invalid The account must be a valid domain account" 오류 발생
11233정성태6/28/201717296오류 유형: 403. SharePoint Server 2013을 Windows Server 2016에 설치할 때 .NET 4.5 설치 오류 발생
11232정성태6/28/201718257Windows: 144. Windows Server 2016에 Windows Identity Extensions을 설치하는 방법
11231정성태6/28/201718901디버깅 기술: 86. windbg의 mscordacwks DLL 로드 문제 - 세 번째 이야기 [1]
11230정성태6/28/201718061제니퍼 .NET: 26. 제니퍼 닷넷 적용 사례 (6) - 잦은 Recycle 문제
11229정성태6/27/201719308오류 유형: 402. Windows Server Backup 관리 콘솔이 없어진 경우
11228정성태6/26/201716767개발 환경 구성: 320. Visual Basic .NET 프로젝트에서 내장 Manifest 자원을 EXE 파일로부터 제거하는 방법파일 다운로드1
11227정성태6/19/201724574개발 환경 구성: 319. windbg에서 python 스크립트 실행하는 방법 - pykd [6]
11226정성태6/19/201716372오류 유형: 401. Microsoft Edge를 실행했는데 입력 반응이 없는 경우
11225정성태6/19/201715733오류 유형: 400. Outlook - The required file ExSec32.dll cannot be found in your path. Install Microsoft Outlook again.
... 106  [107]  108  109  110  111  112  113  114  115  116  117  118  119  120  ...