Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 

Visual Studio에서 개행(\n, \r) 등의 제어 문자를 치환하는 방법 - 정규 표현식 사용

가끔은, 특정 문자열에 대해 개행(CR - carriage return, LF - line feed) 문자 등을 지우고 싶을 때가 있습니다. 예를 들어, 다음과 같은 키 파일이 있을 때,

-----BEGIN RSA PRIVATE KEY-----
MIIJKQIBAAKCAgEAx4iHil63ieeSmLVgYjP/VJzZ4nyWZTD35+Mp4TMs0JexYF8o
d/onrZH2K3dDjWDOXiCFFt8xh0UfDPnPwwhz0jDd/Xn1HIYPifCPVgJpkiehz7cO
tLsF+pqsE9MpDScYySRnqN1qQ50kT/GbkQbea3aXMEYNHcUloSAugfX6M43SW8zR
pXvLce1PxjYrER3p0ljO6eJeEL9D2J9gH/rtC6peruCRey9SgscPJsFP7/QZz9as
L2+YpC8NRu9RdwvCKL0S5Akq2LX7D29RgdEyJxeiNOJiI2hzMGkux7tYJDWDTTPY
29ajswWHOkiQJQ5xyVNr9doffhIZGfAabohvH+Q4702N1U1McdetSXgVTF+0TcJQ
zMJuCzU+yfJQTtAjgopeEOPHNvL84KeHIrk9Oa3hECEf8F6NWJNkMZptVWUs5kyq
oSJQ/eaJfzco3iDOqcO0IOumGsr+wuDfiYx9uWUg8lqmLvZrZBWLgYDvEwy0AmcT
R0AkSWKAgKWCjA9epGiGPsEgTvypgPBjmbZRdNNQnJHGy3xfczlystv70+UmDZ+U
xlGWffDhd8hrmD89NHQKEF8bpBqLxKD025SClkQiDlZnN6KkY1pRBxbUFpH58Wdh
d+2eM2QcYHLRa0fwpBMHL4Yp8uF2VJgfFxm6+ZXp1BAoFtii1ckmNwUsbA0CAwEA
AQKCAgEAwpLcuY4LpKrxRYD5cEoMXtJllnqvnhXWaYYXvMdOmEqUacnhiL2kG5oO
V+yBL0iLdTZ5EgisH6DD2r9wXlvLtdh5YUigQSRp2rV+0PyhPijvncKA0LTf67UQ
wHRVv8G0ZdDeVMk1aqG+W0bb0NzF4D1QyX5GJBWv0CO1tn3LcqKF04czmQ/TIFGu
TTddX9+vt7NqcqCP4fzhiEhCUG084vdMRXQv6dQHvgenOr+f1/pNgWNxnQBR9Sj8
5YNSCaipuVhHJ5/Y7GLpY+/Fp7X8FirxvmhUEvsz+K1ZNOP327djRtGcUyRHlbd6
WteP2NLxGsYCrUf7FdFIMQb2f3sEAHcgBesYF/+Ck5kUuCv25KGzp0GM2RANhKiV
aS0CPRXNVVOBCiYJKcSgLTopt0urM1KnTk3Jexmld+Yc83GSQZqJGyvYZRnGDG1k
w3xjWAJtByMIzJk/AnLo2VXmWyVkG5dfMP/rJJTtLxBMAnhRafPMTdd/Z7ugWd80
gn2CzuwxjrmzisZS3XivhRwA1Xxpi0bIxKFkzUTU3Lt/K/O12IZ5cnKZsLRWG2qW
/5b2FfGYQqT4CakWTJHceFpTuckCEFQC4hbkUoXgLsrh0z8s5QUV6hMAmdRWRjyv
+SUf+Wd8tJ98MZzp5f+83hjsgDNqweIrA/VCNdu77kv4mHo4egECggEBAPVmzzGG
619or1khbUwzEnXUyoT2SF4CvTqxRGbMgQYhPFJ3vkooDpWlZCsfhcA9IIU3FpFl
C+zBllFOmu8n/e5xdPFWmzfLBnRIe+Ztvvnq6UINKsdeuhi1+Gd0NQZpt+6iyP69
Rwa6/p5EhvgpoAijoJjQ3bq14QcSmM+G25UqoP8tE++wcwlfhKiVgcAza6lSq/ul
CIR5s6L1MnsHxGOMYaL1VSS6BGnJZvnbBTDWAMouQWaKEWTSE5SDqswt/VJaGvf/
HRNksLVrY5OjG28OUITlRwxGBQCzWwsbtm2FNwPv/S2/UJdCP0PWjQPt1taE+pr3
ZYYm0s0QVcljVa0CggEBANAmmDzZouaWwbHNgFtQzH1pe7AgS4XdavS6aUEvtOOe
ugeMeZJhzmd14/xBupf8qEkBAhTRdxtZcb5712A+hObmCoyVsp6kQeAimQORlqDq
u1StAO7cDoGwdX4+UTlYyeWmRAZg1h5PGsK3qFW00wVihowcgTkhFyuTM0/x/mKl
u63q9Xxpg883mZCCgcndl6fSFkvHfkFKWcrGFoj4wR7LWwWw+VznLdkfTKEJXlNj
tTRuXFJYilx5D9RkrRYXQYO0uwprl1J2bgmJBF4hJkMx8N42V9xL+jSZHWtTllj2
CnPS+3Iu/AtZgXo/XqWk7cF5LJWMTMUXCto3m0QEe+ECggEBAPQEIfy+iyeZAdtg
GL2Pf0i5qhNijf0lPiKxiDGsIpQE0mWyef5lLHNzPVKACtBoOAEfEQrMbnoi2STK
Q9eRbbf/C2i7VKa69BUGymUMNb1u8DjkvOf4cpYFxBai/+L7lpDtP23Gqmyv3mVk
AM2dHmvYwOWTsxdoqXUN8fNRxuDhvatfmJZbX1gvqcq0t4t11hVNhoQ4y2pnVc+x
f1vFEmxmd+PBjcNyUNccFJBYUCYKdkiUjCW5HqihGCUyc9CJ3n5X6L825yOUmP4c
5aw1oR7iHgC3t9kleu4CaoJ2MQVgVJ9OsPMfbLSrhBshqaEBjAJNwp/7ZvFpg22z
U4pogxUCggEATQ7csTpI6mDJWE+hwyyIZ61TUwLBss8jt3IDYVSN/O5YJE9G+oAm
73pfapXSxE2O52fuI1Lga0mTqFckhsbeYLStFxqcQ8q/cICecQnG38/GhjR98e+Z
lz2CYbgkTbynEdOZv1q+Kf5TA98F/KSysn2lHd23oTS05Tbbei82Y8LDVkFznBlb
6KzGtw75iYf1ivVlt6wk+3rQ/xaSZSbiJ8pU6ih4SIJ1ILpLnhpfxzNUdBKfLwUE
Q/O1foW+5jy5zk5sKBFoteiOGA2XhllzVtD4QOuRX0bpW+uLTp5lPI3plLN4zu7B
9Fmwa1dmbKBAPK3laX/FM/mx1NNdMbMPQQKCAQAJcfQwlZ2w0g7ItlOud5VKTREj
u4MD0JowSIUevhVr0t4Bc8Iqq7lFnQNtowZpPgr1w26q8l8gy35nRi/P6eoZo4sw
N/jHCPeozXTfdZGfBBiHbhnIgv5PQD4sKogyt5pVeZUOcqeit/e12PVAZjwNV/iG
j1YE0WQCKph0YTGadlh/BoI7Cla4v+zn85tKVDk4rvUe4SRQe+v9nhaDYuC4stMl
yWoxdfWUFovQtKOHKUCYww8dapSaoPDI/2ETs+FFXhk+/tZA+x8sZlyfswBrbBlF
KjV8ihm3cgfP4iLC+y9SdhQkvoynQqWbamlRiTMqUxD+7jYdFgkplonOJn/w
-----END RSA PRIVATE KEY-----

이것을 소스 코드에서 단일 문자열로 사용하기 위해,

string privateKey = "-----BEGIN RSA PRIVATE KEY-----MIIJ...[생략]...nOJn/w-----END RSA PRIVATE KEY-----";

마지막 개행 문자를 모두 제거하고 싶은 경우인데요, 그럴 때는 아래의 화면과 같이 비주얼 스튜디오의 "Find and Replace" 대화창에서 "Use Regular Expressions (Alt + E)" 옵션을 켜 두면,

find_and_replace_re_1.png

찾을 문자열에 대해 "\n", "\r" 등의 escape 표현을 쓸 수 있고, 치환할 문자열 칸을 비워두고 실행하면 개행 문자를 모두 없애게 됩니다.

참고로, 문서에 따라 "\n", "\r"의 유무가 달라지므로 "\r?\n", "\p{Cc}" 등으로 찾기 문자열을 주는 것이 좋습니다. 좀 더 자유로운 사용법은 다음의 공식 문서를 참고하시고.

Use regular expressions in Visual Studio
; https://docs.microsoft.com/en-us/visualstudio/ide/using-regular-expressions-in-visual-studio




그런데 혹시 이 기능을 활용하면 지난 글에서 소개한,

탐색기의 보안 탭에 있는 "Object name" 경로에 LEFT-TO-RIGHT EMBEDDING 제어 문자가 포함되는 문제
; https://www.sysnet.pe.kr/2/0/12557

숨겨진 문자열을 찾을 수 있지 않을까요? 이를 위해 해당 character(0x202a)에 대한 유니코드 분류를 알아야 하는데요, 이것은 다음의 코드로 가능합니다.

string txt = @"C:\Users\desktop.ini"; // Object name에서 가져온 문자열

Console.WriteLine(char.GetUnicodeCategory(txt[0])); // 출력 결과: Format
                                                    // txt[0] == 0x202a

따라서 다음의 문서에 따라,

Character classes in regular expressions
 - Unicode category or Unicode block: \p{}
; https://docs.microsoft.com/en-us/dotnet/standard/base-types/character-classes-in-regular-expressions#unicode-category-or-unicode-block-p

Character classes in regular expressions
 - Supported Unicode general categories
; https://docs.microsoft.com/en-us/dotnet/standard/base-types/character-classes-in-regular-expressions#supported-unicode-general-categories

찾기 문자열을 "\p{Cf}"로 주면 될 것 같은데, 아쉽게도 못 찾는군요. ^^ 또한, 0x202a 문자가 유니코드에는 "IsGeneralPunctuation"으로 분류되므로,

Character classes in regular expressions
 - Supported named blocks
; https://docs.microsoft.com/en-us/dotnet/standard/base-types/character-classes-in-regular-expressions#supported-named-blocks

"\p{IsGeneralPunctuation}"라고 해도 검색 되어야 하는데 이것 역시 비주얼 스튜디오에서 동작을 하지 않습니다. 마지막으로, 직접 유니코드 값으로 "\u202a"라고 입력해 봤지만

Character Escapes in Regular Expressions
; https://docs.microsoft.com/en-us/dotnet/standard/base-types/character-escapes-in-regular-expressions

역시나 ^^; 찾을 수 없군요. (혹시, 해당 글자를 찾을 수 있는 방법을 아시는 분은 덧글 부탁드립니다.) 참고로, \x를 이용한 코드 값을 직접 주는 경우 2글자, \u를 이용한 코드 값은 4글자까지 가능합니다. 예를 들어, \x20은 가능하지만 \x020은 안 되고, \u로 시작하면 "\u03b1"등의 검색이 가능합니다.

재미있는 것은, Visual Studio Code에서는 \u202a로 검색이 됩니다.




할 수 없군요, 이제 마지막 남은 방법은 매크로 같은 함수를 만들어 쓰는 수밖에 없을 듯합니다. 예전에 소개했던 "Macros for Visual Studio"를 이용하면,

Visual Studio 2013/2015를 위한 "Macros for Visual Studio"
; https://www.sysnet.pe.kr/2/0/10980

다음과 같은 식으로 매크로 함수를 만들 수 있습니다.

/// <reference path="C:\Users\testusr\AppData\Local\Microsoft\VisualStudio\16.0_c5e17422\Macros\dte.js" />

if (dte.UndoContext.IsOpen)
    dte.UndoContext.Close();

try {
    dte.UndoContext.Open("RepaceControlCode");

    var document = dte.ActiveDocument.Object();
    var startPoint = document.StartPoint.CreateEditPoint();
    var endPoint = document.EndPoint.CreateEditPoint();
    var text = startPoint.GetText(endPoint);

    text = text.replace(/\u202a/g, '');
    
    var selObj = dte.ActiveDocument.Selection;
    selObj.SelectAll();

    selObj.Text = text;

} finally {
    dte.UndoContext.Close();
}

그런데, 문제가 있습니다. 위와 같이 하면 웬일인지 "selObj.Text = text" 코드 실행 시 시간이 너무 오래 걸립니다. 이상하군요, 어쨌든 오래 걸리므로 이것을 다음과 같이 우회해 구현할 수 있습니다.

/// <reference path="C:\Users\SeongTae Jeong\AppData\Local\Microsoft\VisualStudio\16.0_c5e17422\Macros\dte.js" />

if (dte.UndoContext.IsOpen)
    dte.UndoContext.Close();

try {
    dte.UndoContext.Open("RepaceControlCode");

    var document = dte.ActiveDocument.Object();
    var startPoint = document.StartPoint.CreateEditPoint();
    var endPoint = document.EndPoint.CreateEditPoint();
    var text = startPoint.GetText(endPoint);

    text = text.replace(/\u202a/g, '');
    
    var selObj = dte.ActiveDocument.Selection;
    selObj.SelectAll();

    // selObj.Text = text;

    selObj.Text = "";
    document.Selection.Insert(text, 1);

} finally {
    dte.UndoContext.Close();
}




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 3/12/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




1  2  3  4  [5]  6  7  8  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
13818정성태11/15/20245288Windows: 272. Windows 11 24H2 - sudo 추가
13817정성태11/14/20244929Linux: 106. eBPF / bpf2go - (BPF_MAP_TYPE_HASH) Map을 이용한 전역 변수 구현
13816정성태11/14/20245386닷넷: 2312. C#, C++ - Windows / Linux 환경의 Thread Name 설정파일 다운로드1
13815정성태11/13/20244809Linux: 105. eBPF - bpf2go에서 전역 변수 설정 방법
13814정성태11/13/20245284닷넷: 2311. C# - Windows / Linux 환경에서 Native Thread ID 가져오기파일 다운로드1
13813정성태11/12/20245047닷넷: 2310. .NET의 Rune 타입과 emoji 표현파일 다운로드1
13812정성태11/11/20245267오류 유형: 933. Active Directory - The forest functional level is not supported.
13811정성태11/11/20244848Linux: 104. Linux - COLUMNS 환경변수가 언제나 80으로 설정되는 환경
13810정성태11/10/20245389Linux: 103. eBPF (bpf2go) - Tracepoint를 이용한 트레이스 (BPF_PROG_TYPE_TRACEPOINT)
13809정성태11/10/20245261Windows: 271. 윈도우 서버 2025 마이그레이션
13808정성태11/9/20245257오류 유형: 932. Linux - 커널 업그레이드 후 "error: bad shim signature" 오류 발생
13807정성태11/9/20244994Linux: 102. Linux - 커널 이미지 파일 서명 (Ubuntu 환경)
13806정성태11/8/20244902Windows: 270. 어댑터 상세 정보(Network Connection Details) 창의 내용이 비어 있는 경우
13805정성태11/8/20244736오류 유형: 931. Active Directory의 adprep 또는 복제가 안 되는 경우
13804정성태11/7/20245366Linux: 101. eBPF 함수의 인자를 다루는 방법
13803정성태11/7/20245322닷넷: 2309. C# - .NET Core에서 바뀐 DateTime.Ticks의 정밀도
13802정성태11/6/20245705Windows: 269. GetSystemTimeAsFileTime과 GetSystemTimePreciseAsFileTime의 차이점파일 다운로드1
13801정성태11/5/20245492Linux: 100. eBPF의 2가지 방식 - libbcc와 libbpf(CO-RE)
13800정성태11/3/20246323닷넷: 2308. C# - ICU 라이브러리를 활용한 문자열의 대소문자 변환 [2]파일 다운로드1
13799정성태11/2/20244907개발 환경 구성: 732. 모바일 웹 브라우저에서 유니코드 문자가 표시되지 않는 경우
13798정성태11/2/20245521개발 환경 구성: 731. 유니코드 - 출력 예시 및 폰트 찾기
13797정성태11/1/20245509C/C++: 185. C++ - 문자열의 대소문자를 변환하는 transform + std::tolower/toupper 방식의 문제점파일 다운로드1
13796정성태10/31/20245382C/C++: 184. C++ - ICU dll을 이용하는 예제 코드 (Windows)파일 다운로드1
13795정성태10/31/20245178Windows: 268. Windows - 리눅스 환경처럼 공백으로 끝나는 프롬프트 만들기
13794정성태10/30/20245262닷넷: 2307. C# - 윈도우에서 한글(및 유니코드)을 포함한 콘솔 프로그램을 컴파일 및 실행하는 방법
13793정성태10/28/20245135C/C++: 183. C++ - 윈도우에서 한글(및 유니코드)을 포함한 콘솔 프로그램을 컴파일 및 실행하는 방법
1  2  3  4  [5]  6  7  8  9  10  11  12  13  14  15  ...