Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 

Visual Studio에서 개행(\n, \r) 등의 제어 문자를 치환하는 방법 - 정규 표현식 사용

가끔은, 특정 문자열에 대해 개행(CR - carriage return, LF - line feed) 문자 등을 지우고 싶을 때가 있습니다. 예를 들어, 다음과 같은 키 파일이 있을 때,

-----BEGIN RSA PRIVATE KEY-----
MIIJKQIBAAKCAgEAx4iHil63ieeSmLVgYjP/VJzZ4nyWZTD35+Mp4TMs0JexYF8o
d/onrZH2K3dDjWDOXiCFFt8xh0UfDPnPwwhz0jDd/Xn1HIYPifCPVgJpkiehz7cO
tLsF+pqsE9MpDScYySRnqN1qQ50kT/GbkQbea3aXMEYNHcUloSAugfX6M43SW8zR
pXvLce1PxjYrER3p0ljO6eJeEL9D2J9gH/rtC6peruCRey9SgscPJsFP7/QZz9as
L2+YpC8NRu9RdwvCKL0S5Akq2LX7D29RgdEyJxeiNOJiI2hzMGkux7tYJDWDTTPY
29ajswWHOkiQJQ5xyVNr9doffhIZGfAabohvH+Q4702N1U1McdetSXgVTF+0TcJQ
zMJuCzU+yfJQTtAjgopeEOPHNvL84KeHIrk9Oa3hECEf8F6NWJNkMZptVWUs5kyq
oSJQ/eaJfzco3iDOqcO0IOumGsr+wuDfiYx9uWUg8lqmLvZrZBWLgYDvEwy0AmcT
R0AkSWKAgKWCjA9epGiGPsEgTvypgPBjmbZRdNNQnJHGy3xfczlystv70+UmDZ+U
xlGWffDhd8hrmD89NHQKEF8bpBqLxKD025SClkQiDlZnN6KkY1pRBxbUFpH58Wdh
d+2eM2QcYHLRa0fwpBMHL4Yp8uF2VJgfFxm6+ZXp1BAoFtii1ckmNwUsbA0CAwEA
AQKCAgEAwpLcuY4LpKrxRYD5cEoMXtJllnqvnhXWaYYXvMdOmEqUacnhiL2kG5oO
V+yBL0iLdTZ5EgisH6DD2r9wXlvLtdh5YUigQSRp2rV+0PyhPijvncKA0LTf67UQ
wHRVv8G0ZdDeVMk1aqG+W0bb0NzF4D1QyX5GJBWv0CO1tn3LcqKF04czmQ/TIFGu
TTddX9+vt7NqcqCP4fzhiEhCUG084vdMRXQv6dQHvgenOr+f1/pNgWNxnQBR9Sj8
5YNSCaipuVhHJ5/Y7GLpY+/Fp7X8FirxvmhUEvsz+K1ZNOP327djRtGcUyRHlbd6
WteP2NLxGsYCrUf7FdFIMQb2f3sEAHcgBesYF/+Ck5kUuCv25KGzp0GM2RANhKiV
aS0CPRXNVVOBCiYJKcSgLTopt0urM1KnTk3Jexmld+Yc83GSQZqJGyvYZRnGDG1k
w3xjWAJtByMIzJk/AnLo2VXmWyVkG5dfMP/rJJTtLxBMAnhRafPMTdd/Z7ugWd80
gn2CzuwxjrmzisZS3XivhRwA1Xxpi0bIxKFkzUTU3Lt/K/O12IZ5cnKZsLRWG2qW
/5b2FfGYQqT4CakWTJHceFpTuckCEFQC4hbkUoXgLsrh0z8s5QUV6hMAmdRWRjyv
+SUf+Wd8tJ98MZzp5f+83hjsgDNqweIrA/VCNdu77kv4mHo4egECggEBAPVmzzGG
619or1khbUwzEnXUyoT2SF4CvTqxRGbMgQYhPFJ3vkooDpWlZCsfhcA9IIU3FpFl
C+zBllFOmu8n/e5xdPFWmzfLBnRIe+Ztvvnq6UINKsdeuhi1+Gd0NQZpt+6iyP69
Rwa6/p5EhvgpoAijoJjQ3bq14QcSmM+G25UqoP8tE++wcwlfhKiVgcAza6lSq/ul
CIR5s6L1MnsHxGOMYaL1VSS6BGnJZvnbBTDWAMouQWaKEWTSE5SDqswt/VJaGvf/
HRNksLVrY5OjG28OUITlRwxGBQCzWwsbtm2FNwPv/S2/UJdCP0PWjQPt1taE+pr3
ZYYm0s0QVcljVa0CggEBANAmmDzZouaWwbHNgFtQzH1pe7AgS4XdavS6aUEvtOOe
ugeMeZJhzmd14/xBupf8qEkBAhTRdxtZcb5712A+hObmCoyVsp6kQeAimQORlqDq
u1StAO7cDoGwdX4+UTlYyeWmRAZg1h5PGsK3qFW00wVihowcgTkhFyuTM0/x/mKl
u63q9Xxpg883mZCCgcndl6fSFkvHfkFKWcrGFoj4wR7LWwWw+VznLdkfTKEJXlNj
tTRuXFJYilx5D9RkrRYXQYO0uwprl1J2bgmJBF4hJkMx8N42V9xL+jSZHWtTllj2
CnPS+3Iu/AtZgXo/XqWk7cF5LJWMTMUXCto3m0QEe+ECggEBAPQEIfy+iyeZAdtg
GL2Pf0i5qhNijf0lPiKxiDGsIpQE0mWyef5lLHNzPVKACtBoOAEfEQrMbnoi2STK
Q9eRbbf/C2i7VKa69BUGymUMNb1u8DjkvOf4cpYFxBai/+L7lpDtP23Gqmyv3mVk
AM2dHmvYwOWTsxdoqXUN8fNRxuDhvatfmJZbX1gvqcq0t4t11hVNhoQ4y2pnVc+x
f1vFEmxmd+PBjcNyUNccFJBYUCYKdkiUjCW5HqihGCUyc9CJ3n5X6L825yOUmP4c
5aw1oR7iHgC3t9kleu4CaoJ2MQVgVJ9OsPMfbLSrhBshqaEBjAJNwp/7ZvFpg22z
U4pogxUCggEATQ7csTpI6mDJWE+hwyyIZ61TUwLBss8jt3IDYVSN/O5YJE9G+oAm
73pfapXSxE2O52fuI1Lga0mTqFckhsbeYLStFxqcQ8q/cICecQnG38/GhjR98e+Z
lz2CYbgkTbynEdOZv1q+Kf5TA98F/KSysn2lHd23oTS05Tbbei82Y8LDVkFznBlb
6KzGtw75iYf1ivVlt6wk+3rQ/xaSZSbiJ8pU6ih4SIJ1ILpLnhpfxzNUdBKfLwUE
Q/O1foW+5jy5zk5sKBFoteiOGA2XhllzVtD4QOuRX0bpW+uLTp5lPI3plLN4zu7B
9Fmwa1dmbKBAPK3laX/FM/mx1NNdMbMPQQKCAQAJcfQwlZ2w0g7ItlOud5VKTREj
u4MD0JowSIUevhVr0t4Bc8Iqq7lFnQNtowZpPgr1w26q8l8gy35nRi/P6eoZo4sw
N/jHCPeozXTfdZGfBBiHbhnIgv5PQD4sKogyt5pVeZUOcqeit/e12PVAZjwNV/iG
j1YE0WQCKph0YTGadlh/BoI7Cla4v+zn85tKVDk4rvUe4SRQe+v9nhaDYuC4stMl
yWoxdfWUFovQtKOHKUCYww8dapSaoPDI/2ETs+FFXhk+/tZA+x8sZlyfswBrbBlF
KjV8ihm3cgfP4iLC+y9SdhQkvoynQqWbamlRiTMqUxD+7jYdFgkplonOJn/w
-----END RSA PRIVATE KEY-----

이것을 소스 코드에서 단일 문자열로 사용하기 위해,

string privateKey = "-----BEGIN RSA PRIVATE KEY-----MIIJ...[생략]...nOJn/w-----END RSA PRIVATE KEY-----";

마지막 개행 문자를 모두 제거하고 싶은 경우인데요, 그럴 때는 아래의 화면과 같이 비주얼 스튜디오의 "Find and Replace" 대화창에서 "Use Regular Expressions (Alt + E)" 옵션을 켜 두면,

find_and_replace_re_1.png

찾을 문자열에 대해 "\n", "\r" 등의 escape 표현을 쓸 수 있고, 치환할 문자열 칸을 비워두고 실행하면 개행 문자를 모두 없애게 됩니다.

참고로, 문서에 따라 "\n", "\r"의 유무가 달라지므로 "\r?\n", "\p{Cc}" 등으로 찾기 문자열을 주는 것이 좋습니다. 좀 더 자유로운 사용법은 다음의 공식 문서를 참고하시고.

Use regular expressions in Visual Studio
; https://docs.microsoft.com/en-us/visualstudio/ide/using-regular-expressions-in-visual-studio




그런데 혹시 이 기능을 활용하면 지난 글에서 소개한,

탐색기의 보안 탭에 있는 "Object name" 경로에 LEFT-TO-RIGHT EMBEDDING 제어 문자가 포함되는 문제
; https://www.sysnet.pe.kr/2/0/12557

숨겨진 문자열을 찾을 수 있지 않을까요? 이를 위해 해당 character(0x202a)에 대한 유니코드 분류를 알아야 하는데요, 이것은 다음의 코드로 가능합니다.

string txt = @"C:\Users\desktop.ini"; // Object name에서 가져온 문자열

Console.WriteLine(char.GetUnicodeCategory(txt[0])); // 출력 결과: Format
                                                    // txt[0] == 0x202a

따라서 다음의 문서에 따라,

Character classes in regular expressions
 - Unicode category or Unicode block: \p{}
; https://docs.microsoft.com/en-us/dotnet/standard/base-types/character-classes-in-regular-expressions#unicode-category-or-unicode-block-p

Character classes in regular expressions
 - Supported Unicode general categories
; https://docs.microsoft.com/en-us/dotnet/standard/base-types/character-classes-in-regular-expressions#supported-unicode-general-categories

찾기 문자열을 "\p{Cf}"로 주면 될 것 같은데, 아쉽게도 못 찾는군요. ^^ 또한, 0x202a 문자가 유니코드에는 "IsGeneralPunctuation"으로 분류되므로,

Character classes in regular expressions
 - Supported named blocks
; https://docs.microsoft.com/en-us/dotnet/standard/base-types/character-classes-in-regular-expressions#supported-named-blocks

"\p{IsGeneralPunctuation}"라고 해도 검색 되어야 하는데 이것 역시 비주얼 스튜디오에서 동작을 하지 않습니다. 마지막으로, 직접 유니코드 값으로 "\u202a"라고 입력해 봤지만

Character Escapes in Regular Expressions
; https://docs.microsoft.com/en-us/dotnet/standard/base-types/character-escapes-in-regular-expressions

역시나 ^^; 찾을 수 없군요. (혹시, 해당 글자를 찾을 수 있는 방법을 아시는 분은 덧글 부탁드립니다.) 참고로, \x를 이용한 코드 값을 직접 주는 경우 2글자, \u를 이용한 코드 값은 4글자까지 가능합니다. 예를 들어, \x20은 가능하지만 \x020은 안 되고, \u로 시작하면 "\u03b1"등의 검색이 가능합니다.

재미있는 것은, Visual Studio Code에서는 \u202a로 검색이 됩니다.




할 수 없군요, 이제 마지막 남은 방법은 매크로 같은 함수를 만들어 쓰는 수밖에 없을 듯합니다. 예전에 소개했던 "Macros for Visual Studio"를 이용하면,

Visual Studio 2013/2015를 위한 "Macros for Visual Studio"
; https://www.sysnet.pe.kr/2/0/10980

다음과 같은 식으로 매크로 함수를 만들 수 있습니다.

/// <reference path="C:\Users\testusr\AppData\Local\Microsoft\VisualStudio\16.0_c5e17422\Macros\dte.js" />

if (dte.UndoContext.IsOpen)
    dte.UndoContext.Close();

try {
    dte.UndoContext.Open("RepaceControlCode");

    var document = dte.ActiveDocument.Object();
    var startPoint = document.StartPoint.CreateEditPoint();
    var endPoint = document.EndPoint.CreateEditPoint();
    var text = startPoint.GetText(endPoint);

    text = text.replace(/\u202a/g, '');
    
    var selObj = dte.ActiveDocument.Selection;
    selObj.SelectAll();

    selObj.Text = text;

} finally {
    dte.UndoContext.Close();
}

그런데, 문제가 있습니다. 위와 같이 하면 웬일인지 "selObj.Text = text" 코드 실행 시 시간이 너무 오래 걸립니다. 이상하군요, 어쨌든 오래 걸리므로 이것을 다음과 같이 우회해 구현할 수 있습니다.

/// <reference path="C:\Users\SeongTae Jeong\AppData\Local\Microsoft\VisualStudio\16.0_c5e17422\Macros\dte.js" />

if (dte.UndoContext.IsOpen)
    dte.UndoContext.Close();

try {
    dte.UndoContext.Open("RepaceControlCode");

    var document = dte.ActiveDocument.Object();
    var startPoint = document.StartPoint.CreateEditPoint();
    var endPoint = document.EndPoint.CreateEditPoint();
    var text = startPoint.GetText(endPoint);

    text = text.replace(/\u202a/g, '');
    
    var selObj = dte.ActiveDocument.Selection;
    selObj.SelectAll();

    // selObj.Text = text;

    selObj.Text = "";
    document.Selection.Insert(text, 1);

} finally {
    dte.UndoContext.Close();
}




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 3/12/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




1  2  3  4  5  6  7  [8]  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
13779정성태10/22/20245615개발 환경 구성: 729. WSL 2 - Mariner VM 커널 이미지 업데이트 방법
13778정성태10/21/20247135C/C++: 181. C/C++ - 소스코드 파일의 인코딩, 바이너리 모듈 상태의 인코딩
13777정성태10/20/20245564Windows: 265. Win32 API의 W(유니코드) 버전은 UCS-2일까요? UTF-16 인코딩일까요?
13776정성태10/19/20246609C/C++: 180. C++ - 고수준 FILE I/O 함수에서의 Unicode stream 모드(_O_WTEXT, _O_U16TEXT, _O_U8TEXT)파일 다운로드1
13775정성태10/19/20246639개발 환경 구성: 728. 윈도우 환경의 개발자를 위한 UTF-8 환경 설정
13774정성태10/18/20246194Linux: 91. Container 환경에서 출력하는 eBPF bpf_get_current_pid_tgid의 pid가 존재하지 않는 이유
13773정성태10/18/20245984Linux: 90. pid 네임스페이스 구성으로 본 WSL 2 + docker-desktop
13772정성태10/17/20246210Linux: 89. pid 네임스페이스 구성으로 본 WSL 2 배포본의 계층 관계
13771정성태10/17/20245957Linux: 88. WSL 2 리눅스 배포본 내에서의 pid 네임스페이스 구성
13770정성태10/17/20246430Linux: 87. ps + grep 조합에서 grep 명령어를 사용한 프로세스를 출력에서 제거하는 방법
13769정성태10/15/20247531Linux: 86. Golang + bpf2go를 사용한 eBPF 기본 예제파일 다운로드1
13768정성태10/15/20246804C/C++: 179. C++ - _O_WTEXT, _O_U16TEXT, _O_U8TEXT의 Unicode stream 모드파일 다운로드2
13767정성태10/14/20245726오류 유형: 929. bpftrace 수행 시 "ERROR: Could not resolve symbol: /proc/self/exe:BEGIN_trigger"
13766정성태10/14/20245183C/C++: 178. C++ - 파일에 대한 Text 모드의 "translated" 동작파일 다운로드1
13765정성태10/12/20246470오류 유형: 928. go build 시 "package maps is not in GOROOT" 오류
13764정성태10/11/20247045Linux: 85. Ubuntu - 원하는 golang 버전 설치
13763정성태10/11/20245939Linux: 84. WSL / Ubuntu 20.04 - bpftool 설치
13762정성태10/11/20246123Linux: 83. WSL / Ubuntu 22.04 - bpftool 설치
13761정성태10/11/20245811오류 유형: 927. WSL / Ubuntu - /usr/include/linux/types.h:5:10: fatal error: 'asm/types.h' file not found
13760정성태10/11/20246956Linux: 82. Ubuntu - clang 최신(stable) 버전 설치
13759정성태10/10/20247970C/C++: 177. C++ - 자유 함수(free function) 및 주소 지정 가능한 함수(addressable function) [6]
13758정성태10/8/20246647오류 유형: 926. dotnet tools를 sudo로 실행하는 경우 command not found
13757정성태10/8/20246964닷넷: 2306. Linux - dotnet tool의 설치 디렉터리가 PATH 환경변수에 자동 등록이 되는 이유
13756정성태10/8/20247149오류 유형: 925. ssh로 docker 접근을 할 때 "... malformed HTTP status code ..." 오류 발생
13755정성태10/7/20247705닷넷: 2305. C# 13 - (9) 메서드 바인딩의 우선순위를 지정하는 OverloadResolutionPriority 특성 도입 (Overload resolution priority)파일 다운로드1
13754정성태10/4/20246802닷넷: 2304. C# 13 - (8) 부분 메서드 정의를 속성 및 인덱서에도 확대파일 다운로드1
1  2  3  4  5  6  7  [8]  9  10  11  12  13  14  15  ...