Microsoft MVP성태의 닷넷 이야기
오류 유형: 804. 정규 표현식 오류 - Quantifier {x,y} following nothing. [링크 복사], [링크+제목 복사],
조회: 14311
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 

정규 표현식 오류 - Quantifier {x,y} following nothing.

실수로 작성한 정규 표현식이,

^(?)(.*?)(TEST)(.*?)$

자바에서는 그냥 돌아가지만,

import java.util.regex.*;

public class Main {
    public static void main(String[] args) {
        Pattern p = Pattern.compile("^(?)(.*?)(TEST)(.*?)$");
        Matcher m = p.matcher("TEST IS GOOD");
        System.out.println(m.matches());
    }
}

닷넷으로 옮겨 보면,

string pattern = @"^(?)(.*?)(TEST)(.*?)$";
Regex x = new Regex(pattern, RegexOptions.Compiled);

Console.WriteLine(x.Replace("TEST IS GOOD", "$1"));

이렇게 예외가 발생합니다.

Unhandled Exception: System.ArgumentException: parsing "^(?)(.*?)(TEST)(.*?)$" - Quantifier {x,y} following nothing.
   at System.Text.RegularExpressions.RegexParser.ScanRegex()
   at System.Text.RegularExpressions.RegexParser.Parse(String re, RegexOptions op)
   at System.Text.RegularExpressions.Regex..ctor(String pattern, RegexOptions options, TimeSpan matchTimeout, Boolean useCache)
   at System.Text.RegularExpressions.Regex..ctor(String pattern, RegexOptions options)
   at ConsoleApp1.Program.Main(String[] args)

문제가 되는 지점은 "(?)" 표현인데요, 물음표(?)의 의미가 정규 표현식에서 "{0, 1}"에 해당하는 것으로 앞선 문자에 대한 0 ~ 1개의 표현을 담당하는데, "(?)" 표현에서는 문자에 대한 지정이 없기 때문에 저런 오류가 발생하는 것입니다.

관련 표현을 파이썬과 같은 언어에서도 해도,

import re

p = re.compile("^(?)(.*?)(TEST)(.*?)$")
result = p.match("TEST IS GOOD")

print(result)

다음과 같이 예외가 발생합니다.

Traceback (most recent call last):
  File "C:\temp\PythonApplication1.py", line 4, in <module>
    p = re.compile("^(?)(.*?)(default\.aspx)(.*?)$")
  File "E:\Python38\lib\re.py", line 252, in compile
    return _compile(pattern, flags)
  File "E:\Python38\lib\re.py", line 304, in _compile
    p = sre_compile.compile(pattern, flags)
  File "E:\Python38\lib\sre_compile.py", line 764, in compile
    p = sre_parse.parse(p, flags)
  File "E:\Python38\lib\sre_parse.py", line 948, in parse
    p = _parse_sub(source, state, flags & SRE_FLAG_VERBOSE, 0)
  File "E:\Python38\lib\sre_parse.py", line 443, in _parse_sub
    itemsappend(_parse(source, state, verbose, nested + 1,
  File "E:\Python38\lib\sre_parse.py", line 823, in _parse
    raise source.error("unknown extension ?" + char,
re.error: unknown extension ?) at position 2

마찬가지의 문제입니다.




그러니까, 정규 표현식의 파싱이 언어들 간의 라이브러리에서 정확하지 않을 수 있음을 알아야 합니다.

참고로, (?) 실수는 처음에 대소문자 구분을 하지 않을(turn-on) 의도로 (?i) 표현을 쓴 것이 변한 것이었습니다.

What do `?i` and `?-i` in regex mean?
; https://stackoverflow.com/questions/15145659/what-do-i-and-i-in-regex-mean

그 외에 물음표가 사전 문자 필요 없이 사용되는 경우가 제법 많습니다.

Grouping Constructs in Regular Expressions
; https://learn.microsoft.com/en-us/dotnet/standard/base-types/grouping-constructs-in-regular-expressions#noncapturing-groups

그리고 저 내용 중에 look-around 관련한 사례는 예전에 설명한 적이 있습니다. ^^

특정 단어로 시작하거나/끝나는 문자열을 포함/제외하는 정규 표현식 - Look-around
; https://www.sysnet.pe.kr/2/0/12734





[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 4/27/2023]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




... 31  32  [33]  34  35  36  37  38  39  40  41  42  43  44  45  ...
NoWriterDateCnt.TitleFile(s)
13148정성태10/26/202215274오류 유형: 824. msbuild 에러 - error NETSDK1005: Assets file '...\project.assets.json' doesn't have a target for 'net5.0'. Ensure that restore has run and that you have included 'net5.0' in the TargetFramew
13147정성태10/25/202214475오류 유형: 823. Visual Studio 2022 - Unable to attach to CoreCLR. The debugger's protocol is incompatible with the debuggee.
13146정성태10/24/202215870.NET Framework: 2060. C# - Java의 Xmx와 유사한 힙 메모리 최댓값 제어 옵션 HeapHardLimit
13145정성태10/21/202215892오류 유형: 822. db2 - Password validation for user db2inst1 failed with rc = -2146500508
13144정성태10/20/202216194.NET Framework: 2059. ClrMD를 이용해 윈도우 환경의 메모리 덤프로부터 닷넷 모듈을 추출하는 방법파일 다운로드1
13143정성태10/19/202216948오류 유형: 821. windbg/sos - Error code - 0x000021BE
13142정성태10/18/202222002도서: 시작하세요! C# 12 프로그래밍
13141정성태10/17/202217329.NET Framework: 2058. [in,out] 배열을 C#에서 C/C++로 넘기는 방법 - 세 번째 이야기파일 다운로드1
13140정성태10/11/202217174C/C++: 159. C/C++ - 리눅스 환경에서 u16string 문자열을 출력하는 방법 [2]
13139정성태10/9/202214748.NET Framework: 2057. 리눅스 환경의 .NET Core 3/5+ 메모리 덤프로부터 모든 닷넷 모듈을 추출하는 방법파일 다운로드1
13138정성태10/8/202217673.NET Framework: 2056. C# - await 비동기 호출을 기대한 메서드가 동기로 호출되었을 때의 부작용 [1]
13137정성태10/8/202215779.NET Framework: 2055. 리눅스 환경의 .NET Core 3/5+ 메모리 덤프로부터 닷넷 모듈을 추출하는 방법
13136정성태10/7/202215874.NET Framework: 2054. .NET Core/5+ SDK 설치 없이 dotnet-dump 사용하는 방법
13135정성태10/5/202216672.NET Framework: 2053. 리눅스 환경의 .NET Core 3/5+ 메모리 덤프를 분석하는 방법 - 두 번째 이야기 [1]
13134정성태10/4/202213097오류 유형: 820. There is a problem with AMD Radeon RX 5600 XT device. For more information, search for 'graphics device driver error code 31'
13133정성태10/4/202214650Windows: 211. Windows - (commit이 아닌) reserved 메모리 사용량 확인 방법 [1]
13132정성태10/3/202214652스크립트: 42. 파이썬 - latexify-py 패키지 소개 - 함수를 mathjax 식으로 표현
13131정성태10/3/202218373.NET Framework: 2052. C# - Windows Forms의 데이터 바인딩 지원(DataBinding, DataSource) [2]파일 다운로드1
13130정성태9/28/202214498.NET Framework: 2051. .NET Core/5+ - 에러 로깅을 위한 Middleware가 동작하지 않는 경우파일 다운로드1
13129정성태9/27/202215137.NET Framework: 2050. .NET Core를 IIS에서 호스팅하는 경우 .NET Framework CLR이 함께 로드되는 환경
13128정성태9/23/202218055C/C++: 158. Visual C++ - IDL 구문 중 "unsigned long"을 인식하지 못하는 #import [1]파일 다운로드1
13127정성태9/22/202216475Windows: 210. WSL에 systemd 도입
13126정성태9/15/202216750.NET Framework: 2049. C# 11 - 정적 메서드에 대한 delegate 처리 시 cache 적용
13125정성태9/14/202217057.NET Framework: 2048. C# 11 - 구조체 필드의 자동 초기화(auto-default structs)
13124정성태9/13/202217238.NET Framework: 2047. Golang, Python, C#에서의 CRC32 사용
13123정성태9/8/202217158.NET Framework: 2046. C# 11 - 멤버(속성/필드)에 지정할 수 있는 required 예약어 추가
... 31  32  [33]  34  35  36  37  38  39  40  41  42  43  44  45  ...