Microsoft MVP성태의 닷넷 이야기
오류 유형: 804. 정규 표현식 오류 - Quantifier {x,y} following nothing. [링크 복사], [링크+제목 복사],
조회: 13559
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 

정규 표현식 오류 - Quantifier {x,y} following nothing.

실수로 작성한 정규 표현식이,

^(?)(.*?)(TEST)(.*?)$

자바에서는 그냥 돌아가지만,

import java.util.regex.*;

public class Main {
    public static void main(String[] args) {
        Pattern p = Pattern.compile("^(?)(.*?)(TEST)(.*?)$");
        Matcher m = p.matcher("TEST IS GOOD");
        System.out.println(m.matches());
    }
}

닷넷으로 옮겨 보면,

string pattern = @"^(?)(.*?)(TEST)(.*?)$";
Regex x = new Regex(pattern, RegexOptions.Compiled);

Console.WriteLine(x.Replace("TEST IS GOOD", "$1"));

이렇게 예외가 발생합니다.

Unhandled Exception: System.ArgumentException: parsing "^(?)(.*?)(TEST)(.*?)$" - Quantifier {x,y} following nothing.
   at System.Text.RegularExpressions.RegexParser.ScanRegex()
   at System.Text.RegularExpressions.RegexParser.Parse(String re, RegexOptions op)
   at System.Text.RegularExpressions.Regex..ctor(String pattern, RegexOptions options, TimeSpan matchTimeout, Boolean useCache)
   at System.Text.RegularExpressions.Regex..ctor(String pattern, RegexOptions options)
   at ConsoleApp1.Program.Main(String[] args)

문제가 되는 지점은 "(?)" 표현인데요, 물음표(?)의 의미가 정규 표현식에서 "{0, 1}"에 해당하는 것으로 앞선 문자에 대한 0 ~ 1개의 표현을 담당하는데, "(?)" 표현에서는 문자에 대한 지정이 없기 때문에 저런 오류가 발생하는 것입니다.

관련 표현을 파이썬과 같은 언어에서도 해도,

import re

p = re.compile("^(?)(.*?)(TEST)(.*?)$")
result = p.match("TEST IS GOOD")

print(result)

다음과 같이 예외가 발생합니다.

Traceback (most recent call last):
  File "C:\temp\PythonApplication1.py", line 4, in <module>
    p = re.compile("^(?)(.*?)(default\.aspx)(.*?)$")
  File "E:\Python38\lib\re.py", line 252, in compile
    return _compile(pattern, flags)
  File "E:\Python38\lib\re.py", line 304, in _compile
    p = sre_compile.compile(pattern, flags)
  File "E:\Python38\lib\sre_compile.py", line 764, in compile
    p = sre_parse.parse(p, flags)
  File "E:\Python38\lib\sre_parse.py", line 948, in parse
    p = _parse_sub(source, state, flags & SRE_FLAG_VERBOSE, 0)
  File "E:\Python38\lib\sre_parse.py", line 443, in _parse_sub
    itemsappend(_parse(source, state, verbose, nested + 1,
  File "E:\Python38\lib\sre_parse.py", line 823, in _parse
    raise source.error("unknown extension ?" + char,
re.error: unknown extension ?) at position 2

마찬가지의 문제입니다.




그러니까, 정규 표현식의 파싱이 언어들 간의 라이브러리에서 정확하지 않을 수 있음을 알아야 합니다.

참고로, (?) 실수는 처음에 대소문자 구분을 하지 않을(turn-on) 의도로 (?i) 표현을 쓴 것이 변한 것이었습니다.

What do `?i` and `?-i` in regex mean?
; https://stackoverflow.com/questions/15145659/what-do-i-and-i-in-regex-mean

그 외에 물음표가 사전 문자 필요 없이 사용되는 경우가 제법 많습니다.

Grouping Constructs in Regular Expressions
; https://learn.microsoft.com/en-us/dotnet/standard/base-types/grouping-constructs-in-regular-expressions#noncapturing-groups

그리고 저 내용 중에 look-around 관련한 사례는 예전에 설명한 적이 있습니다. ^^

특정 단어로 시작하거나/끝나는 문자열을 포함/제외하는 정규 표현식 - Look-around
; https://www.sysnet.pe.kr/2/0/12734





[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 4/27/2023]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




... 16  17  18  19  20  21  22  23  24  25  [26]  27  28  29  30  ...
NoWriterDateCnt.TitleFile(s)
13287정성태3/16/202311637Windows: 229. Win32 - 대화창 템플릿의 2진 리소스를 읽어들여 윈도우를 직접 띄우는 방법파일 다운로드1
13286정성태3/15/202312056Windows: 228. Win32 - 리소스에 포함된 대화창 Template의 2진 코드 해석 방법
13285정성태3/14/202311438Windows: 227. Win32 C/C++ - Dialog Procedure를 재정의하는 방법 [2]파일 다운로드1
13284정성태3/13/202311309Windows: 226. Win32 C/C++ - Dialog에서 값을 반환하는 방법파일 다운로드1
13283정성태3/12/202310126오류 유형: 852. 파이썬 - TypeError: coercing to Unicode: need string or buffer, NoneType found
13282정성태3/12/202310523Linux: 58. WSL - nohup 옵션이 필요한 경우
13281정성태3/12/202311176Windows: 225. 윈도우 바탕화면의 아이콘들이 넓게 퍼지는 경우 [2]
13280정성태3/9/202312671개발 환경 구성: 670. WSL 2에서 호스팅 중인 TCP 서버를 외부에서 접근하는 방법
13279정성태3/9/202312127오류 유형: 851. 파이썬 ModuleNotFoundError: No module named '_cffi_backend'
13278정성태3/8/202311920개발 환경 구성: 669. WSL 2의 (init이 아닌) systemd 지원 [1]
13277정성태3/6/202313245개발 환경 구성: 668. 코드 사인용 인증서 신청 및 적용 방법(예: Digicert)
13276정성태3/5/202312793.NET Framework: 2102. C# 11 - ref struct/ref field를 위해 새롭게 도입된 scoped 예약어 [1]
13275정성태3/3/202312737.NET Framework: 2101. C# 11의 ref 필드 설명
13274정성태3/2/202311990.NET Framework: 2100. C# - ref 필드로 ref struct 타입을 허용하지 않는 이유
13273정성태2/28/202310980.NET Framework: 2099. C# - 관리 포인터로서의 ref 예약어 의미
13272정성태2/27/202311879오류 유형: 850. SSMS - mdf 파일을 Attach 시킬 때 Operating system error 5: "5(Access is denied.)" 에러
13271정성태2/25/202311678오류 유형: 849. Sql Server Configuration Manager가 시작 메뉴에 없는 경우
13270정성태2/24/202310987.NET Framework: 2098. dotnet build에 /p 옵션을 적용 시 유의점
13269정성태2/23/202312355스크립트: 46. 파이썬 - uvicorn의 콘솔 출력을 UDP로 전송
13268정성태2/22/202312780개발 환경 구성: 667. WSL 2 내부에서 열고 있는 UDP 서버를 호스트 측에서 접속하는 방법
13267정성태2/21/202313112.NET Framework: 2097. C# - 비동기 소켓 사용 시 메모리 해제가 finalizer 단계에서 발생하는 사례파일 다운로드1
13266정성태2/20/202312416오류 유형: 848. .NET Core/5+ - Process terminated. Couldn't find a valid ICU package installed on the system
13265정성태2/18/202312869.NET Framework: 2096. .NET Core/5+ - PublishSingleFile 유형에 대한 runtimeconfig.json 설정
13264정성태2/17/202314836스크립트: 45. 파이썬 - uvicorn 사용자 정의 Logger 작성
13263정성태2/16/202312120개발 환경 구성: 666. 최신 버전의 ilasm.exe/ildasm.exe 사용하는 방법
13262정성태2/15/202313507디버깅 기술: 191. dnSpy를 이용한 (소스 코드가 없는) 닷넷 응용 프로그램 디버깅 방법 [1]
... 16  17  18  19  20  21  22  23  24  25  [26]  27  28  29  30  ...