Microsoft MVP성태의 닷넷 이야기
오류 유형: 804. 정규 표현식 오류 - Quantifier {x,y} following nothing. [링크 복사], [링크+제목 복사],
조회: 6548
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 

정규 표현식 오류 - Quantifier {x,y} following nothing.

실수로 작성한 정규 표현식이,

^(?)(.*?)(TEST)(.*?)$

자바에서는 그냥 돌아가지만,

import java.util.regex.*;

public class Main {
    public static void main(String[] args) {
        Pattern p = Pattern.compile("^(?)(.*?)(TEST)(.*?)$");
        Matcher m = p.matcher("TEST IS GOOD");
        System.out.println(m.matches());
    }
}

닷넷으로 옮겨 보면,

string pattern = @"^(?)(.*?)(TEST)(.*?)$";
Regex x = new Regex(pattern, RegexOptions.Compiled);

Console.WriteLine(x.Replace("TEST IS GOOD", "$1"));

이렇게 예외가 발생합니다.

Unhandled Exception: System.ArgumentException: parsing "^(?)(.*?)(TEST)(.*?)$" - Quantifier {x,y} following nothing.
   at System.Text.RegularExpressions.RegexParser.ScanRegex()
   at System.Text.RegularExpressions.RegexParser.Parse(String re, RegexOptions op)
   at System.Text.RegularExpressions.Regex..ctor(String pattern, RegexOptions options, TimeSpan matchTimeout, Boolean useCache)
   at System.Text.RegularExpressions.Regex..ctor(String pattern, RegexOptions options)
   at ConsoleApp1.Program.Main(String[] args)

문제가 되는 지점은 "(?)" 표현인데요, 물음표(?)의 의미가 정규 표현식에서 "{0, 1}"에 해당하는 것으로 앞선 문자에 대한 0 ~ 1개의 표현을 담당하는데, "(?)" 표현에서는 문자에 대한 지정이 없기 때문에 저런 오류가 발생하는 것입니다.

관련 표현을 파이썬과 같은 언어에서도 해도,

import re

p = re.compile("^(?)(.*?)(TEST)(.*?)$")
result = p.match("TEST IS GOOD")

print(result)

다음과 같이 예외가 발생합니다.

Traceback (most recent call last):
  File "C:\temp\PythonApplication1.py", line 4, in <module>
    p = re.compile("^(?)(.*?)(default\.aspx)(.*?)$")
  File "E:\Python38\lib\re.py", line 252, in compile
    return _compile(pattern, flags)
  File "E:\Python38\lib\re.py", line 304, in _compile
    p = sre_compile.compile(pattern, flags)
  File "E:\Python38\lib\sre_compile.py", line 764, in compile
    p = sre_parse.parse(p, flags)
  File "E:\Python38\lib\sre_parse.py", line 948, in parse
    p = _parse_sub(source, state, flags & SRE_FLAG_VERBOSE, 0)
  File "E:\Python38\lib\sre_parse.py", line 443, in _parse_sub
    itemsappend(_parse(source, state, verbose, nested + 1,
  File "E:\Python38\lib\sre_parse.py", line 823, in _parse
    raise source.error("unknown extension ?" + char,
re.error: unknown extension ?) at position 2

마찬가지의 문제입니다.




그러니까, 정규 표현식의 파싱이 언어들 간의 라이브러리에서 정확하지 않을 수 있음을 알아야 합니다.

참고로, (?) 실수는 처음에 대소문자 구분을 하지 않을(turn-on) 의도로 (?i) 표현을 쓴 것이 변한 것이었습니다.

What do `?i` and `?-i` in regex mean?
; https://stackoverflow.com/questions/15145659/what-do-i-and-i-in-regex-mean

그 외에 물음표가 사전 문자 필요 없이 사용되는 경우가 제법 많습니다.

Grouping Constructs in Regular Expressions
; https://learn.microsoft.com/en-us/dotnet/standard/base-types/grouping-constructs-in-regular-expressions#noncapturing-groups

그리고 저 내용 중에 look-around 관련한 사례는 예전에 설명한 적이 있습니다. ^^

특정 단어로 시작하거나/끝나는 문자열을 포함/제외하는 정규 표현식 - Look-around
; https://www.sysnet.pe.kr/2/0/12734





[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 4/27/2023]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




... 16  17  18  19  20  [21]  22  23  24  25  26  27  28  29  30  ...
NoWriterDateCnt.TitleFile(s)
13112정성태7/30/20228302.NET Framework: 2037. C# 11 - 목록 패턴(List patterns) [1]파일 다운로드1
13111정성태7/29/20228064.NET Framework: 2036. C# 11 - IntPtr/UIntPtr과 nint/nuint의 통합파일 다운로드1
13110정성태7/27/20228106.NET Framework: 2035. C# 11 - 새로운 연산자 ">>>" (Unsigned Right Shift)파일 다운로드1
13109정성태7/27/20229544VS.NET IDE: 177. 비주얼 스튜디오 2022를 이용한 (소스 코드가 없는) 닷넷 모듈 디버깅 - "외부 원본(External Sources)" [1]
13108정성태7/26/20227506Linux: 53. container에 실행 중인 Golang 프로세스를 디버깅하는 방법 [1]
13107정성태7/25/20226717Linux: 52. Debian/Ubuntu 계열의 docker container에서 자주 설치하게 되는 명령어
13106정성태7/24/20226407오류 유형: 819. 닷넷 6 프로젝트의 "Conditional compilation symbols" 기본값 오류
13105정성태7/23/20227708.NET Framework: 2034. .NET Core/5+ 환경에서 (프로젝트가 아닌) C# 코드 파일을 입력으로 컴파일하는 방법 - 두 번째 이야기 [1]
13104정성태7/23/202210811Linux: 51. WSL - init에서 systemd로 전환하는 방법
13103정성태7/22/20227325오류 유형: 818. WSL - systemd-genie와 관련한 2가지(systemd-remount-fs.service, multipathd.socket) 에러
13102정성태7/19/20226726.NET Framework: 2033. .NET Core/5+에서는 구할 수 없는 HttpRuntime.AppDomainAppId
13101정성태7/15/202215641도서: 시작하세요! C# 10 프로그래밍
13100정성태7/15/20228091.NET Framework: 2032. C# 11 - shift 연산자 재정의에 대한 제약 완화 (Relaxing Shift Operator)
13099정성태7/14/20227968.NET Framework: 2031. C# 11 - 사용자 정의 checked 연산자파일 다운로드1
13098정성태7/13/20226205개발 환경 구성: 647. Azure - scale-out 상태의 App Service에서 특정 인스턴스에 요청을 보내는 방법 [1]
13097정성태7/12/20225579오류 유형: 817. Golang - binary.Read: invalid type int32
13096정성태7/8/20228471.NET Framework: 2030. C# 11 - UTF-8 문자열 리터럴
13095정성태7/7/20226533Windows: 208. AD 도메인에 참여하지 않은 컴퓨터에서 Kerberos 인증을 사용하는 방법
13094정성태7/6/20226277오류 유형: 816. Golang - "short write" 오류 원인
13093정성태7/5/20227168.NET Framework: 2029. C# - HttpWebRequest로 localhost 접속 시 2초 이상 지연
13092정성태7/3/20228146.NET Framework: 2028. C# - HttpWebRequest의 POST 동작 방식파일 다운로드1
13091정성태7/3/20226945.NET Framework: 2027. C# - IPv4, IPv6를 모두 지원하는 서버 소켓 생성 방법
13090정성태6/29/20226117오류 유형: 815. PyPI에 업로드한 패키지가 반영이 안 되는 경우
13089정성태6/28/20226565개발 환경 구성: 646. HOSTS 파일 변경 시 Edge 브라우저에 반영하는 방법
13088정성태6/27/20225622개발 환경 구성: 645. "Developer Command Prompt for VS 2022" 명령행 환경의 폰트를 바꾸는 방법
13087정성태6/23/20228632스크립트: 41. 파이썬 - FastAPI / uvicorn 호스팅 환경에서 asyncio 사용하는 방법 [1]
... 16  17  18  19  20  [21]  22  23  24  25  26  27  28  29  30  ...