Microsoft MVP성태의 닷넷 이야기
오류 유형: 804. 정규 표현식 오류 - Quantifier {x,y} following nothing. [링크 복사], [링크+제목 복사],
조회: 18756
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 

정규 표현식 오류 - Quantifier {x,y} following nothing.

실수로 작성한 정규 표현식이,

^(?)(.*?)(TEST)(.*?)$

자바에서는 그냥 돌아가지만,

import java.util.regex.*;

public class Main {
    public static void main(String[] args) {
        Pattern p = Pattern.compile("^(?)(.*?)(TEST)(.*?)$");
        Matcher m = p.matcher("TEST IS GOOD");
        System.out.println(m.matches());
    }
}

닷넷으로 옮겨 보면,

string pattern = @"^(?)(.*?)(TEST)(.*?)$";
Regex x = new Regex(pattern, RegexOptions.Compiled);

Console.WriteLine(x.Replace("TEST IS GOOD", "$1"));

이렇게 예외가 발생합니다.

Unhandled Exception: System.ArgumentException: parsing "^(?)(.*?)(TEST)(.*?)$" - Quantifier {x,y} following nothing.
   at System.Text.RegularExpressions.RegexParser.ScanRegex()
   at System.Text.RegularExpressions.RegexParser.Parse(String re, RegexOptions op)
   at System.Text.RegularExpressions.Regex..ctor(String pattern, RegexOptions options, TimeSpan matchTimeout, Boolean useCache)
   at System.Text.RegularExpressions.Regex..ctor(String pattern, RegexOptions options)
   at ConsoleApp1.Program.Main(String[] args)

문제가 되는 지점은 "(?)" 표현인데요, 물음표(?)의 의미가 정규 표현식에서 "{0, 1}"에 해당하는 것으로 앞선 문자에 대한 0 ~ 1개의 표현을 담당하는데, "(?)" 표현에서는 문자에 대한 지정이 없기 때문에 저런 오류가 발생하는 것입니다.

관련 표현을 파이썬과 같은 언어에서도 해도,

import re

p = re.compile("^(?)(.*?)(TEST)(.*?)$")
result = p.match("TEST IS GOOD")

print(result)

다음과 같이 예외가 발생합니다.

Traceback (most recent call last):
  File "C:\temp\PythonApplication1.py", line 4, in <module>
    p = re.compile("^(?)(.*?)(default\.aspx)(.*?)$")
  File "E:\Python38\lib\re.py", line 252, in compile
    return _compile(pattern, flags)
  File "E:\Python38\lib\re.py", line 304, in _compile
    p = sre_compile.compile(pattern, flags)
  File "E:\Python38\lib\sre_compile.py", line 764, in compile
    p = sre_parse.parse(p, flags)
  File "E:\Python38\lib\sre_parse.py", line 948, in parse
    p = _parse_sub(source, state, flags & SRE_FLAG_VERBOSE, 0)
  File "E:\Python38\lib\sre_parse.py", line 443, in _parse_sub
    itemsappend(_parse(source, state, verbose, nested + 1,
  File "E:\Python38\lib\sre_parse.py", line 823, in _parse
    raise source.error("unknown extension ?" + char,
re.error: unknown extension ?) at position 2

마찬가지의 문제입니다.




그러니까, 정규 표현식의 파싱이 언어들 간의 라이브러리에서 정확하지 않을 수 있음을 알아야 합니다.

참고로, (?) 실수는 처음에 대소문자 구분을 하지 않을(turn-on) 의도로 (?i) 표현을 쓴 것이 변한 것이었습니다.

What do `?i` and `?-i` in regex mean?
; https://stackoverflow.com/questions/15145659/what-do-i-and-i-in-regex-mean

그 외에 물음표가 사전 문자 필요 없이 사용되는 경우가 제법 많습니다.

Grouping Constructs in Regular Expressions
; https://learn.microsoft.com/en-us/dotnet/standard/base-types/grouping-constructs-in-regular-expressions#noncapturing-groups

그리고 저 내용 중에 look-around 관련한 사례는 예전에 설명한 적이 있습니다. ^^

특정 단어로 시작하거나/끝나는 문자열을 포함/제외하는 정규 표현식 - Look-around
; https://www.sysnet.pe.kr/2/0/12734





[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 4/27/2023]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




... [61]  62  63  64  65  66  67  68  69  70  71  72  73  74  75  ...
NoWriterDateCnt.TitleFile(s)
12529정성태2/4/202123737개발 환경 구성: 535. Wireshark + C#으로 확인하는 TCP 통신의 MIN RTO [1]
12528정성태2/1/202124345개발 환경 구성: 534. Wireshark + C#으로 확인하는 TCP 통신의 MSS(Maximum Segment Size) - 윈도우 환경
12527정성태2/1/202124110개발 환경 구성: 533. Wireshark + C#으로 확인하는 TCP 통신의 MSS(Maximum Segment Size) - 리눅스 환경파일 다운로드1
12526정성태2/1/202120991개발 환경 구성: 532. Azure Devops의 파이프라인 빌드 시 snk 파일 다루는 방법 - Secure file
12525정성태2/1/202119529개발 환경 구성: 531. Azure Devops - 파이프라인 실행 시 빌드 이벤트를 생략하는 방법
12524정성태1/31/202119187개발 환경 구성: 530. 기존 github 프로젝트를 Azure Devops의 빌드 Pipeline에 연결하는 방법 [1]
12523정성태1/31/202122193개발 환경 구성: 529. 기존 github 프로젝트를 Azure Devops의 Board에 연결하는 방법
12522정성태1/31/202124797개발 환경 구성: 528. 오라클 클라우드의 리눅스 VM - 9000 MTU Jumbo Frame 테스트
12521정성태1/31/202121861개발 환경 구성: 527. 이더넷(Ethernet) 환경의 TCP 통신에서 MSS(Maximum Segment Size) 확인 [1]
12520정성태1/30/202120884개발 환경 구성: 526. 오라클 클라우드의 VM에 ping ICMP 여는 방법
12519정성태1/30/202120594개발 환경 구성: 525. 오라클 클라우드의 VM을 외부에서 접근하기 위해 포트 여는 방법
12518정성태1/30/202138954Linux: 37. Ubuntu에 Wireshark 설치 [2]
12517정성태1/30/202125560Linux: 36. 윈도우 클라이언트에서 X2Go를 이용한 원격 리눅스의 GUI 접속 - 우분투 20.04
12516정성태1/29/202122443Windows: 188. Windows - TCP default template 설정 방법
12515정성태1/28/202124598웹: 41. Microsoft Edge - localhost에 대해 http 접근 시 무조건 https로 바뀌는 문제 [3]
12514정성태1/28/202124899.NET Framework: 1021. C# - 일렉트론 닷넷(Electron.NET) 소개 [1]파일 다운로드1
12513정성태1/28/202120107오류 유형: 698. electronize - User Profile 디렉터리에 공백 문자가 있는 경우 빌드가 실패하는 문제 [1]
12512정성태1/28/202123530오류 유형: 697. The program can't start because VCRUNTIME140.dll is missing from your computer. Try reinstalling the program to fix this problem.
12511정성태1/27/202122592Windows: 187. Windows - 도스 시절의 8.3 경로를 알아내는 방법
12510정성태1/27/202123079.NET Framework: 1020. .NET Core Kestrel 호스팅 - Razor 지원 추가 [1]파일 다운로드1
12509정성태1/27/202120993개발 환경 구성: 524. Jupyter Notebook에서 C#(F#, PowerShell) 언어 사용을 위한 환경 구성 [3]
12508정성태1/27/202122545개발 환경 구성: 523. Jupyter Notebook - Slide 플레이 버튼이 없는 경우
12507정성태1/26/202122547VS.NET IDE: 157. Visual Studio - Syntax Visualizer 메뉴가 없는 경우
12506정성태1/25/202125987.NET Framework: 1019. Microsoft.Tye 기본 사용법 소개 [1]
12505정성태1/23/202120573.NET Framework: 1018. .NET Core Kestrel 호스팅 - Web API 추가 [1]파일 다운로드1
12504정성태1/23/202124312.NET Framework: 1017. .NET 5에서의 네트워크 라이브러리 개선 (2) - HTTP/2, HTTP/3 관련 [1]
... [61]  62  63  64  65  66  67  68  69  70  71  72  73  74  75  ...