Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 
(연관된 글이 1개 있습니다.)

Logstash - 사용자 정의 grok 패턴 추가를 이용한 IIS 로그 처리

기본을 익혔으니,

Logstash 기본 사용법
; https://www.sysnet.pe.kr/2/0/12312

IIS 로그를 Logstash로 처리하는 방법을 다뤄보겠습니다. 아쉽지만, Logstash가 제공하는 기본 grok 패턴 중에는,

logstash/patterns/grok-patterns
; https://github.com/elastic/logstash/blob/v1.4.2/patterns/grok-patterns

(아파치는 있지만) IIS 용이 없습니다. 사실, 이것은 당연한 것일 수 있는데 왜냐하면 IIS의 로그는 항목 종류를 사용자 정의할 수 있기 때문입니다. 예를 들어 IIS 로그 용의 패턴을 검색해 보면,

mrlesmithjr/logstash.conf
; https://gist.github.com/mrlesmithjr/72e99caf36fcc2b5d323

다음과 같은 형식을 구할 수 있는데,

grok {
        match => [
                "message", "%{TIMESTAMP_ISO8601:logtime} %{IPORHOST:hostname} %{URIPROTO:cs_method} %{URIPATH:cs_stem} (?:%{NOTSPACE:cs_query}|-) %{NUMBER:src_port} %{NOTSPACE:cs_username} %{IP:clientip} %{NOTSPACE:cs_useragent} %{NUMBER:sc_status} %{NUMBER:sc_subresponse} %{NUMBER:sc_win32_status} %{NUMBER:timetaken}"
        ]
}

제가 가진 테스트 서버의 IIS 로그(test.log)는 다음과 같은 형식이라서,

#Software: Microsoft Internet Information Services 10.0
#Version: 1.0
#Date: 2019-08-28 00:00:43
#Fields: date time s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs(User-Agent) cs(Referer) sc-status sc-substatus sc-win32-status time-taken
2019-08-28 00:00:43 ::1 GET / - 8010 - ::1 Mozilla+(http://localhost:8010/.0) - 200 0 0 18
2018-12-20 04:35:30 127.0.0.1 GET /WCFs/TestCall.svc - 80 - 127.0.0.1 Mozilla/5.0+(Windows+NT+10.0;+WOW64;+Trident/7.0;+rv:11.0)+like+Gecko - 404 0 0 9744

"cs(Referer)"에 대한 항목이 없어 정상적인 파싱이 되지 않습니다. 따라서, 저한테 맞는 grok 패턴을 적용하기 위해서는 그에 대한 변경을 해야 합니다.

"message", "%{TIMESTAMP_ISO8601:logtime} %{IPORHOST:hostname} %{URIPROTO:cs_method} %{URIPATH:cs_stem} (?:%{NOTSPACE:cs_query}|-) %{NUMBER:src_port} %{NOTSPACE:cs_username} %{IP:clientip} %{NOTSPACE:cs_useragent} %{NOTSPACE:cs_referer} %{NUMBER:sc_status} %{NUMBER:sc_subresponse} %{NUMBER:sc_win32_status} %{NUMBER:timetaken}"


input {
    tcp {
        port => 9900
        type => "iis"
    }
}

filter {
    if [type] == "iis" {
        if [message] =~ "^#" {
            drop {}
        }

        grok {
            match => {
                 message => "%{TIMESTAMP_ISO8601:logtime} %{IPORHOST:hostname} %{URIPROTO:cs_method} %{URIPATH:cs_stem} (?:%{NOTSPACE:cs_query}|-) %{NUMBER:src_port} %{NOTSPACE:cs_username} %{IP:clientip} %{NOTSPACE:cs_useragent} %{NOTSPACE:cs_referer} %{NUMBER:sc_status} %{NUMBER:sc_subresponse} %{NUMBER:sc_win32_status} %{NUMBER:timetaken}"
            }
        }
    }
}

output {
    stdout { }
}

테스트를 해보면,

C:\logstash\config> type test.log | netcat localhost 9900

정상 동작하는 것을 볼 수 있습니다.

{
               "port" => 54505,
         "@timestamp" => 2020-09-06T06:49:14.428Z,
               "host" => "0:0:0:0:0:0:0:1",
               "type" => "iis",
          "timetaken" => "9744",
         "cs_referer" => "-",
            "cs_stem" => "/WCFs/TestCall.svc",
           "src_port" => "80",
    "sc_win32_status" => "0",
           "cs_query" => "-",
           "clientip" => "127.0.0.1",
           "hostname" => "127.0.0.1",
        "cs_username" => "-",
          "cs_method" => "GET",
           "@version" => "1",
          "sc_status" => "404",
       "cs_useragent" => "Mozilla/5.0+(Windows+NT+10.0;+WOW64;+Trident/7.0;+rv:11.0)+like+Gecko",
     "sc_subresponse" => "0",
            "logtime" => "2018-12-20 04:35:30",
            "message" => "2018-12-20 04:35:30 127.0.0.1 GET /WCFs/TestCall.svc - 80 - 127.0.0.1 Mozilla/5.0+(Windows+NT+10.0;+WOW64;+Trident/7.0;+rv:11.0)+like+Gecko - 404 0 0 9744\r"
}
{
               "port" => 54505,
         "@timestamp" => 2020-09-06T06:49:14.428Z,
               "host" => "0:0:0:0:0:0:0:1",
               "type" => "iis",
          "timetaken" => "18",
         "cs_referer" => "-",
            "cs_stem" => "/",
           "src_port" => "8010",
    "sc_win32_status" => "0",
           "cs_query" => "-",
           "clientip" => "::1",
           "hostname" => "::1",
        "cs_username" => "-",
          "cs_method" => "GET",
           "@version" => "1",
          "sc_status" => "200",
       "cs_useragent" => "Mozilla+(http://localhost:8010/.0)",
     "sc_subresponse" => "0",
            "logtime" => "2019-08-28 00:00:43",
            "message" => "2019-08-28 00:00:43 ::1 GET / - 8010 - ::1 Mozilla+(http://localhost:8010/.0) - 200 0 0 18\r"
}

결국, 여러분들의 IIS 출력 로그의 형식과 grok 패턴이 일치하는지 꼭 확인해야 합니다.




여기서 끝내면 조금 아쉬우니 ^^ 좀 더 다뤄보겠습니다. 가령, 여러분들이 원하는 것은 elasticsearch로 출력하는 것이고 저장소를 절약하기 위해 출력으로 "timetaken", "cs_referer", "cs_stem" 항목만 원한다고 가정해 보겠습니다. 그럼 파이프라인을 이렇게 변경해 주면 됩니다.

input {
    tcp {
        port => 9900
        type => "iis"
    }
}

filter {
    if [type] == "iis" {
        if [message] =~ "^#" {
            drop {}
        }

        grok {
            match => {
                message => "%{TIMESTAMP_ISO8601:logtime} %{IPORHOST:hostname} %{URIPROTO:cs_method} %{URIPATH:cs_stem} (?:%{NOTSPACE:cs_query}|-) %{NUMBER:src_port} %{NOTSPACE:cs_username} %{IP:clientip} %{NOTSPACE:cs_useragent} %{NOTSPACE:cs_referer} %{NUMBER:sc_status} %{NUMBER:sc_subresponse} %{NUMBER:sc_win32_status} %{NUMBER:timetaken}"
            }
        }

        mutate { 
            remove_field => [ "logtime", "hostname", "cs_method", "cs_query",
                              "src_port", "cs_username", "clientip", "cs_useragent", "sc_status", 
                              "sc_subresponse", "sc_win32_status", 
                              "message"
                            ] 
        }
    }
}

output {
    elasticsearch {
        hosts => ["localhost:9200"]
    }

    stdout { }
}

mutate + remove_field를 이용해 출력의 필드를 조정했고, 가공된 메시지에 대한 출력을 2군데(elasticsearch, stdout)로 조정했으니 이제 elasticsearch에도 저장이 되면서 콘솔에서도 결과를 확인할 수 있습니다.

{
          "port" => 54990,
    "@timestamp" => 2020-09-06T07:07:56.071Z,
          "host" => "0:0:0:0:0:0:0:1",
     "timetaken" => "18",
    "cs_referer" => "-",
       "cs_stem" => "/",
      "@version" => "1",
          "type" => "iis"
}
{
          "port" => 54990,
    "@timestamp" => 2020-09-06T07:07:56.071Z,
          "host" => "0:0:0:0:0:0:0:1",
     "timetaken" => "9744",
    "cs_referer" => "-",
       "cs_stem" => "/WCFs/TestCall.svc",
      "@version" => "1",
          "type" => "iis"
}




그런데, cs_referer의 경우 가만 보니 "NOTSPACE"보다는 "URI" 형식이 더 맞을 것 같습니다.

message => "%{TIMESTAMP_ISO8601:logtime} %{IPORHOST:hostname} %{URIPROTO:cs_method} %{URIPATH:cs_stem} (?:%{NOTSPACE:cs_query}|-) %{NUMBER:src_port} %{NOTSPACE:cs_username} %{IP:clientip} %{NOTSPACE:cs_useragent} %{URI:cs_referer} %{NUMBER:sc_status} %{NUMBER:sc_subresponse} %{NUMBER:sc_win32_status} %{NUMBER:timetaken}"


그런데 이렇게 바꾸고 나서 테스트하면 정상적인 동작을 안 합니다.

{
          "port" => 55207,
    "@timestamp" => 2020-09-06T07:30:39.424Z,
          "host" => "0:0:0:0:0:0:0:1",
      "@version" => "1",
          "tags" => [
        [0] "_grokparsefailure"
    ],
          "type" => "iis"
}

...[생략]...

왜냐하면, IIS 로그의 경우 referer(referrer)가 없는 요청이면 '-' 문자가 들어오는데 "URI" 패턴에서는 이에 대한 배려가 없기 때문입니다. 이 문제를 수정하려면 마찬가지로 정규 표현식으로 대응해야 하는데,

(%{URI:cs_referer}|-)

문제는 해결했지만, 그렇게 했더니 이번엔 출력에서 해당 필드가 아예 사라집니다.

{
          "port" => 55286,
    "@timestamp" => 2020-09-06T07:34:25.708Z,
          "host" => "0:0:0:0:0:0:0:1",
     "timetaken" => "18",
       "cs_stem" => "/",
      "@version" => "1",
          "type" => "iis"
}

만약 '-' 문자가 있어도 필드를 유지하고 싶다면 별도의 grok 패턴을 담은 파일을 생성하고,

# mypattern.txt

URIWITHDASH %{URI}|-

"patterns_dir" 설정으로 파일이 놓인 디렉터리 경로를 연결한 후, 사용자 정의 패턴을 사용하면 됩니다.

input { ... }

filter {
    if [type] == "iis" {
        if [message] =~ "^#" {
            drop {}
        }

        grok {
            patterns_dir => [ "C:\logstash\grok_patterns" ]
            match => {
                message => "...[생략]... %{NOTSPACE:cs_useragent} %{URIWITHDASH:cs_referer} %{NUMBER:sc_status} %{NUMBER:sc_subresponse} %{NUMBER:sc_win32_status} %{NUMBER:timetaken}"
            }
        }

        mutate { 
            remove_field => [ "logtime", "hostname", "cs_method", "cs_query",
                              "src_port", "cs_username", "clientip", "cs_useragent", "sc_status", 
                              "sc_subresponse", "sc_win32_status", 
                              "message"
                            ] 
        }
    }
}

output { ... }

원하는 데로 출력되는 것을 확인하고.

{
          "port" => 56098,
    "@timestamp" => 2020-09-06T08:54:47.900Z,
          "host" => "127.0.0.1",
     "timetaken" => "9744",
    "cs_referer" => "-",
       "cs_stem" => "/WCFs/TestCall.svc",
      "@version" => "1",
          "type" => "iis"
}




Logstash의 웹 서버 로그 예제들을 보면 종종 geoip 설정이 있는데,

input { ... }

filter {
    if [message] =~ "^#" {
        drop {}
    }

    grok {
        match => {
                message => "...[생략]..."
        }
    }

    geoip {
        source => "clientip"
        fields => ["city_name", "country_name", "location", "region_name"]
    }
}

output { ... }

실제로 해보면 _geoip_lookup_failure 오류가 발생하는 경우가 있습니다.

{
    ...[생략]...
    "tags" => [
    [0] "_geoip_lookup_failure"
    ],
    ...[생략]...
}

왜냐하면 geoip는 public ip에 대해서만 지역 정보를 알 수 있기 때문입니다.

만약 이런 식으로 오류가 발생하는 로그의 경우 output에 보내고 싶지 않다면 drop 시키는 방법도 있으니 참고하시고.

if "_geoip_lookup_failure" in [tags] { 
    drop { }
}




grok 패턴을 이런 식으로 logstash를 이용해 매번 테스트하는 것도 때로는 번거로울 수 있습니다. 그런 경우라면 Grok Debugger 사이트를 이용해 보시면 좋은데요,

Grok Debugger
; http://grokdebug.herokuapp.com/

예를 들어, IIS 로그의 경우 "Input" 상자에 로그 내용을 복사한 다음, "Pattern"에 그것을 파싱할 수 있는 패턴 문자열을 넣어 실시간으로 테스트하는 것이 가능합니다. 게다가 사용자 정의 패턴도 등록하는 것이 가능한데, 아래의 그림과 같이 "Add custom patterns" 체크 버튼을 눌러 펼쳐지는 텍스트 박스 영역에 별도의 패턴을 등록하는 식으로 진행할 수 있습니다.

grok_debug_1.png

Input: 6
Pattern: %{INTEGER:n1}
Custom patterns: INTEGER (?:[+-]?(?:[0-9]+))
Output:
{
  "n1": [
    [
      "6"
    ]
  ]
}

참고로, Grok Debugger 사용 시 패턴 문자열 마지막에 "Enter" 키를 입력해 개행을 추가하지 않도록 주의해야 합니다. 그런 경우 분명히 올바른 패턴인데도 "No Matches" 결과가 나오므로!




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 9/7/2020]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




... 76  77  78  79  [80]  81  82  83  84  85  86  87  88  89  90  ...
NoWriterDateCnt.TitleFile(s)
11651정성태8/14/201815565사물인터넷: 24. 9V 전압에서 테스트하는 C1815 트랜지스터 [1]파일 다운로드3
11650정성태8/14/201810672사물인터넷: 23. 가변저항으로 분압파일 다운로드1
11649정성태8/12/201812553사물인터넷: 22. 저항에 따른 전류 테스트파일 다운로드1
11648정성태8/12/201813922사물인터넷: 21. 퓨즈를 이용한 회로 보호파일 다운로드3
11647정성태8/8/201812886오류 유형: 476. 음수의 음수는 여전히 음수가 되는 수(절대값이 음수인 수)
11646정성태8/8/201810505오류 유형: 475. gacutil.exe 실행 시 "Failure initializing gacutil" 오류 발생
11645정성태8/8/201812099오류 유형: 474. 닷넷 COM+ - Failed to load the runtime. [1]
11644정성태8/6/201814891디버깅 기술: 118. windbg - 닷넷 개발자를 위한 MEX Debugging Extension 소개
11643정성태8/6/201814253사물인터넷: 20. 아두이노 레오나르도 R3 호환 보드의 3.3v 핀의 LED 전압/전류 테스트 [1]파일 다운로드1
11642정성태8/3/201813805Graphics: 20. Unity - LightMode의 ForwardBase에 따른 _WorldSpaceLightPos0 값 변화
11641정성태8/3/201817990Graphics: 19. Unity로 실습하는 Shader (10) - 빌보드 구현파일 다운로드1
11640정성태8/3/201815065Graphics: 18. Unity - World matrix(unity_ObjectToWorld)로부터 Position, Rotation, Scale 값을 복원하는 방법파일 다운로드1
11639정성태8/2/201812656디버깅 기술: 117. windbg - 덤프 파일로부터 추출한 DLL을 참조하는 방법
11638정성태8/2/201810999오류 유형: 473. windbg - 덤프 파일로부터 추출한 DLL 참조 시 "Resolved file has a bad image, no metadata, or is otherwise inaccessible." 빌드 오류
11637정성태8/1/201814806Graphics: 17. Unity - World matrix(unity_ObjectToWorld)로부터 TRS(이동/회전/크기) 행렬로 복원하는 방법파일 다운로드1
11636정성태8/1/201822155Graphics: 16. 3D 공간에서 두 점이 이루는 각도 구하기파일 다운로드1
11635정성태8/1/201811783오류 유형: 472. C# 컴파일 오류 - Your project is not referencing the ".NETFramework,Version=v3.5" framework.
11634정성태8/1/201813698.NET Framework: 790. .NET Thread 상태가 Cooperative일 때 GC hang 현상 재현 방법파일 다운로드1
11633정성태7/29/201818142Graphics: 15. Unity - shader의 World matrix(unity_ObjectToWorld)를 수작업으로 구성 [2]파일 다운로드1
11632정성태7/28/201820754Graphics: 14. C# - Unity에서 캐릭터가 바라보는 방향을 기준으로 카메라의 위치 이동 및 회전하는 방법
11631정성태7/27/201821995Graphics: 13. Unity로 실습하는 Shader (9) - 투명 배경이 있는 텍스처 입히기 [1]
11630정성태7/27/201816994개발 환경 구성: 391. (GitHub 등과 직접 연동해) 소스 코드 디버깅을 쉽게 해 주는 SourceLink [3]
11629정성태7/26/201815535.NET Framework: 789. C# 컴파일 옵션 - Check for arithmetic overflow/underflow [2]
11628정성태7/25/201818236Graphics: 12. Unity로 실습하는 Shader (8) - 다중 패스(Multi-Pass Shader)
11627정성태7/25/201812734개발 환경 구성: 390. C# - 컴파일러 옵션 OSS signing / Public Signing
11626정성태7/25/201811811오류 유형: 471. .C++ 함수를 const로 바꾼 경우 C2440 컴파일 오류가 발생한다면?
... 76  77  78  79  [80]  81  82  83  84  85  86  87  88  89  90  ...