Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (seongtaejeong at gmail.com)
홈페이지
첨부 파일
 

eBPF - BPF_MAP_TYPE_PERF_EVENT_ARRAY, BPF_MAP_TYPE_RINGBUF에 대한 다양한 용어들

2가지 맵 타입에 대해 설명했는데요,

eBPF / bpf2go - BPF_PERF_OUTPUT / BPF_MAP_TYPE_PERF_EVENT_ARRAY 사용법
; https://www.sysnet.pe.kr/2/0/13824

eBPF / bpf2go - BPF_RINGBUF_OUTPUT / BPF_MAP_TYPE_RINGBUF 사용법
; https://www.sysnet.pe.kr/2/0/13825

개인적으로 이와 관련한 용어들이 혼란스러웠던 경험이 있어 정리를 해볼까 합니다. ^^ 일단 문서에 나온 내용으로는 명확한데요,

// Map type BPF_MAP_TYPE_RINGBUF
// https://docs.ebpf.io/linux/map-type/BPF_MAP_TYPE_RINGBUF/

This map consists of a singular ring as opposed to the per-CPU design of the BPF_MAP_TYPE_PERF_ARRAY map type. This means that the order of events is preserved across all CPUs.


그런데, 정작 설명에 나오는 "BPF_MAP_TYPE_PERF_ARRAY" 유형의 맵은 없습니다. 처음에는 이게 BPF_MAP_TYPE_PERF_EVENT_ARRAY의 오타라고 생각했는데, 검색해 보니 이런 기록이 나옵니다.

// https://lore.kernel.org/lkml/56A1B3D9.20506@huawei.com/t/

bpf__apply_obj_config() is introduced as the core API to apply object
config options to all BPF objects. This patch also does the real work
for setting values for BPF_MAP_TYPE_PERF_ARRAY maps by inserting value
stored in map's private field into the BPF map.


This patch is required because we are not always able to set all
BPF config during parsing. Further patch will set events created
by perf to BPF_MAP_TYPE_PERF_EVENT_ARRAY maps, which is not exist
until perf_evsel__open().

커널 패치와 같은 기술적인 글에서 오타가 있었을 리는 없고... 뭔가 관련 맵이 있는 것도 같지만, 어쨌든 제가 지금까지 정리한 바로는 BPF_MAP_TYPE_PERF_ARRAY == BPF_MAP_TYPE_PERF_EVENT_ARRAY를 의미하는 듯합니다. (혹시 이에 대해 아시는 분은 덧글 부탁드립니다. ^^)

관련해서 공식 문서를 볼까요?

BPF ring buffer
; https://docs.kernel.org/bpf/ringbuf.html

Motivation 부분을 보면, 기존에 구현된 "perf buffer"가 가진 구조적 문제(per-CPU perf ring buffer)를 나열하는데,

  • more efficient memory utilization by sharing ring buffer across CPUs;
  • preserving ordering of events that happen sequentially in time, even across multiple CPUs (e.g., fork/exec/exit events for a task).

설명으로 봐서는 BPF_MAP_TYPE_PERF_EVENT_ARRAY와 일치합니다. 그리고 저 2가지 문제를 해결하는 좀 더 효율적인 ring buffer가 요구되었다고 나오는데요, 즉, Map type BPF_MAP_TYPE_RINGBUF 문서의 내용과 합쳐 보면 이렇게 정리가 됩니다.

  • "perf buffer" (per-CPU perf ring buffer)를 사용하는 맵 타입: BPF_MAP_TYPE_PERF_EVENT_ARRAY
  • "BPF ring buffer" (Single ring buffer shared among all CPUs)를 사용하는 맵 타입: BPF_MAP_TYPE_RINGBUF




다른 문서를 볼까요? 예를 들어, 이전 글에서 실습한 eBPF Tutorial by Example 7: Capturing Process Execution, Output with perf event array 글에서는 perf buffer에 대해 다음과 같은 설명을 하고 있습니다.

eBPF provides two circular buffers for transferring information from eBPF programs to user space controllers. The first one is the perf circular buffer, which has existed since at least kernel v4.15. The second one is the BPF circular buffer introduced later. This article only considers the perf circular buffer.


커널 공식 문서와 연결해 보면 위의 글에서 설명한 2가지 "circular buffer"는 이렇게 정리가 될 것 같습니다.

  • "perf circular buffer": 커널 문서의 "perf buffer"
  • "BPF circular buffer": 커널 문서의 "BPF ring buffer"

이와 함께 해당 글에서는 첫 번째 유형인 "perf circular buffer"만을 다룬다고 하면서 예제 코드에 "BPF_MAP_TYPE_PERF_EVENT_ARRAY"를 사용하고 있습니다. 용어는 다소 다르지만, 다행히 커널 공식 문서에서 다뤘던 내용과 일치합니다.




아래의 글에는,

OS/linux/BPF/BPF ring buffer.md
; https://github.com/rlaisqls/TIL/blob/main/OS/linux/BPF/BPF%E2%80%85ring%E2%80%85buffer.md

BPF ring buffer
; https://nakryiko.com/posts/bpf-ringbuf/

커널 문서의 perf buffer에 대해 "BPF perfbuf"라고 일컫는데요, 저같은 초보에게는 이것도 좀 혼동이 됩니다. 커널 문서의 설명도 그렇고, BPF_MAP_TYPE_PERF_EVENT_ARRAY 문서에서도 "on the existing perf-subsystem implementation of ring-buffers"라는 설명으로 볼 때 eBPF에서 BPF_MAP_TYPE_PERF_EVENT_ARRAY 맵을 위해 이미 만들어져 있던 커널 자체의 "perf buffer"를 사용했기 때문에 "BPF perfbuf"라는 용어는 맞지 않고 그냥 "perf buffer"로 쓰는 것이 맞습니다. (아마도 저 문서들은 BPF를 설명하다 보니 자연스럽게 "BPF perfbuf"라고 일컫는 듯합니다.)

그리고 "BPF ring buffer"는 물론 해당 자료 구조가 커널에 의해서 제공되는 것은 동일하지만 전반적으로 커널 내부에서 사용하던 "perf buffer"와는 달리 "BPF ring buffer"는 아예 eBPF 전용으로 새롭게 개발된 것이므로 "BPF" 수식어가 붙는 것이 자연스럽습니다.

어쨌든, "OS/linux/BPF/BPF ring buffer.md", BPF ring buffer 문서의 2개 용어는 다음과 같이 정리할 수 있습니다.

  • BPF perfbuf(Perfbuf): 커널 문서의 "perf buffer"
  • BPF ring buffer(Ringbuf): 커널 문서의 "BPF ring buffer"

정리해 보면, 2가지 유형의 stream map 유형에 대해 공식적인 자료 구조는 커널 문서에서처럼 "perf buffer", "BPF ring buffer"로 통일하는 것이 좋겠다는 생각입니다. ^^




그나저나, 이걸 정리하면서 제가 읽었던 책의 내용이 떠오르는데요,

BPF를 활용한 리눅스 시스템 트레이싱
; https://www.yes24.com/Product/Goods/97681199

170 페이지 "7.6 출력 채널"에서 BPF_PERF_OUTPUT와 BPF_RINGBUF_OUTPUT에 대해 설명하고 있습니다. 책에서는 3가지 출력 채널을 소개하고 있는데,

  • 트레이스 파이프(/sys/kernel/debug/trace_pipe)
  • Perf 링 버퍼
  • 커널 링 버퍼

이 중에서 Perf 링 버퍼는 BPF_PERF_OUTPUT, 커널 링 버퍼는 BPF_RINGBUF_OUTPUT으로 예를 들고 있습니다. 문제는, BPF_RINGBUF_OUTPUT의 경우 이런 식으로 설명하고 있는데요,

남은 출력 포인트는 커널 링 버퍼이며, 흔히 dmesg나 /var/log/message로 확인합니다. 링 버퍼 역시 다른 프로세스와 공유되는 공간이므로 특별한 메시지를 보내는 용도로만 쓰는 것이 좋습니다.


(어차피 /var/log/message는 데몬에 의해 dmesg를 복사하는 식이므로 넘어가고) 왜 여기서 dmesg를 언급하는지 모르겠습니다. 아마도 dmesg가 (단어 그대로 자료 구조의) ring buffer로 동작하는데다 커널 메시지를 수용하기 때문에 저자 나름대로 "커널 링 버퍼"와 BPF_RINGBUF_OUTPUT을 같은 거라고 짐작해 설명한 것 같습니다.

물론, 이것은 사실과 다르며 5. BPF_RINGBUF_OUTPUT 문서에도 나오듯이 오히려 커널 5.8부터라면 더욱 추천하는 유형입니다.




기왕에 언급했으니, 본문과 관련은 없지만 해당 책의 오류 하나를 더 기록으로 남깁니다.

108 페이지 kprobe를 설명하면서 오프셋을 다루는 것에 대해 다음과 같이 설명하고 있는데요,

오프셋 범위는 어디까지나 해당 함수의 범위에서만 유효합니다. 벗어나면 다음과 같이 에러를 만납니다.

예제 6.23 오프셋이 함수의 범위를 벗어나는 경우

$ bpftrace -e 'kprobe:do_sys_open+1 { printf("in here\n"); }'
Attaching 1 probe...
Could not add kprobe into middle of instruction: /usr/lib/debug/boot/vmlinux-5.8.17:do_sys_open+1

이에 대해서는 전에 제가 설명을 했는데요, "해당 함수의 범위"에서 유효한 것이 아니라 "어셈블리 명령어의 시작 위치"에서 유효한 것입니다.




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 11/27/2024]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




1  2  3  4  5  6  7  8  [9]  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
13718정성태8/27/20247413오류 유형: 921. Visual C++ - error C1083: Cannot open include file: 'float.h': No such file or directory [2]
13717정성태8/26/20247019VS.NET IDE: 192. Visual Studio 2022 - Windows XP / 2003용 C/C++ 프로젝트 빌드
13716정성태8/21/20246751C/C++: 167. Visual C++ - 윈도우 환경에서 _execv 동작 [1]
13715정성태8/19/20247348Linux: 78. 리눅스 C/C++ - 특정 버전의 glibc 빌드 (docker-glibc-builder)
13714정성태8/19/20246735닷넷: 2295. C# 12 - 기본 생성자(Primary constructors) (책 오타 수정) [3]
13713정성태8/16/20247444개발 환경 구성: 721. WSL 2에서의 Hyper-V Socket 연동
13712정성태8/14/20247214개발 환경 구성: 720. Synology NAS - docker 원격 제어를 위한 TCP 바인딩 추가
13711정성태8/13/20248057Linux: 77. C# / Linux - zombie process (defunct process) [1]파일 다운로드1
13710정성태8/8/20247974닷넷: 2294. C# 13 - (6) iterator 또는 비동기 메서드에서 ref와 unsafe 사용을 부분적으로 허용파일 다운로드1
13709정성태8/7/20247739닷넷: 2293. C# - safe/unsafe 문맥에 대한 C# 13의 (하위 호환을 깨는) 변화파일 다운로드1
13708정성태8/7/20247526개발 환경 구성: 719. ffmpeg / YoutubeExplode - mp4 동영상 파일로부터 Audio 파일 추출
13707정성태8/6/20247758닷넷: 2292. C# - 자식 프로세스의 출력이 4,096보다 많은 경우 Process.WaitForExit 호출 시 hang 현상파일 다운로드1
13706정성태8/5/20247881개발 환경 구성: 718. Hyper-V - 리눅스 VM에 새로운 디스크 추가
13705정성태8/4/20248147닷넷: 2291. C# 13 - (5) params 인자 타입으로 컬렉션 허용 [2]파일 다운로드1
13704정성태8/2/20248101닷넷: 2290. C# - 간이 dotnet-dump 프로그램 만들기파일 다운로드1
13703정성태8/1/20247430닷넷: 2289. "dotnet-dump ps" 명령어가 닷넷 프로세스를 찾는 방법
13702정성태7/31/20247828닷넷: 2288. Collection 식을 지원하는 사용자 정의 타입을 CollectionBuilder 특성으로 성능 보완파일 다운로드1
13701정성태7/30/20248099닷넷: 2287. C# 13 - (4) Indexer를 이용한 개체 초기화 구문에서 System.Index 연산자 허용파일 다운로드1
13700정성태7/29/20247698디버깅 기술: 200. DLL Export/Import의 Hint 의미
13699정성태7/27/20248226닷넷: 2286. C# 13 - (3) Monitor를 대체할 Lock 타입파일 다운로드1
13698정성태7/27/20248189닷넷: 2285. C# - async 메서드에서의 System.Threading.Lock 잠금 처리파일 다운로드1
13697정성태7/26/20247913닷넷: 2284. C# - async 메서드에서의 lock/Monitor.Enter/Exit 잠금 처리파일 다운로드1
13696정성태7/26/20247440오류 유형: 920. dotnet publish - error NETSDK1047: Assets file '...\obj\project.assets.json' doesn't have a target for '...'
13695정성태7/25/20247424닷넷: 2283. C# - Lock / Wait 상태에서도 STA COM 메서드 호출 처리파일 다운로드1
13694정성태7/25/20247890닷넷: 2282. C# - ASP.NET Core Web App의 Request 용량 상한값 (Kestrel, IIS)
13693정성태7/24/20247225개발 환경 구성: 717. Visual Studio - C# 프로젝트에서 레지스트리에 등록하지 않은 COM 개체 참조 및 사용 방법파일 다운로드1
1  2  3  4  5  6  7  8  [9]  10  11  12  13  14  15  ...