Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
(연관된 글이 4개 있습니다.)

C# - ffmpeg(FFmpeg.AutoGen)를 이용한 오디오 필터링 예제(filtering_audio.c)

지난 예제에 이어,

C# - ffmpeg(FFmpeg.AutoGen)를 이용해 오디오(mp2) 인코딩하는 예제(encode_audio.c)
; https://www.sysnet.pe.kr/2/0/12937

이번에는 ffmpeg 예제 중 "filtering_audio.c" 파일을 FFmpeg.AutoGen으로 포팅하겠습니다.

using FFmpeg.AutoGen;
using FFmpeg.AutoGen.Example;
using System;

namespace FFmpegApp1
{
    internal unsafe class Program
    {
        [Flags]
        public enum AV_BUFFERSRC_FLAG
        {
            NO_CHECK_FORMAT = 1,
            FLAG_PUSH = 4,
            FLAG_KEEP_REF = 8,
        }

        static void Main(string[] args)
        {
            FFmpegBinariesHelper.RegisterFFmpegBinaries();

#if DEBUG
            Console.WriteLine("Current directory: " + Environment.CurrentDirectory);
            Console.WriteLine("Running in {0}-bit mode.", Environment.Is64BitProcess ? "64" : "32");
            Console.WriteLine($"FFmpeg version info: {ffmpeg.av_version_info()}");
#endif
            Console.WriteLine();

            AVFormatContext* fmt_ctx = null;
            AVCodecContext* dec_ctx = null;
            int audio_stream_index = -1;
            AVFilterGraph* filter_graph = null;
            string filter_descr = "aresample=8000,aformat=sample_fmts=s16:channel_layouts=mono";
            AVFilterContext* buffersrc_ctx = null;
            AVFilterContext* buffersink_ctx = null;

            int ret;
            AVPacket* packet = ffmpeg.av_packet_alloc();
            AVFrame* frame = ffmpeg.av_frame_alloc();
            AVFrame* filter_frame = ffmpeg.av_frame_alloc();

            if (packet == null || frame == null || filter_frame == null)
            {
                Console.WriteLine("Could not allocate frame or packet");
                return;
            }

            string filePath = @"D:\media_sample\test.m4a";

            do
            {
                if ((ret = open_input_file(filePath, &fmt_ctx, out audio_stream_index, &dec_ctx)) < 0)
                {
                    Console.WriteLine("Could not allocate frame or packet");
                    break;
                }

                if ((ret = init_filters(filter_descr, fmt_ctx, audio_stream_index, &filter_graph, dec_ctx, &buffersrc_ctx, &buffersink_ctx)) < 0)
                {
                    break;
                }

                while (true)
                {
                    if ((ret = ffmpeg.av_read_frame(fmt_ctx, packet)) < 0)
                    {
                        break;
                    }

                    if (packet->stream_index == audio_stream_index)
                    {
                        ret = ffmpeg.avcodec_send_packet(dec_ctx, packet);
                        if (ret < 0)
                        {
                            ffmpeg.av_log(null, ffmpeg.AV_LOG_ERROR, "Error while sending a packet to the decoder\n");
                            break;
                        }

                        while (ret >= 0)
                        {
                            ret = ffmpeg.avcodec_receive_frame(dec_ctx, frame);
                            if (ret == ffmpeg.AVERROR(ffmpeg.EAGAIN) || ret == ffmpeg.AVERROR_EOF)
                            {
                                break;
                            }
                            else if (ret < 0)
                            {
                                ffmpeg.av_log(null, ffmpeg.AV_LOG_ERROR, "Error while receiving a frame from the decoder\n");
                                goto End_Of_Process;
                            }

                            if (ret >= 0)
                            {
                                if (ffmpeg.av_buffersrc_add_frame_flags(buffersrc_ctx, frame, (int)AV_BUFFERSRC_FLAG.FLAG_KEEP_REF) < 0)
                                {
                                    ffmpeg.av_log(null, ffmpeg.AV_LOG_ERROR, "Error while feeding the audio filtergraph\n");
                                    break;
                                }

                                while (true)
                                {
                                    ret = ffmpeg.av_buffersink_get_frame(buffersink_ctx, filter_frame);
                                    if (ret == ffmpeg.AVERROR(ffmpeg.EAGAIN) || ret == ffmpeg.AVERROR_EOF)
                                    {
                                        break;
                                    }

                                    if (ret < 0)
                                    {
                                        goto End_Of_Process;
                                    }

                                    print_frame(filter_frame);
                                    ffmpeg.av_frame_unref(filter_frame);
                                }

                                ffmpeg.av_frame_unref(frame);
                            }
                        }
                    }

                    ffmpeg.av_packet_unref(packet);
                }

            } while (false);

        End_Of_Process:

            if (filter_graph != null)
            {
                ffmpeg.avfilter_graph_free(&filter_graph);
            }

            if (dec_ctx != null)
            {
                ffmpeg.avcodec_free_context(&dec_ctx);
            }

            if (fmt_ctx != null)
            {
                ffmpeg.avformat_close_input(&fmt_ctx);
            }

            if (packet != null)
            {
                ffmpeg.av_packet_free(&packet);
            }

            if (frame != null)
            {
                ffmpeg.av_frame_free(&frame);
            }

            if (filter_frame != null)
            {
                ffmpeg.av_frame_free(&filter_frame);
            }
        }

        private static unsafe void print_frame(AVFrame* frame)
        {
            int n = frame->nb_samples * ffmpeg.av_get_channel_layout_nb_channels(frame->channel_layout);
            ushort* p = (ushort*)frame->data[0];
            ushort* p_end = p + n;

            while (p < p_end)
            {
                Console.Write(*p & 0xFF);
                Console.Write((*p >> 8) & 0xFF);
                p++;
            }
        }

        private static unsafe int init_filters(string filters_descr, AVFormatContext* fmt_ctx, int audio_stream_index
            , AVFilterGraph** filter_graph, AVCodecContext* dec_ctx, AVFilterContext** buffersrc_ctx, AVFilterContext** buffersink_ctx)
        {
            string args = null;
            int ret = 0;
            AVFilter* aBufferSrc = ffmpeg.avfilter_get_by_name("abuffer");
            AVFilter* aBufferSink = ffmpeg.avfilter_get_by_name("abuffersink");
            AVFilterInOut* outputs = ffmpeg.avfilter_inout_alloc();
            AVFilterInOut* inputs = ffmpeg.avfilter_inout_alloc();

            AVSampleFormat[] out_sample_fmts = new AVSampleFormat[] { AVSampleFormat.AV_SAMPLE_FMT_S16, AVSampleFormat.AV_SAMPLE_FMT_NONE };
            long[] out_channel_layouts = { ffmpeg.AV_CH_LAYOUT_MONO, -1 };
            int[] out_sample_rates = { 8000, -1 };
            AVFilterLink* outlink = null;
            AVRational time_base = fmt_ctx->streams[audio_stream_index]->time_base;

            do
            {
                *filter_graph = ffmpeg.avfilter_graph_alloc();
                if (outputs == null || inputs == null || *filter_graph == null)
                {
                    ret = ffmpeg.AVERROR(ffmpeg.ENOMEM);
                    break;
                }

                if (dec_ctx->channel_layout == 0)
                {
                    dec_ctx->channel_layout = (ulong)ffmpeg.av_get_default_channel_layout(dec_ctx->channels);
                }

                args = $"time_base={time_base.num}/{time_base.den}:sample_rate={dec_ctx->sample_rate}:sample_fmt={ffmpeg.av_get_sample_fmt_name(dec_ctx->sample_fmt)}:channel_layout=0x{dec_ctx->channel_layout.ToString("x")}";
                ret = ffmpeg.avfilter_graph_create_filter(buffersrc_ctx, aBufferSrc, "in", args, null, *filter_graph);
                if (ret < 0)
                {
                    ffmpeg.av_log(null, ffmpeg.AV_LOG_ERROR, "Cannot create audio buffer source\n");
                    break;
                }

                ret = ffmpeg.avfilter_graph_create_filter(buffersink_ctx, aBufferSink, "out", null, null, *filter_graph);
                if (ret < 0)
                {
                    ffmpeg.av_log(null, ffmpeg.AV_LOG_ERROR, "Cannot create audio buffer sink\n");
                    break;
                }

                ret = av_opt_set_int_list(*buffersink_ctx, "sample_fmts", out_sample_fmts, -1, ffmpeg.AV_OPT_SEARCH_CHILDREN);
                if (ret < 0)
                {
                    ffmpeg.av_log(null, ffmpeg.AV_LOG_ERROR, "Cannot set output sample format\n");
                    break;
                }

                ret = av_opt_set_int_list(*buffersink_ctx, "channel_layouts", out_channel_layouts, -1, ffmpeg.AV_OPT_SEARCH_CHILDREN);
                if (ret < 0)
                {
                    ffmpeg.av_log(null, ffmpeg.AV_LOG_ERROR, "Cannot set output channel layout\n");
                    break;
                }

                ret = av_opt_set_int_list(*buffersink_ctx, "sample_rates", out_sample_rates, -1, ffmpeg.AV_OPT_SEARCH_CHILDREN);
                if (ret < 0)
                {
                    ffmpeg.av_log(null, ffmpeg.AV_LOG_ERROR, "Cannot set output sample rate\n");
                    break;
                }

                outputs->name = ffmpeg.av_strdup("in");
                outputs->filter_ctx = *buffersrc_ctx;
                outputs->pad_idx = 0;
                outputs->next = null;

                inputs->name = ffmpeg.av_strdup("out");
                inputs->filter_ctx = *buffersink_ctx;
                inputs->pad_idx = 0;
                inputs->next = null;

                if ((ret = ffmpeg.avfilter_graph_parse_ptr(*filter_graph, filters_descr, &inputs, &outputs, null)) < 0)
                {
                    break;
                }

                if ((ret = ffmpeg.avfilter_graph_config(*filter_graph, null)) < 0)
                {
                    break;
                }

                outlink = (*buffersink_ctx)->inputs[0];

#pragma warning disable CA2014 // Do not use stackalloc in loops
                byte* buffer = stackalloc byte[512];
#pragma warning restore CA2014 // Do not use stackalloc in loops
                ffmpeg.av_get_channel_layout_string(buffer, 512, -1, outlink->channel_layout);
                string channel_layout_string = new string((sbyte*)buffer, 0, getStringSize(buffer, 512), System.Text.Encoding.ASCII);
                ffmpeg.av_log(null, ffmpeg.AV_LOG_INFO, $"Output: srate: {outlink->sample_rate}Hz fmt: {ffmpeg.av_get_sample_fmt_name((AVSampleFormat)outlink->format) ?? "?"} chlayout: {channel_layout_string}");

            } while (false);

            if (inputs != null)
            {
                ffmpeg.avfilter_inout_free(&inputs);
            }

            if (outputs != null)
            {
                ffmpeg.avfilter_inout_free(&outputs);
            }

            return ret;
        }

        private static int getStringSize(byte* buffer, int length)
        {
            for (int i = 0; i < length; i++)
            {
                if (buffer[i] == 0)
                {
                    return i;
                }
            }

            return 0;
        }

        private unsafe static int av_opt_set_int_list(AVFilterContext* obj, string name, long[] val, int term, int flags)
        {
            fixed (void* ptr = &val[0])
            {
                return av_opt_set_int_list(obj, 8, name, ptr, term, flags);
            }
        }

        private unsafe static int av_opt_set_int_list(AVFilterContext* obj, string name, int[] val, int term, int flags)
        {
            fixed (void* ptr = &val[0])
            {
                return av_opt_set_int_list(obj, 4, name, ptr, term, flags);
            }
        }

        private unsafe static int av_opt_set_int_list(AVFilterContext* obj, string name, AVSampleFormat[] val, int term, int flags)
        {
            fixed (void* ptr = &val[0])
            {
                return av_opt_set_int_list(obj, 4, name, ptr, term, flags);
            }
        }

        private unsafe static int av_opt_set_int_list(AVFilterContext* obj, uint elementSize, string name, void* ptr, int term, int flags)
        {
            uint size = ffmpeg.av_int_list_length_for_size(elementSize, ptr, (ulong)term);
            if (size > (int.MaxValue / elementSize))
            {
                return ffmpeg.AVERROR(ffmpeg.EINVAL);
            }
            else
            {
                return ffmpeg.av_opt_set_bin(obj, name, (byte*)ptr, (int)(size * elementSize), flags);
            }
        }

        private unsafe static int open_input_file(string filePath, AVFormatContext** fmt_ctx, out int audio_stream_index
            , AVCodecContext** dec_ctx)
        {
            AVCodec* decoder = null;
            int ret;

            audio_stream_index = -1;

            if ((ret = ffmpeg.avformat_open_input(fmt_ctx, filePath, null, null)) < 0)
            {
                ffmpeg.av_log(null, ffmpeg.AV_LOG_ERROR, "Cannot open input file\n");
                return ret;
            }

            if ((ret = ffmpeg.avformat_find_stream_info(*fmt_ctx, null)) < 0)
            {
                ffmpeg.av_log(null, ffmpeg.AV_LOG_ERROR, "Cannot find stream information\n");
                return ret;
            }

            ret = ffmpeg.av_find_best_stream(*fmt_ctx, AVMediaType.AVMEDIA_TYPE_AUDIO, -1, -1, &decoder, 0);
            if (ret < 0)
            {
                ffmpeg.av_log(null, ffmpeg.AV_LOG_ERROR, "Cannot find an audio stream in the input file");
                return ret;
            }

            audio_stream_index = ret;

            *dec_ctx = ffmpeg.avcodec_alloc_context3(decoder);
            if (*dec_ctx == null)
            {
                return ffmpeg.AVERROR(ffmpeg.ENOMEM);
            }

            ffmpeg.avcodec_parameters_to_context(*dec_ctx, (*fmt_ctx)->streams[audio_stream_index]->codecpar);

            if ((ret = ffmpeg.avcodec_open2(*dec_ctx, decoder, null)) < 0)
            {
                ffmpeg.av_log(null, ffmpeg.AV_LOG_ERROR, "Cannot open audio decoder");
                return ret;
            }

            return 0;
        }
    }
}

위의 코드를 실행하면, print_frame의 영향으로 화면에는 ushort 숫자가 잔뜩 출력됩니다.

Output: srate: 8000Hz fmt: s16 chlayout: mono
0000000000...[생략]...000000000000000000


filter_graph라는 단어가 Direct Show에서만 쓰는 것이 아니군요. ^^

Direct Show를 사용하는 다른 프로그램의 필터 그래프를 graphedt.exe에서 확인하는 방법
; https://www.sysnet.pe.kr/2/0/1652

그러니까, Direct Show에서 PIN을 연결하듯이 필터를 구성했던 방식과 유사한 듯합니다.

(첨부 파일은 이 글의 예제 코드를 포함합니다.)
(이 글의 소스 코드는 github에 올려져 있습니다.)




filtering_video.c를 보면, AVCodec을 더 편하게 얻는 방법이 나옵니다. 지난 글에서는,

C# - ffmpeg(FFmpeg.AutoGen) AVFormatContext를 이용해 ffprobe처럼 정보 출력
; https://www.sysnet.pe.kr/2/0/12948

av_find_best_stream을 스트림 타입에 해당하는 최적의 index 값을 반환받아,

int videoIndex = -1;
int audioIndex = -1;

{
    videoIndex = ffmpeg.av_find_best_stream(av_context, AVMediaType.AVMEDIA_TYPE_VIDEO, -1, -1, null, 0);
    audioIndex = ffmpeg.av_find_best_stream(av_context, AVMediaType.AVMEDIA_TYPE_AUDIO, -1, -1 /* 또는 videoIndex */, null, 0);

    ffmpeg.av_dump_format(av_context, videoIndex, filePath, 0);
}

그다음 이에 대한 코덱을 열려고 다음과 같이 streams를 열거하면서 했는데요,

for (int i = 0; i < av_context->nb_streams; i++)
{
    if (videoIndex == i)
    {
        AVStream* stream = av_context->streams[i];
        AVCodecParameters* codecpar = stream->codecpar;

        AVCodec* decoder = ffmpeg.avcodec_find_decoder(codecpar->codec_id);
    }
}

open_input_file을 보면, 그럴 필요 없이 그냥 바로 av_find_best_stream에서 코덱 인스턴스를 받고 있습니다.

AVCodec* decoder = null;
ret = ffmpeg.av_find_best_stream(fmt_ctx, AVMediaType.AVMEDIA_TYPE_AUDIO, -1, -1, &decoder, 0);




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 3/13/2022]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




[1]  2  3  4  5  6  7  8  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
13470정성태12/2/202354닷넷: 2178. C# - .NET 8부터 COM Interop에 대한 자동 소스 코드 생성 도입파일 다운로드1
13469정성태12/1/202373닷넷: 2177. C# - (Interop DLL 없이) CoClass를 이용한 COM 개체 생성 방법파일 다운로드1
13468정성태12/1/202384닷넷: 2176. C# - .NET Core/5+부터 달라진 RCW(Runtime Callable Wrapper) 대응 방식파일 다운로드1
13467정성태11/30/2023334오류 유형: 882. C# - Unhandled exception. System.Runtime.InteropServices.COMException (0x800080A5)파일 다운로드1
13466정성태11/29/2023282닷넷: 2175. C# - DllImport 메서드의 AOT 지원을 위한 LibraryImport 옵션
13465정성태11/28/2023200개발 환경 구성: 689. MSBuild - CopyToOutputDirectory가 "dotnet publish" 시에는 적용되지 않는 문제파일 다운로드1
13464정성태11/28/2023384닷넷: 2174. C# - .NET 7부터 UnmanagedCallersOnly 함수 export 기능을 AOT 빌드에 통합파일 다운로드1
13463정성태11/27/2023355오류 유형: 881. Visual Studio - NU1605: Warning As Error: Detected package downgrade
13462정성태11/27/2023441오류 유형: 880. Visual Studio - error CS0246: The type or namespace name '...' could not be found
13461정성태11/26/2023615닷넷: 2173. .NET Core 3/5+ 기반의 COM Server를 registry 등록 없이 사용하는 방법파일 다운로드1
13460정성태11/26/2023512닷넷: 2172. .NET 6+ 기반의 COM Server 내에 Type Library를 내장하는 방법파일 다운로드1
13459정성태11/26/2023440닷넷: 2171. .NET Core 3/5+ 기반의 COM Server를 기존의 regasm처럼 등록하는 방법파일 다운로드1
13458정성태11/26/2023428닷넷: 2170. .NET Core/5+ 기반의 COM Server를 tlb 파일을 생성하는 방법(tlbexp)
13457정성태11/25/2023482VS.NET IDE: 187. Visual Studio - 16.9 버전부터 추가된 "Display inline type hints" 옵션
13456정성태11/25/2023627닷넷: 2169. C# - OpenAI를 사용해 PDF 데이터를 대상으로 OpenAI 챗봇 작성파일 다운로드1
13455정성태11/25/2023625닷넷: 2168. C# - Azure.AI.OpenAI 패키지로 OpenAI 사용파일 다운로드1
13454정성태11/23/2023682닷넷: 2167. C# - Qdrant Vector DB를 이용한 Embedding 벡터 값 보관/조회 (Azure OpenAI)파일 다운로드1
13453정성태11/23/2023691오류 유형: 879. docker desktop 설치 시 "Invalid JSON string. (Exception from HRESULT: 0x83750007)"
13452정성태11/22/2023800닷넷: 2166. C# - Azure OpenAI API를 이용해 사용자가 제공하는 정보를 대상으로 검색하는 방법파일 다운로드1
13451정성태11/21/2023882닷넷: 2165. C# - Azure OpenAI API를 이용해 ChatGPT처럼 동작하는 콘솔 응용 프로그램 제작파일 다운로드1
13450정성태11/21/2023832닷넷: 2164. C# - Octokit을 이용한 GitHub Issue 검색파일 다운로드1
13449정성태11/21/2023757개발 환경 구성: 688. Azure OpenAI 서비스 신청 방법
13448정성태11/20/2023795닷넷: 2163. .NET 8 - Dynamic PGO를 결합한 성능 향상파일 다운로드1
13447정성태11/16/2023905닷넷: 2162. ASP.NET Core 웹 사이트의 SSL 설정을 코드로 하는 방법
13446정성태11/16/2023995닷넷: 2161. .NET Conf 2023 - Day 1 Blazor 개요 정리
[1]  2  3  4  5  6  7  8  9  10  11  12  13  14  15  ...