Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
(연관된 글이 1개 있습니다.)

C# - byte 배열을 Hex(16진수) 문자열로 고속 변환하는 방법

재미있는 답변이 있군요. ^^

How do you convert a byte array to a hexadecimal string, and vice versa?
; https://stackoverflow.com/questions/311165/how-do-you-convert-a-byte-array-to-a-hexadecimal-string-and-vice-versa

위의 글에 보면 byte 배열의 값을 각각 16진수 문자열로 변환하는 다양한 방법에 대해 성능을 비교한 덧글을 볼 수 있습니다. 그중에서 가장 빠른 방법이 "Lookup by byte unsafe (via CodesInChaos)"라고 소개하는데요,

How do you convert a byte array to a hexadecimal string, and vice versa?
 - Lookup by byte unsafe (via CodesInChaos)
; https://stackoverflow.com/questions/311165/how-do-you-convert-a-byte-array-to-a-hexadecimal-string-and-vice-versa/24343727#24343727

private static readonly uint[] _lookup32Unsafe = CreateLookup32Unsafe();
private static readonly uint* _lookup32UnsafeP = (uint*)GCHandle.Alloc(_lookup32Unsafe,GCHandleType.Pinned).AddrOfPinnedObject();

private static uint[] CreateLookup32Unsafe()
{
    var result = new uint[256];
    for (int i = 0; i < 256; i++)
    {
        string s=i.ToString("X2");
        if(BitConverter.IsLittleEndian)
            result[i] = ((uint)s[0]) + ((uint)s[1] << 16);
        else
            result[i] = ((uint)s[1]) + ((uint)s[0] << 16);
    }
    return result;
}

public static string ByteArrayToHexViaLookup32Unsafe(byte[] bytes)
{
    var lookupP = _lookup32UnsafeP;
    var result = new char[bytes.Length * 2];
    fixed(byte* bytesP = bytes)
    fixed (char* resultP = result)
    {
        uint* resultP2 = (uint*)resultP;
        for (int i = 0; i < bytes.Length; i++)
        {
            resultP2[i] = lookupP[bytesP[i]];
        }
    }
    return new string(result);
}

동적 프로그래밍을 할 때도 마찬가지고, 언제나 성능은 cache가 정답으로 보입니다. ^^ (혹시 저 소스 코드보다 더 빠르게 최적화하신 분이 계실까요? ^^)

실제로 비교를 한 번 해보겠습니다. 우선, 코드가 간단해서 우리가 흔히 쓰는 BitConverter를 이용한 방법과,

// BitConverter 버전

BitConverter.ToString(buf).Replace("-", "");

아무래도 저건 루프를 두 번 돌 테니 직접 만들어서 구현한 코드를 놓고,

// ToHex 버전

StringBuilder sb = new StringBuilder(buf.Length * 2);
foreach (byte b in buf)
{
    sb.Append(b.ToString("x2"));
}

return sb.ToString();

함께 비교해 보면 다음과 같은 성능 수치를 확인할 수 있습니다.

// x64 + Release 빌드, 8192 바이트에 대해 10,000 회 테스트

BitConverter : 1153
ToHex : 4738
UnsafeLookup : 91

오호... 의외군요, StringBuilder를 이용해 루프를 한 번 돌도록 만든 "ToHex" 버전보다 BitConverter가 더 빠릅니다. 물론, UnsafeLookup은 압도적으로 빠르고. ^^




그런데, ToHex 버전을 StringBuilder를 사용하지 않고 BitConverter의 내부 코드를 조금 인용해 다음과 같이 만들어 볼 수도 있습니다.

char[] text = new char[buf.Length * 2];

int srcPos = 0;
for (int dstPos = 0; dstPos < text.Length; dstPos += 2)
{
    byte b = buf[srcPos++];
    text[dstPos] = GetHexValue(((int)b) / 16);
    text[dstPos + 1] = GetHexValue(((int)b) % 16);
}

return new string(text);

static char GetHexValue(int number)
{
    if (number < 10)
    {
        return (char)(number + 48);
    }

    return (char)(number - 10 + 65);
}

그럼 BitConverter보다 성능이 (당연히) 더 좋습니다.

BitConverter : 1164
ToHex : 240
UnsafeLookup : 96

(그러니까, 괜히 코드를 어설프게 만들면 마이크로소프트 측에서 만든 BitConverter보다 못한 성능을 내는 것입니다. ^^)




아래는 이 글에서 테스트한 전체 소스 코드입니다. (첨부 파일로 프로젝트를 올려 두었습니다.)

using System;
using System.Diagnostics;
using System.Runtime.InteropServices;
using System.Text;

class Program
{
    static void Main(string[] args)
    {
        Action<int, string, Action<int, byte[]>, byte[]> action = (loopCount, title, work, arg) =>
      {
          Stopwatch st = new Stopwatch();
          st.Start();

          work(loopCount, arg);

          st.Stop();

          Console.WriteLine(title + " : " + st.ElapsedMilliseconds);
      };

        action(1, "BitConverter", UseBitConverter, new byte[] { 0 });
        action(1, "ToHex", ToHex, new byte[] { 0 });
        action(1, "UnsafeLookup", UnsafeLookup, new byte[] { 0 });

        Console.WriteLine();

        action(10000, "BitConverter", UseBitConverter, new byte[8192]);
        action(10000, "ToHex", ToHex, new byte[8192]);
        action(10000, "UnsafeLookup", UnsafeLookup, new byte[8192]);
    }

    private static void UseBitConverter(int loopCount, byte[] buf)
    {
        for (int i = 0; i < loopCount; i++)
        {
            BitConverter.ToString(buf).Replace("-", "");
        }
    }

    static string ConvertWithStringBuilder(byte[] buf)
    {
        StringBuilder sb = new StringBuilder(buf.Length * 2);
        foreach (byte b in buf)
        {
            sb.Append(b.ToString("x2"));
        }

        return sb.ToString();
    }

    static string ConvertToHex(byte[] buf)
    {
        char[] text = new char[buf.Length * 2];

        int srcPos = 0;
        for (int dstPos = 0; dstPos < text.Length; dstPos += 2)
        {
            byte b = buf[srcPos++];
            text[dstPos] = GetHexValue(((int)b) / 16);
            text[dstPos + 1] = GetHexValue(((int)b) % 16);
        }

        return new string(text);
    }

    static char GetHexValue(int number)
    {
        if (number < 10)
        {
            return (char)(number + 48);
        }

        return (char)(number - 10 + 65);
    }

    private static void ToHex(int loopCount, byte [] buf)
    {
        for (int i = 0; i < loopCount; i ++)
        {
            ConvertToHex(buf);

            // ConvertWithStringBuilder(buf);
        }
    }

    private static void UnsafeLookup(int loopCount, byte[] buf)
    {
        for (int i = 0; i < loopCount; i++)
        {
            ByteToHex.ByteArrayToHexViaLookup32Unsafe(buf);
        }
    }
}

public unsafe class ByteToHex
{
    private static readonly uint[] _lookup32Unsafe = CreateLookup32Unsafe();
    private static readonly uint* _lookup32UnsafeP = (uint*)GCHandle.Alloc(_lookup32Unsafe, GCHandleType.Pinned).AddrOfPinnedObject();

    private static uint[] CreateLookup32Unsafe()
    {
        var result = new uint[256];
        for (int i = 0; i < 256; i++)
        {
            string s = i.ToString("X2");
            if (BitConverter.IsLittleEndian)
                result[i] = ((uint)s[0]) + ((uint)s[1] << 16);
            else
                result[i] = ((uint)s[1]) + ((uint)s[0] << 16);
        }
        return result;
    }

    public static string ByteArrayToHexViaLookup32Unsafe(byte[] bytes)
    {
        var lookupP = _lookup32UnsafeP;
        var result = new char[bytes.Length * 2];
        fixed (byte* bytesP = bytes)
        fixed (char* resultP = result)
        {
            uint* resultP2 = (uint*)resultP;
            for (int i = 0; i < bytes.Length; i++)
            {
                resultP2[i] = lookupP[bytesP[i]];
            }
        }
        return new string(result);
    }
}




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 4/9/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2022-11-12 07시56분
[1111] 닷넷5 부터 System.Convert.ToHexString
[guest]
2022-11-14 11시11분
@1111 정보 감사합니다. ^^
정성태

... 16  17  18  19  [20]  21  22  23  24  25  26  27  28  29  30  ...
NoWriterDateCnt.TitleFile(s)
13131정성태10/3/20228171.NET Framework: 2052. C# - Windows Forms의 데이터 바인딩 지원(DataBinding, DataSource) [2]파일 다운로드1
13130정성태9/28/20225201.NET Framework: 2051. .NET Core/5+ - 에러 로깅을 위한 Middleware가 동작하지 않는 경우파일 다운로드1
13129정성태9/27/20225495.NET Framework: 2050. .NET Core를 IIS에서 호스팅하는 경우 .NET Framework CLR이 함께 로드되는 환경
13128정성태9/23/20228094C/C++: 158. Visual C++ - IDL 구문 중 "unsigned long"을 인식하지 못하는 #import파일 다운로드1
13127정성태9/22/20226542Windows: 210. WSL에 systemd 도입
13126정성태9/15/20227142.NET Framework: 2049. C# 11 - 정적 메서드에 대한 delegate 처리 시 cache 적용
13125정성태9/14/20227351.NET Framework: 2048. C# 11 - 구조체 필드의 자동 초기화(auto-default structs)
13124정성태9/13/20227119.NET Framework: 2047. Golang, Python, C#에서의 CRC32 사용
13123정성태9/8/20227538.NET Framework: 2046. C# 11 - 멤버(속성/필드)에 지정할 수 있는 required 예약어 추가
13122정성태8/26/20227508.NET Framework: 2045. C# 11 - 메서드 매개 변수에 대한 nameof 지원
13121정성태8/23/20225503C/C++: 157. Golang - 구조체의 slice 필드를 Reflection을 이용해 변경하는 방법
13120정성태8/19/20227017Windows: 209. Windows NT Service에서 UI를 다루는 방법 [3]
13119정성태8/18/20226570.NET Framework: 2044. .NET Core/5+ 프로젝트에서 참조 DLL이 보관된 공통 디렉터리를 지정하는 방법
13118정성태8/18/20225448.NET Framework: 2043. WPF Color의 기본 색 영역은 (sRGB가 아닌) scRGB [2]
13117정성태8/17/20227570.NET Framework: 2042. C# 11 - 파일 범위 내에서 유효한 타입 정의 (File-local types)파일 다운로드1
13116정성태8/4/20228048.NET Framework: 2041. C# - Socket.Close 시 Socket.Receive 메서드에서 예외가 발생하는 문제파일 다운로드1
13115정성태8/3/20228415.NET Framework: 2040. C# - ValueTask와 Task의 성능 비교 [1]파일 다운로드1
13114정성태8/2/20228553.NET Framework: 2039. C# - Task와 비교해 본 ValueTask 사용법파일 다운로드1
13113정성태7/31/20227782.NET Framework: 2038. C# 11 - Span 타입에 대한 패턴 매칭 (Pattern matching on ReadOnlySpan<char>)
13112정성태7/30/20228184.NET Framework: 2037. C# 11 - 목록 패턴(List patterns) [1]파일 다운로드1
13111정성태7/29/20227991.NET Framework: 2036. C# 11 - IntPtr/UIntPtr과 nint/nuint의 통합파일 다운로드1
13110정성태7/27/20228031.NET Framework: 2035. C# 11 - 새로운 연산자 ">>>" (Unsigned Right Shift)파일 다운로드1
13109정성태7/27/20229406VS.NET IDE: 177. 비주얼 스튜디오 2022를 이용한 (소스 코드가 없는) 닷넷 모듈 디버깅 - "외부 원본(External Sources)" [1]
13108정성태7/26/20227421Linux: 53. container에 실행 중인 Golang 프로세스를 디버깅하는 방법 [1]
13107정성태7/25/20226632Linux: 52. Debian/Ubuntu 계열의 docker container에서 자주 설치하게 되는 명령어
13106정성태7/24/20226331오류 유형: 819. 닷넷 6 프로젝트의 "Conditional compilation symbols" 기본값 오류
... 16  17  18  19  [20]  21  22  23  24  25  26  27  28  29  30  ...