Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
(연관된 글이 1개 있습니다.)

C# - byte 배열을 Hex(16진수) 문자열로 고속 변환하는 방법

재미있는 답변이 있군요. ^^

How do you convert a byte array to a hexadecimal string, and vice versa?
; https://stackoverflow.com/questions/311165/how-do-you-convert-a-byte-array-to-a-hexadecimal-string-and-vice-versa

위의 글에 보면 byte 배열의 값을 각각 16진수 문자열로 변환하는 다양한 방법에 대해 성능을 비교한 덧글을 볼 수 있습니다. 그중에서 가장 빠른 방법이 "Lookup by byte unsafe (via CodesInChaos)"라고 소개하는데요,

How do you convert a byte array to a hexadecimal string, and vice versa?
 - Lookup by byte unsafe (via CodesInChaos)
; https://stackoverflow.com/questions/311165/how-do-you-convert-a-byte-array-to-a-hexadecimal-string-and-vice-versa/24343727#24343727

private static readonly uint[] _lookup32Unsafe = CreateLookup32Unsafe();
private static readonly uint* _lookup32UnsafeP = (uint*)GCHandle.Alloc(_lookup32Unsafe,GCHandleType.Pinned).AddrOfPinnedObject();

private static uint[] CreateLookup32Unsafe()
{
    var result = new uint[256];
    for (int i = 0; i < 256; i++)
    {
        string s=i.ToString("X2");
        if(BitConverter.IsLittleEndian)
            result[i] = ((uint)s[0]) + ((uint)s[1] << 16);
        else
            result[i] = ((uint)s[1]) + ((uint)s[0] << 16);
    }
    return result;
}

public static string ByteArrayToHexViaLookup32Unsafe(byte[] bytes)
{
    var lookupP = _lookup32UnsafeP;
    var result = new char[bytes.Length * 2];
    fixed(byte* bytesP = bytes)
    fixed (char* resultP = result)
    {
        uint* resultP2 = (uint*)resultP;
        for (int i = 0; i < bytes.Length; i++)
        {
            resultP2[i] = lookupP[bytesP[i]];
        }
    }
    return new string(result);
}

동적 프로그래밍을 할 때도 마찬가지고, 언제나 성능은 cache가 정답으로 보입니다. ^^ (혹시 저 소스 코드보다 더 빠르게 최적화하신 분이 계실까요? ^^)

실제로 비교를 한 번 해보겠습니다. 우선, 코드가 간단해서 우리가 흔히 쓰는 BitConverter를 이용한 방법과,

// BitConverter 버전

BitConverter.ToString(buf).Replace("-", "");

아무래도 저건 루프를 두 번 돌 테니 직접 만들어서 구현한 코드를 놓고,

// ToHex 버전

StringBuilder sb = new StringBuilder(buf.Length * 2);
foreach (byte b in buf)
{
    sb.Append(b.ToString("x2"));
}

return sb.ToString();

함께 비교해 보면 다음과 같은 성능 수치를 확인할 수 있습니다.

// x64 + Release 빌드, 8192 바이트에 대해 10,000 회 테스트

BitConverter : 1153
ToHex : 4738
UnsafeLookup : 91

오호... 의외군요, StringBuilder를 이용해 루프를 한 번 돌도록 만든 "ToHex" 버전보다 BitConverter가 더 빠릅니다. 물론, UnsafeLookup은 압도적으로 빠르고. ^^




그런데, ToHex 버전을 StringBuilder를 사용하지 않고 BitConverter의 내부 코드를 조금 인용해 다음과 같이 만들어 볼 수도 있습니다.

char[] text = new char[buf.Length * 2];

int srcPos = 0;
for (int dstPos = 0; dstPos < text.Length; dstPos += 2)
{
    byte b = buf[srcPos++];
    text[dstPos] = GetHexValue(((int)b) / 16);
    text[dstPos + 1] = GetHexValue(((int)b) % 16);
}

return new string(text);

static char GetHexValue(int number)
{
    if (number < 10)
    {
        return (char)(number + 48);
    }

    return (char)(number - 10 + 65);
}

그럼 BitConverter보다 성능이 (당연히) 더 좋습니다.

BitConverter : 1164
ToHex : 240
UnsafeLookup : 96

(그러니까, 괜히 코드를 어설프게 만들면 마이크로소프트 측에서 만든 BitConverter보다 못한 성능을 내는 것입니다. ^^)




아래는 이 글에서 테스트한 전체 소스 코드입니다. (첨부 파일로 프로젝트를 올려 두었습니다.)

using System;
using System.Diagnostics;
using System.Runtime.InteropServices;
using System.Text;

class Program
{
    static void Main(string[] args)
    {
        Action<int, string, Action<int, byte[]>, byte[]> action = (loopCount, title, work, arg) =>
      {
          Stopwatch st = new Stopwatch();
          st.Start();

          work(loopCount, arg);

          st.Stop();

          Console.WriteLine(title + " : " + st.ElapsedMilliseconds);
      };

        action(1, "BitConverter", UseBitConverter, new byte[] { 0 });
        action(1, "ToHex", ToHex, new byte[] { 0 });
        action(1, "UnsafeLookup", UnsafeLookup, new byte[] { 0 });

        Console.WriteLine();

        action(10000, "BitConverter", UseBitConverter, new byte[8192]);
        action(10000, "ToHex", ToHex, new byte[8192]);
        action(10000, "UnsafeLookup", UnsafeLookup, new byte[8192]);
    }

    private static void UseBitConverter(int loopCount, byte[] buf)
    {
        for (int i = 0; i < loopCount; i++)
        {
            BitConverter.ToString(buf).Replace("-", "");
        }
    }

    static string ConvertWithStringBuilder(byte[] buf)
    {
        StringBuilder sb = new StringBuilder(buf.Length * 2);
        foreach (byte b in buf)
        {
            sb.Append(b.ToString("x2"));
        }

        return sb.ToString();
    }

    static string ConvertToHex(byte[] buf)
    {
        char[] text = new char[buf.Length * 2];

        int srcPos = 0;
        for (int dstPos = 0; dstPos < text.Length; dstPos += 2)
        {
            byte b = buf[srcPos++];
            text[dstPos] = GetHexValue(((int)b) / 16);
            text[dstPos + 1] = GetHexValue(((int)b) % 16);
        }

        return new string(text);
    }

    static char GetHexValue(int number)
    {
        if (number < 10)
        {
            return (char)(number + 48);
        }

        return (char)(number - 10 + 65);
    }

    private static void ToHex(int loopCount, byte [] buf)
    {
        for (int i = 0; i < loopCount; i ++)
        {
            ConvertToHex(buf);

            // ConvertWithStringBuilder(buf);
        }
    }

    private static void UnsafeLookup(int loopCount, byte[] buf)
    {
        for (int i = 0; i < loopCount; i++)
        {
            ByteToHex.ByteArrayToHexViaLookup32Unsafe(buf);
        }
    }
}

public unsafe class ByteToHex
{
    private static readonly uint[] _lookup32Unsafe = CreateLookup32Unsafe();
    private static readonly uint* _lookup32UnsafeP = (uint*)GCHandle.Alloc(_lookup32Unsafe, GCHandleType.Pinned).AddrOfPinnedObject();

    private static uint[] CreateLookup32Unsafe()
    {
        var result = new uint[256];
        for (int i = 0; i < 256; i++)
        {
            string s = i.ToString("X2");
            if (BitConverter.IsLittleEndian)
                result[i] = ((uint)s[0]) + ((uint)s[1] << 16);
            else
                result[i] = ((uint)s[1]) + ((uint)s[0] << 16);
        }
        return result;
    }

    public static string ByteArrayToHexViaLookup32Unsafe(byte[] bytes)
    {
        var lookupP = _lookup32UnsafeP;
        var result = new char[bytes.Length * 2];
        fixed (byte* bytesP = bytes)
        fixed (char* resultP = result)
        {
            uint* resultP2 = (uint*)resultP;
            for (int i = 0; i < bytes.Length; i++)
            {
                resultP2[i] = lookupP[bytesP[i]];
            }
        }
        return new string(result);
    }
}




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 4/9/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2022-11-12 07시56분
[1111] 닷넷5 부터 System.Convert.ToHexString
[guest]
2022-11-14 11시11분
@1111 정보 감사합니다. ^^
정성태

1  2  3  4  5  6  7  [8]  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
13779정성태10/22/20245593개발 환경 구성: 729. WSL 2 - Mariner VM 커널 이미지 업데이트 방법
13778정성태10/21/20247119C/C++: 181. C/C++ - 소스코드 파일의 인코딩, 바이너리 모듈 상태의 인코딩
13777정성태10/20/20245553Windows: 265. Win32 API의 W(유니코드) 버전은 UCS-2일까요? UTF-16 인코딩일까요?
13776정성태10/19/20246575C/C++: 180. C++ - 고수준 FILE I/O 함수에서의 Unicode stream 모드(_O_WTEXT, _O_U16TEXT, _O_U8TEXT)파일 다운로드1
13775정성태10/19/20246608개발 환경 구성: 728. 윈도우 환경의 개발자를 위한 UTF-8 환경 설정
13774정성태10/18/20246170Linux: 91. Container 환경에서 출력하는 eBPF bpf_get_current_pid_tgid의 pid가 존재하지 않는 이유
13773정성태10/18/20245964Linux: 90. pid 네임스페이스 구성으로 본 WSL 2 + docker-desktop
13772정성태10/17/20246189Linux: 89. pid 네임스페이스 구성으로 본 WSL 2 배포본의 계층 관계
13771정성태10/17/20245926Linux: 88. WSL 2 리눅스 배포본 내에서의 pid 네임스페이스 구성
13770정성태10/17/20246389Linux: 87. ps + grep 조합에서 grep 명령어를 사용한 프로세스를 출력에서 제거하는 방법
13769정성태10/15/20247507Linux: 86. Golang + bpf2go를 사용한 eBPF 기본 예제파일 다운로드1
13768정성태10/15/20246783C/C++: 179. C++ - _O_WTEXT, _O_U16TEXT, _O_U8TEXT의 Unicode stream 모드파일 다운로드2
13767정성태10/14/20245695오류 유형: 929. bpftrace 수행 시 "ERROR: Could not resolve symbol: /proc/self/exe:BEGIN_trigger"
13766정성태10/14/20245164C/C++: 178. C++ - 파일에 대한 Text 모드의 "translated" 동작파일 다운로드1
13765정성태10/12/20246418오류 유형: 928. go build 시 "package maps is not in GOROOT" 오류
13764정성태10/11/20246982Linux: 85. Ubuntu - 원하는 golang 버전 설치
13763정성태10/11/20245915Linux: 84. WSL / Ubuntu 20.04 - bpftool 설치
13762정성태10/11/20246085Linux: 83. WSL / Ubuntu 22.04 - bpftool 설치
13761정성태10/11/20245788오류 유형: 927. WSL / Ubuntu - /usr/include/linux/types.h:5:10: fatal error: 'asm/types.h' file not found
13760정성태10/11/20246895Linux: 82. Ubuntu - clang 최신(stable) 버전 설치
13759정성태10/10/20247930C/C++: 177. C++ - 자유 함수(free function) 및 주소 지정 가능한 함수(addressable function) [6]
13758정성태10/8/20246625오류 유형: 926. dotnet tools를 sudo로 실행하는 경우 command not found
13757정성태10/8/20246905닷넷: 2306. Linux - dotnet tool의 설치 디렉터리가 PATH 환경변수에 자동 등록이 되는 이유
13756정성태10/8/20247092오류 유형: 925. ssh로 docker 접근을 할 때 "... malformed HTTP status code ..." 오류 발생
13755정성태10/7/20247673닷넷: 2305. C# 13 - (9) 메서드 바인딩의 우선순위를 지정하는 OverloadResolutionPriority 특성 도입 (Overload resolution priority)파일 다운로드1
13754정성태10/4/20246753닷넷: 2304. C# 13 - (8) 부분 메서드 정의를 속성 및 인덱서에도 확대파일 다운로드1
1  2  3  4  5  6  7  [8]  9  10  11  12  13  14  15  ...