Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
(연관된 글이 1개 있습니다.)

C# - byte 배열을 Hex(16진수) 문자열로 고속 변환하는 방법

재미있는 답변이 있군요. ^^

How do you convert a byte array to a hexadecimal string, and vice versa?
; https://stackoverflow.com/questions/311165/how-do-you-convert-a-byte-array-to-a-hexadecimal-string-and-vice-versa

위의 글에 보면 byte 배열의 값을 각각 16진수 문자열로 변환하는 다양한 방법에 대해 성능을 비교한 덧글을 볼 수 있습니다. 그중에서 가장 빠른 방법이 "Lookup by byte unsafe (via CodesInChaos)"라고 소개하는데요,

How do you convert a byte array to a hexadecimal string, and vice versa?
 - Lookup by byte unsafe (via CodesInChaos)
; https://stackoverflow.com/questions/311165/how-do-you-convert-a-byte-array-to-a-hexadecimal-string-and-vice-versa/24343727#24343727

private static readonly uint[] _lookup32Unsafe = CreateLookup32Unsafe();
private static readonly uint* _lookup32UnsafeP = (uint*)GCHandle.Alloc(_lookup32Unsafe,GCHandleType.Pinned).AddrOfPinnedObject();

private static uint[] CreateLookup32Unsafe()
{
    var result = new uint[256];
    for (int i = 0; i < 256; i++)
    {
        string s=i.ToString("X2");
        if(BitConverter.IsLittleEndian)
            result[i] = ((uint)s[0]) + ((uint)s[1] << 16);
        else
            result[i] = ((uint)s[1]) + ((uint)s[0] << 16);
    }
    return result;
}

public static string ByteArrayToHexViaLookup32Unsafe(byte[] bytes)
{
    var lookupP = _lookup32UnsafeP;
    var result = new char[bytes.Length * 2];
    fixed(byte* bytesP = bytes)
    fixed (char* resultP = result)
    {
        uint* resultP2 = (uint*)resultP;
        for (int i = 0; i < bytes.Length; i++)
        {
            resultP2[i] = lookupP[bytesP[i]];
        }
    }
    return new string(result);
}

동적 프로그래밍을 할 때도 마찬가지고, 언제나 성능은 cache가 정답으로 보입니다. ^^ (혹시 저 소스 코드보다 더 빠르게 최적화하신 분이 계실까요? ^^)

실제로 비교를 한 번 해보겠습니다. 우선, 코드가 간단해서 우리가 흔히 쓰는 BitConverter를 이용한 방법과,

// BitConverter 버전

BitConverter.ToString(buf).Replace("-", "");

아무래도 저건 루프를 두 번 돌 테니 직접 만들어서 구현한 코드를 놓고,

// ToHex 버전

StringBuilder sb = new StringBuilder(buf.Length * 2);
foreach (byte b in buf)
{
    sb.Append(b.ToString("x2"));
}

return sb.ToString();

함께 비교해 보면 다음과 같은 성능 수치를 확인할 수 있습니다.

// x64 + Release 빌드, 8192 바이트에 대해 10,000 회 테스트

BitConverter : 1153
ToHex : 4738
UnsafeLookup : 91

오호... 의외군요, StringBuilder를 이용해 루프를 한 번 돌도록 만든 "ToHex" 버전보다 BitConverter가 더 빠릅니다. 물론, UnsafeLookup은 압도적으로 빠르고. ^^




그런데, ToHex 버전을 StringBuilder를 사용하지 않고 BitConverter의 내부 코드를 조금 인용해 다음과 같이 만들어 볼 수도 있습니다.

char[] text = new char[buf.Length * 2];

int srcPos = 0;
for (int dstPos = 0; dstPos < text.Length; dstPos += 2)
{
    byte b = buf[srcPos++];
    text[dstPos] = GetHexValue(((int)b) / 16);
    text[dstPos + 1] = GetHexValue(((int)b) % 16);
}

return new string(text);

static char GetHexValue(int number)
{
    if (number < 10)
    {
        return (char)(number + 48);
    }

    return (char)(number - 10 + 65);
}

그럼 BitConverter보다 성능이 (당연히) 더 좋습니다.

BitConverter : 1164
ToHex : 240
UnsafeLookup : 96

(그러니까, 괜히 코드를 어설프게 만들면 마이크로소프트 측에서 만든 BitConverter보다 못한 성능을 내는 것입니다. ^^)




아래는 이 글에서 테스트한 전체 소스 코드입니다. (첨부 파일로 프로젝트를 올려 두었습니다.)

using System;
using System.Diagnostics;
using System.Runtime.InteropServices;
using System.Text;

class Program
{
    static void Main(string[] args)
    {
        Action<int, string, Action<int, byte[]>, byte[]> action = (loopCount, title, work, arg) =>
      {
          Stopwatch st = new Stopwatch();
          st.Start();

          work(loopCount, arg);

          st.Stop();

          Console.WriteLine(title + " : " + st.ElapsedMilliseconds);
      };

        action(1, "BitConverter", UseBitConverter, new byte[] { 0 });
        action(1, "ToHex", ToHex, new byte[] { 0 });
        action(1, "UnsafeLookup", UnsafeLookup, new byte[] { 0 });

        Console.WriteLine();

        action(10000, "BitConverter", UseBitConverter, new byte[8192]);
        action(10000, "ToHex", ToHex, new byte[8192]);
        action(10000, "UnsafeLookup", UnsafeLookup, new byte[8192]);
    }

    private static void UseBitConverter(int loopCount, byte[] buf)
    {
        for (int i = 0; i < loopCount; i++)
        {
            BitConverter.ToString(buf).Replace("-", "");
        }
    }

    static string ConvertWithStringBuilder(byte[] buf)
    {
        StringBuilder sb = new StringBuilder(buf.Length * 2);
        foreach (byte b in buf)
        {
            sb.Append(b.ToString("x2"));
        }

        return sb.ToString();
    }

    static string ConvertToHex(byte[] buf)
    {
        char[] text = new char[buf.Length * 2];

        int srcPos = 0;
        for (int dstPos = 0; dstPos < text.Length; dstPos += 2)
        {
            byte b = buf[srcPos++];
            text[dstPos] = GetHexValue(((int)b) / 16);
            text[dstPos + 1] = GetHexValue(((int)b) % 16);
        }

        return new string(text);
    }

    static char GetHexValue(int number)
    {
        if (number < 10)
        {
            return (char)(number + 48);
        }

        return (char)(number - 10 + 65);
    }

    private static void ToHex(int loopCount, byte [] buf)
    {
        for (int i = 0; i < loopCount; i ++)
        {
            ConvertToHex(buf);

            // ConvertWithStringBuilder(buf);
        }
    }

    private static void UnsafeLookup(int loopCount, byte[] buf)
    {
        for (int i = 0; i < loopCount; i++)
        {
            ByteToHex.ByteArrayToHexViaLookup32Unsafe(buf);
        }
    }
}

public unsafe class ByteToHex
{
    private static readonly uint[] _lookup32Unsafe = CreateLookup32Unsafe();
    private static readonly uint* _lookup32UnsafeP = (uint*)GCHandle.Alloc(_lookup32Unsafe, GCHandleType.Pinned).AddrOfPinnedObject();

    private static uint[] CreateLookup32Unsafe()
    {
        var result = new uint[256];
        for (int i = 0; i < 256; i++)
        {
            string s = i.ToString("X2");
            if (BitConverter.IsLittleEndian)
                result[i] = ((uint)s[0]) + ((uint)s[1] << 16);
            else
                result[i] = ((uint)s[1]) + ((uint)s[0] << 16);
        }
        return result;
    }

    public static string ByteArrayToHexViaLookup32Unsafe(byte[] bytes)
    {
        var lookupP = _lookup32UnsafeP;
        var result = new char[bytes.Length * 2];
        fixed (byte* bytesP = bytes)
        fixed (char* resultP = result)
        {
            uint* resultP2 = (uint*)resultP;
            for (int i = 0; i < bytes.Length; i++)
            {
                resultP2[i] = lookupP[bytesP[i]];
            }
        }
        return new string(result);
    }
}




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 4/9/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2022-11-12 07시56분
[1111] 닷넷5 부터 System.Convert.ToHexString
[guest]
2022-11-14 11시11분
@1111 정보 감사합니다. ^^
정성태

... 31  32  33  [34]  35  36  37  38  39  40  41  42  43  44  45  ...
NoWriterDateCnt.TitleFile(s)
12789정성태8/18/20219489개발 환경 구성: 597. PyCharm - 윈도우 환경에서 WSL을 이용해 파이썬 앱 개발/디버깅하는 방법
12788정성태8/17/20217971.NET Framework: 1093. C# - 인터페이스의 메서드가 다형성을 제공할까요? (virtual일까요?)파일 다운로드1
12787정성태8/17/20218213.NET Framework: 1092. (책 내용 수정) "4.5.1.4 인터페이스"의 "인터페이스와 다형성"
12786정성태8/16/20219778.NET Framework: 1091. C# - Python range 함수 구현 (2) INumber<T>를 이용한 개선 [1]파일 다운로드1
12785정성태8/16/20218027.NET Framework: 1090. .NET 6 Preview 7에 추가된 숫자 형식에 대한 제네릭 연산 지원 [1]파일 다운로드1
12784정성태8/15/20217465오류 유형: 757. 구글 메일 - 아웃룩에서 메일 전송 시 Sending' reported error (0x800CCC0F, 0x800CCC92)
12783정성태8/15/20216969.NET Framework: 1089. C# - Indexer에 Range 및 람다 식을 이용한 필터 구현 [1]파일 다운로드1
12782정성태8/14/20216792오류 유형: 756. 파이썬 - 윈도우 환경에서 pytagcloud의 한글 출력 방법
12781정성태8/14/20218969오류 유형: 755. 파이썬 - konlpy 사용 시 JVM과 jpype1 관련 오류
12780정성태8/13/20217335.NET Framework: 1088. C# - 버스 노선 및 위치 정보 조회 API 사용을 위한 기초 라이브러리 [2]
12779정성태8/13/20219200개발 환경 구성: 596. 공공 데이터 포털에서 버스 노선 및 위치 정보 조회 API 사용법
12778정성태8/12/20216440오류 유형: 755. PyCharm - "Manage Repositories"의 목록이 나오지 않는 문제
12777정성태8/12/20218000오류 유형: 754. Visual Studio - Input or output cannot be redirected because the specified file is invalid.
12776정성태8/12/20217359오류 유형: 753. gunicorn과 uwsgi 함께 사용 시 ERR_CONNECTION_REFUSED
12775정성태8/12/202118300스크립트: 22. 파이썬 - 윈도우 환경에서 개발한 Django 앱을 WSL 환경의 gunicorn을 이용해 실행
12774정성태8/11/20218957.NET Framework: 1087. C# - Collection 개체의 다중 스레드 접근 시 "Operations that change non-concurrent collections must have exclusive access" 예외 발생
12773정성태8/11/20218144개발 환경 구성: 595. PyCharm - WSL과 연동해 Django App을 윈도우에서 리눅스 대상으로 개발
12772정성태8/11/20219626스크립트: 21. 파이썬 - 윈도우 환경에서 개발한 Django 앱을 WSL 환경의 uwsgi를 이용해 실행 [1]
12771정성태8/11/20218078Windows: 196. "Microsoft Windows Subsystem for Linux Background Host" / "Vmmem"을 종료하는 방법
12770정성태8/11/20218795.NET Framework: 1086. C# - Windows Forms 응용 프로그램의 자식 컨트롤 부하파일 다운로드1
12769정성태8/11/20216681오류 유형: 752. Python - ImportError: No module named pip._internal.cli.main 두 번째 이야기
12768정성태8/10/20217780.NET Framework: 1085. .NET 6에 포함된 신규 BCL API [1]파일 다운로드1
12767정성태8/10/20218864오류 유형: 752. Python - ImportError: No module named pip._internal.cli.main
12766정성태8/9/20217298Java: 32. closing inbound before receiving peer's close_notify
12765정성태8/9/20216652Java: 31. Cannot load JDBC driver class 'org.mysql.jdbc.Driver'
12764정성태8/9/202145112Java: 30. XML document from ServletContext resource [/WEB-INF/applicationContext.xml] is invalid
... 31  32  33  [34]  35  36  37  38  39  40  41  42  43  44  45  ...