Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
(연관된 글이 1개 있습니다.)

C# - byte 배열을 Hex(16진수) 문자열로 고속 변환하는 방법

재미있는 답변이 있군요. ^^

How do you convert a byte array to a hexadecimal string, and vice versa?
; https://stackoverflow.com/questions/311165/how-do-you-convert-a-byte-array-to-a-hexadecimal-string-and-vice-versa

위의 글에 보면 byte 배열의 값을 각각 16진수 문자열로 변환하는 다양한 방법에 대해 성능을 비교한 덧글을 볼 수 있습니다. 그중에서 가장 빠른 방법이 "Lookup by byte unsafe (via CodesInChaos)"라고 소개하는데요,

How do you convert a byte array to a hexadecimal string, and vice versa?
 - Lookup by byte unsafe (via CodesInChaos)
; https://stackoverflow.com/questions/311165/how-do-you-convert-a-byte-array-to-a-hexadecimal-string-and-vice-versa/24343727#24343727

private static readonly uint[] _lookup32Unsafe = CreateLookup32Unsafe();
private static readonly uint* _lookup32UnsafeP = (uint*)GCHandle.Alloc(_lookup32Unsafe,GCHandleType.Pinned).AddrOfPinnedObject();

private static uint[] CreateLookup32Unsafe()
{
    var result = new uint[256];
    for (int i = 0; i < 256; i++)
    {
        string s=i.ToString("X2");
        if(BitConverter.IsLittleEndian)
            result[i] = ((uint)s[0]) + ((uint)s[1] << 16);
        else
            result[i] = ((uint)s[1]) + ((uint)s[0] << 16);
    }
    return result;
}

public static string ByteArrayToHexViaLookup32Unsafe(byte[] bytes)
{
    var lookupP = _lookup32UnsafeP;
    var result = new char[bytes.Length * 2];
    fixed(byte* bytesP = bytes)
    fixed (char* resultP = result)
    {
        uint* resultP2 = (uint*)resultP;
        for (int i = 0; i < bytes.Length; i++)
        {
            resultP2[i] = lookupP[bytesP[i]];
        }
    }
    return new string(result);
}

동적 프로그래밍을 할 때도 마찬가지고, 언제나 성능은 cache가 정답으로 보입니다. ^^ (혹시 저 소스 코드보다 더 빠르게 최적화하신 분이 계실까요? ^^)

실제로 비교를 한 번 해보겠습니다. 우선, 코드가 간단해서 우리가 흔히 쓰는 BitConverter를 이용한 방법과,

// BitConverter 버전

BitConverter.ToString(buf).Replace("-", "");

아무래도 저건 루프를 두 번 돌 테니 직접 만들어서 구현한 코드를 놓고,

// ToHex 버전

StringBuilder sb = new StringBuilder(buf.Length * 2);
foreach (byte b in buf)
{
    sb.Append(b.ToString("x2"));
}

return sb.ToString();

함께 비교해 보면 다음과 같은 성능 수치를 확인할 수 있습니다.

// x64 + Release 빌드, 8192 바이트에 대해 10,000 회 테스트

BitConverter : 1153
ToHex : 4738
UnsafeLookup : 91

오호... 의외군요, StringBuilder를 이용해 루프를 한 번 돌도록 만든 "ToHex" 버전보다 BitConverter가 더 빠릅니다. 물론, UnsafeLookup은 압도적으로 빠르고. ^^




그런데, ToHex 버전을 StringBuilder를 사용하지 않고 BitConverter의 내부 코드를 조금 인용해 다음과 같이 만들어 볼 수도 있습니다.

char[] text = new char[buf.Length * 2];

int srcPos = 0;
for (int dstPos = 0; dstPos < text.Length; dstPos += 2)
{
    byte b = buf[srcPos++];
    text[dstPos] = GetHexValue(((int)b) / 16);
    text[dstPos + 1] = GetHexValue(((int)b) % 16);
}

return new string(text);

static char GetHexValue(int number)
{
    if (number < 10)
    {
        return (char)(number + 48);
    }

    return (char)(number - 10 + 65);
}

그럼 BitConverter보다 성능이 (당연히) 더 좋습니다.

BitConverter : 1164
ToHex : 240
UnsafeLookup : 96

(그러니까, 괜히 코드를 어설프게 만들면 마이크로소프트 측에서 만든 BitConverter보다 못한 성능을 내는 것입니다. ^^)




아래는 이 글에서 테스트한 전체 소스 코드입니다. (첨부 파일로 프로젝트를 올려 두었습니다.)

using System;
using System.Diagnostics;
using System.Runtime.InteropServices;
using System.Text;

class Program
{
    static void Main(string[] args)
    {
        Action<int, string, Action<int, byte[]>, byte[]> action = (loopCount, title, work, arg) =>
      {
          Stopwatch st = new Stopwatch();
          st.Start();

          work(loopCount, arg);

          st.Stop();

          Console.WriteLine(title + " : " + st.ElapsedMilliseconds);
      };

        action(1, "BitConverter", UseBitConverter, new byte[] { 0 });
        action(1, "ToHex", ToHex, new byte[] { 0 });
        action(1, "UnsafeLookup", UnsafeLookup, new byte[] { 0 });

        Console.WriteLine();

        action(10000, "BitConverter", UseBitConverter, new byte[8192]);
        action(10000, "ToHex", ToHex, new byte[8192]);
        action(10000, "UnsafeLookup", UnsafeLookup, new byte[8192]);
    }

    private static void UseBitConverter(int loopCount, byte[] buf)
    {
        for (int i = 0; i < loopCount; i++)
        {
            BitConverter.ToString(buf).Replace("-", "");
        }
    }

    static string ConvertWithStringBuilder(byte[] buf)
    {
        StringBuilder sb = new StringBuilder(buf.Length * 2);
        foreach (byte b in buf)
        {
            sb.Append(b.ToString("x2"));
        }

        return sb.ToString();
    }

    static string ConvertToHex(byte[] buf)
    {
        char[] text = new char[buf.Length * 2];

        int srcPos = 0;
        for (int dstPos = 0; dstPos < text.Length; dstPos += 2)
        {
            byte b = buf[srcPos++];
            text[dstPos] = GetHexValue(((int)b) / 16);
            text[dstPos + 1] = GetHexValue(((int)b) % 16);
        }

        return new string(text);
    }

    static char GetHexValue(int number)
    {
        if (number < 10)
        {
            return (char)(number + 48);
        }

        return (char)(number - 10 + 65);
    }

    private static void ToHex(int loopCount, byte [] buf)
    {
        for (int i = 0; i < loopCount; i ++)
        {
            ConvertToHex(buf);

            // ConvertWithStringBuilder(buf);
        }
    }

    private static void UnsafeLookup(int loopCount, byte[] buf)
    {
        for (int i = 0; i < loopCount; i++)
        {
            ByteToHex.ByteArrayToHexViaLookup32Unsafe(buf);
        }
    }
}

public unsafe class ByteToHex
{
    private static readonly uint[] _lookup32Unsafe = CreateLookup32Unsafe();
    private static readonly uint* _lookup32UnsafeP = (uint*)GCHandle.Alloc(_lookup32Unsafe, GCHandleType.Pinned).AddrOfPinnedObject();

    private static uint[] CreateLookup32Unsafe()
    {
        var result = new uint[256];
        for (int i = 0; i < 256; i++)
        {
            string s = i.ToString("X2");
            if (BitConverter.IsLittleEndian)
                result[i] = ((uint)s[0]) + ((uint)s[1] << 16);
            else
                result[i] = ((uint)s[1]) + ((uint)s[0] << 16);
        }
        return result;
    }

    public static string ByteArrayToHexViaLookup32Unsafe(byte[] bytes)
    {
        var lookupP = _lookup32UnsafeP;
        var result = new char[bytes.Length * 2];
        fixed (byte* bytesP = bytes)
        fixed (char* resultP = result)
        {
            uint* resultP2 = (uint*)resultP;
            for (int i = 0; i < bytes.Length; i++)
            {
                resultP2[i] = lookupP[bytesP[i]];
            }
        }
        return new string(result);
    }
}




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 4/9/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2022-11-12 07시56분
[1111] 닷넷5 부터 System.Convert.ToHexString
[guest]
2022-11-14 11시11분
@1111 정보 감사합니다. ^^
정성태

... 61  62  63  [64]  65  66  67  68  69  70  71  72  73  74  75  ...
NoWriterDateCnt.TitleFile(s)
12210정성태4/20/202016362.NET Framework: 903. .NET Framework의 Strong-named 어셈블리 바인딩 (1) - app.config을 이용한 바인딩 리디렉션 [1]파일 다운로드1
12209정성태4/13/202013866오류 유형: 614. 리눅스 환경에서 C/C++ 프로그램이 Segmentation fault 에러가 발생한 경우 (2)
12208정성태4/12/202012759Linux: 29. 리눅스 환경에서 C/C++ 프로그램이 Segmentation fault 에러가 발생한 경우
12207정성태4/2/202011839스크립트: 19. Windows PowerShell의 NonInteractive 모드
12206정성태4/2/202014672오류 유형: 613. 파일 잠금이 바로 안 풀린다면? - The process cannot access the file '...' because it is being used by another process.
12205정성태4/2/202011585스크립트: 18. Powershell에서는 cmd.exe의 명령어를 지원하진 않습니다.
12204정성태4/1/202011211스크립트: 17. Powershell 명령어에 ';' (semi-colon) 문자가 포함된 경우
12203정성태3/18/202013813오류 유형: 612. warning: 'C:\ProgramData/Git/config' has a dubious owner: '...'.
12202정성태3/18/202016614개발 환경 구성: 486. .NET Framework 프로젝트를 위한 GitLab CI/CD Runner 구성
12201정성태3/18/202014367오류 유형: 611. git-credential-manager.exe: Using credentials for username "Personal Access Token". [1]
12200정성태3/18/202014434VS.NET IDE: 145. NuGet + Github 라이브러리 디버깅 관련 옵션 3가지 - "Enable Just My Code" / "Enable Source Link support" / "Suppress JIT optimization on module load (Managed only)"
12199정성태3/17/202012191오류 유형: 610. C# - CodeDomProvider 사용 시 Unhandled Exception: System.IO.DirectoryNotFoundException: Could not find a part of the path '...\f2_6uod0.tmp'.
12198정성태3/17/202015374오류 유형: 609. SQL 서버 접속 시 "Cannot open user default database. Login failed."
12197정성태3/17/202014488VS.NET IDE: 144. .NET Core 콘솔 응용 프로그램을 배포(publish) 시 docker image 자동 생성 - 두 번째 이야기 [1]
12196정성태3/17/202012025오류 유형: 608. The ServicedComponent being invoked is not correctly configured (Use regsvcs to re-register).
12195정성태3/16/202014120.NET Framework: 902. C# - 프로세스의 모든 핸들을 열람 - 세 번째 이야기
12194정성태3/16/202016679오류 유형: 607. PostgreSQL - Npgsql.NpgsqlException: sorry, too many clients already
12193정성태3/16/202013250개발 환경 구성: 485. docker - SAP Adaptive Server Enterprise 컨테이너 실행 [1]
12192정성태3/14/202015617개발 환경 구성: 484. docker - Sybase Anywhere 16 컨테이너 실행
12191정성태3/14/202016702개발 환경 구성: 483. docker - OracleXE 컨테이너 실행 [1]
12190정성태3/14/202011604오류 유형: 606. Docker Desktop 업그레이드 시 "The process cannot access the file 'C:\Program Files\Docker\Docker\resources\dockerd.exe' because it is being used by another process."
12189정성태3/13/202017177개발 환경 구성: 482. Facebook OAuth 처리 시 상태 정보 전달 방법과 "유효한 OAuth 리디렉션 URI" 설정 규칙
12188정성태3/13/202020567Windows: 169. 부팅 시점에 실행되는 chkdsk 결과를 확인하는 방법
12187정성태3/12/202011335오류 유형: 605. NtpClient was unable to set a manual peer to use as a time source because of duplicate error on '...'.
12186정성태3/12/202013078오류 유형: 604. The SysVol Permissions for one or more GPOs on this domain controller and not in sync with the permissions for the GPOs on the Baseline domain controller.
12185정성태3/11/202013476오류 유형: 603. The browser service was unable to retrieve a list of servers from the browser master...
... 61  62  63  [64]  65  66  67  68  69  70  71  72  73  74  75  ...