Microsoft MVP성태의 닷넷 이야기
.NET Framework: 135. C# - Deflate, GZip, Zip [링크 복사], [링크+제목 복사],
조회: 33387
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 
(연관된 글이 1개 있습니다.)
(시리즈 글이 2개 있습니다.)
.NET Framework: 135. C# - Deflate, GZip, Zip
; https://www.sysnet.pe.kr/2/0/723

.NET Framework: 136. 자바와 닷넷의 압축 호환
; https://www.sysnet.pe.kr/2/0/724





C# - Deflate, GZip, Zip


보통 압축 알고리즘을 다루다 보면 쉽게 볼 수 있는 단어들이 있는데요. 각각의 차이점에 대해서 다음의 글에 간략하게 설명되어 있습니다.

Re: Difference between gzip, zip, deflate
; http://newsgroups.derkeiler.com/Archive/Comp/comp.compression/2007-07/msg00011.html

정리해 보면 대략 다음과 같은 정도로만 알아둬도 될 것 같습니다.

  • Deflate = 원시 압축 데이터
  • GZip = Header + Deflate 데이터 + Footer
  • Zip = 다양한 압축 포맷, 다중 파일 지원

그렇다면, 닷넷으로는 이를 어떻게 구현할까요?

우선, Deflate는 DeflateStream으로 .NET 2.0에서부터 지원되고 있습니다. 그런 의미에서 DeflateStream은 Header/Footer에 대한 부가적인 데이터를 포함하지 않고 LZ77/허프만 코딩이 적용되어 산출된 원시 압축 데이터만을 다루기 때문에 즉석으로 사용할 수 있는 용도로 적합합니다. 아쉬운 점이 있다면 다양한 압축률 지정이 안 된다는 것입니다. 게다가 내부적으로 Huffman_only 방식으로만 사용할지에 대한 옵션 및 그에 대한 구현 방법도 명시적으로 공개되어 있지 않습니다.

구체적인 사용 예제는 MSDN 도움말에 잘 공개되어 있습니다. (도움말에도 나오지만, 4GB 이상의 파일에는 적용할 수 없습니다.)

.NET Framework Class Library - DeflateStream Class
; https://learn.microsoft.com/en-us/dotnet/api/system.io.compression.deflatestream

특이한 것은, 보통 일반적인 Deflate 라이브러리 같은 데에서 보면 압축은 Deflate, 압축 해제는 Inflate라는 접두어를 써서 표현하고는 하는데 .NET의 경우에는 2가지 모두 단일하게 DeflateStream의 생성자에서 CompressionMode를 지정하는 것으로 해결하고 있습니다.

다음으로 GZip은, 여러분들이 많이 써온 GZipStream과 비교됩니다. 위에 설명한 대로 Deflate 압축 데이터와 함께 앞/뒤에 부가적인 메타 정보를 포함합니다. 재미있는 것은 GZipStream이 말 그대로 "Stream" 차원에서 사용될 수 있도록 구현되었기 때문에 "하나의 파일"을 압축해서 보관하는 일반적인 ZIP 실행 파일에서 다뤄지는 헤더를 모두 포함하지는 않습니다. 이에 관해서는 다음의 토픽에서 자세히 설명하고 있는데요.

. NET Matters - NamedGZipStream, Covariance and Contravariance
; https://learn.microsoft.com/en-us/archive/msdn-magazine/2005/october/net-matters-namedgzipstream-covariance-and-contravariance

The GZipStream class implements the GZIP file format as defined in RFC 1952. The GZIP file format makes use of the DEFLATE compression algorithm, detailed in RFC 1951, and simply defines a header and footer that are used to encapsulate the compressed data, providing some metadata for it.

The problem you're running into is that the GZIP header format declares the name of the compressed file as optional.



따라서, 만약 파일 이름까지 포함하는 헤더를 지원하는 압축 데이터를 원한다면 위의 토픽에서 제공되는 NamedGZipStream을 사용하거나, 아니면 그에 준하는 기능을 지원하는 여타 공개된 라이브러리를 사용하셔야 합니다.

마지막으로, Zip에 대응되는 닷넷 기본 클래스는 존재하지 않습니다. 물론 고맙게도 다른 분들이 만들어 놓은 공개 라이브러리들이 있습니다.

DotNetZip - Zip file manipulation in .NET languages
; http://www.codeplex.com/DotNetZip

SharpZipLib
; http://www.icsharpcode.net/OpenSource/SharpZipLib/

그럼... 좀 정리가 된 것 같죠! ^^



[이 토픽에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 11/25/2024]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




... 151  152  153  154  155  156  157  [158]  159  160  161  162  163  164  165  ...
NoWriterDateCnt.TitleFile(s)
1100정성태8/17/201128909.NET Framework: 236. SqlDbType - DateTime, DateTime2, DateTimeOffset의 차이점파일 다운로드1
1099정성태8/15/201128341오류 유형: 132. 어느 순간 갑자기 접속이 안 되는 TFS 서버
1098정성태8/15/201150357웹: 24. 네이버는 어떻게 로그인 처리를 할까요? [2]
1097정성태8/15/201121655.NET Framework: 235. 메서드의 메타 데이터 토큰 값으로 클래스를 찾아내는 방법
1096정성태8/15/201125794디버깅 기술: 42. Watson Bucket 정보를 이용한 CLR 응용 프로그램 예외 분석 - (2)
1095정성태8/14/201126226디버깅 기술: 41. Windbg - 비정상 종료된 닷넷 프로그램의 StackTrace에서 보이는 offset 값 의미
1094정성태8/14/201130612오류 유형: 131. Fiddler가 강제 종료된 경우, 웹 사이트 방문이 안되는 현상
1093정성태7/27/201124234오류 유형: 130. Unable to connect to the Microsoft Visual Studio Remote Debugging Monitor ... Access is denied.
1092정성태7/22/201126637Team Foundation Server: 46. 코드 이외의 파일에 대해 소스 제어에서 제외시키는 방법
1091정성태7/21/201125677개발 환경 구성: 128. WP7 Emulator 실행 시 audiodg.exe의 CPU 소모율 증가 [2]
1089정성태7/18/201131257.NET Framework: 234. 왜? Button 컨트롤에는 MouseDown/MouseUp 이벤트가 발생하지 않을까요?파일 다운로드1
1088정성태7/16/201124305.NET Framework: 233. Entity Framework 4.1 - 윈도우 폰 7에서의 CodeFirst 순환 참조 문제파일 다운로드1
1087정성태7/15/201127022.NET Framework: 232. Entity Framework 4.1 - CodeFirst 개체의 직렬화 시 순환 참조 해결하는 방법 - 두 번째 이야기파일 다운로드1
1086정성태7/14/201128448.NET Framework: 231. Entity Framework 4.1 - CodeFirst 개체의 직렬화 시 순환 참조 해결하는 방법 [1]파일 다운로드1
1085정성태7/14/201128893.NET Framework: 230. Entity Framework 4.1 - Code First + WCF 서비스 시 EndpointNotFoundException 오류 - 두 번째 이야기파일 다운로드1
1084정성태7/11/201134176.NET Framework: 229. SQL 서버 - DB 테이블의 데이터 변경에 대한 알림 처리 [4]파일 다운로드1
1083정성태7/11/201128221.NET Framework: 228. Entity Framework 4.1 - Code First + WCF 서비스 시 EndpointNotFoundException 오류
1082정성태7/10/201127790.NET Framework: 227. basicHttpBinding + 사용자 정의 인증 구현 [2]파일 다운로드1
1081정성태7/9/201127110VC++: 53. Windows 7에서 gcc.exe 실행 시 Access denied 오류 [2]
1080정성태7/8/201125607웹: 23. Sysnet 웹 사이트의 HTML5 변환 기록 - 두 번째 이야기파일 다운로드1
1079정성태7/6/201130025오류 유형: 129. Hyper-V + Realtek 랜카드가 설치된 시스템의 BSOD 현상 [2]
1078정성태7/5/201137540VC++: 52. Chromium 컴파일하는 방법 [2]
1077정성태6/24/201135173.NET Framework: 226. HttpWebRequest 타입의 HaveResponse 속성 이야기파일 다운로드1
1076정성태6/23/201129320오류 유형: 128. SQL Express - User Instance 옵션을 사용한 경우 발생하는 오류 메시지 유형 2가지
1075정성태6/21/201124933VS.NET IDE: 69. 윈폰 프로젝트에서 WCF 서비스 참조할 때 Reference.cs 파일이 비어있는 경우
1074정성태6/20/201125027.NET Framework: 225. 닷넷 네트워크 라이브러리의 트레이스 기능파일 다운로드1
... 151  152  153  154  155  156  157  [158]  159  160  161  162  163  164  165  ...