Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 
(연관된 글이 1개 있습니다.)

웹 브라우저로 다운로드가 되는 파일을 왜 C# 코드로 하면 안되는 걸까요?

다음과 같은 질문이 있군요.

파일 다운로드 방법 문의
; https://www.sysnet.pe.kr/3/0/1330

현상을 정리해 보면, 웹 브라우저로 "http://www.g2b.go.kr:8081/ep/co/fileDownload.do?fileTask=NOTIFY&fileSeq=20130700222::01::2::1" 경로의 파일을 다운로드 받으면 61KB 짜리 문서가 잘 내려받아지는 반면, 다음과 같이 코딩을 통해 다운로드를 시도해 보면,

using System;
using System.ComponentModel;

class Program
{
    static void Main(string[] args)
    {
        System.Net.WebClient webclient;
        webclient = new System.Net.WebClient();
        webclient.DownloadFileCompleted += new AsyncCompletedEventHandler(FileDownLoadCompleted);

        string sUrl = "http://www.g2b.go.kr:8081/ep/co/fileDownload.do?fileTask=NOTIFY&fileSeq=20130700222::01::2::1";
        webclient.DownloadFileAsync(new Uri(sUrl), "1.hwp");

        Console.ReadLine();
    }

    static void FileDownLoadCompleted(object sender, AsyncCompletedEventArgs e)
    {
        Console.WriteLine("Finished");
    }
}

이런 내용을 담은 1KB 짜리 오류 페이지가 다운로드됩니다.

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" lang="ko" xml:lang="ko">
<head>
    <meta http-equiv="Content-Type" content="text/html; charset=euc-kr" />
            
    <script type="text/javascript" src="/gov/koneps/co/js/crossDomain.js"></script>
            
    <script type="text/javascript">
        //<![CDATA[
        function toClose(){
            try{
                toCloseExc=true;
                alert('시스템 에러 - 관리자에게 문의하시기 바랍니다.');
                history.back(); return;
            }catch(e){
                self.close();
                return;
            }
        }
        //]]>
    </script>
</head>
<body onload="toClose();"></body>
</html>

원인이 뭘까요? ^^

이 문제는 기본적인 HTTP 프로토콜에 대한 특성을 이해하고 있다면 풀기 위한 태도가 달라질 수 있습니다.

HTTP 프로토콜은 HTTP 요청과 응답으로 이뤄져 있고, 이것을 서버에서 구분할 수 있는 방법이 없습니다. 즉, IE가 보내는 요청을 프로그램에서도 동일하게 맞춰서 보내준다면 웹 서버는 그것을 IE라고 착각할 수밖에 없을 정도라는 것입니다.

즉, 이런 경우 IE에서 보내는 요청으로부터 특수한 헤더 값이 있는데 C# 코드에서는 그것을 보내주지 않기 때문에 웹 서버는 이에 대한 차별적인 대우를 하는 것으로 미뤄짐작할 수 있습니다. 그렇다면 어떤 차별이 있는 걸까요? 이를 위해 F12 키를 눌러 (개발자 도구를 실행시켜) IE 에서 파일 다운로드를 시도할 때 네트워크 내용을 보면 됩니다.

filedownload_from_web_1.png

Request:    GET /ep/co/fileDownload.do?fileTask=NOTIFY&fileSeq=20130700222::01::2::1 HTTP/1.1
Accept: text/html, application/xhtml+xml, */*
Accept-Language:    ko-KR
User-Agent: Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.3; WOW64; Trident/7.0)
Accept-Encoding:    gzip, deflate
Host:   www.g2b.go.kr:8081
Connection: Keep-Alive

역시 이번에도 HTTP 프로토콜을 잘 이해하고 있다면 이 중에서 어떤 헤더가 영향을 끼쳤을지 몇 개의 후보를 빠르게 짚어낼 수 있을 텐데요. 설령 모른다고 해도 하나씩 시도해 보면 알 수 있습니다.

그리곤 결국에는 User-Agent를 맞춰주었을 때 www.g2b.go.kr 웹 서버 측에서 제대로 반응해 준다는 것을 알게 될 것입니다.

System.Net.WebClient webclient;
webclient = new System.Net.WebClient();

webclient.Headers.Add("User-Agent", "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.3; WOW64; Trident/7.0)");

webclient.DownloadFileCompleted += new AsyncCompletedEventHandler(FileDownLoadCompleted);

string sUrl = "...[생략]...";

webclient.DownloadFileAsync(...[생략]...);




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 6/27/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2016-10-13 08시02분
[김상구] 감사합니다
[guest]

... 61  62  63  64  65  66  67  68  [69]  70  71  72  73  74  75  ...
NoWriterDateCnt.TitleFile(s)
12211정성태4/27/202019264개발 환경 구성: 486. WSL에서 Makefile로 공개된 리눅스 환경의 C/C++ 소스 코드 빌드
12210정성태4/20/202020704.NET Framework: 903. .NET Framework의 Strong-named 어셈블리 바인딩 (1) - app.config을 이용한 바인딩 리디렉션 [1]파일 다운로드1
12209정성태4/13/202017409오류 유형: 614. 리눅스 환경에서 C/C++ 프로그램이 Segmentation fault 에러가 발생한 경우 (2)
12208정성태4/12/202015973Linux: 29. 리눅스 환경에서 C/C++ 프로그램이 Segmentation fault 에러가 발생한 경우
12207정성태4/2/202015818스크립트: 19. Windows PowerShell의 NonInteractive 모드
12206정성태4/2/202018437오류 유형: 613. 파일 잠금이 바로 안 풀린다면? - The process cannot access the file '...' because it is being used by another process.
12205정성태4/2/202015101스크립트: 18. Powershell에서는 cmd.exe의 명령어를 지원하진 않습니다.
12204정성태4/1/202015099스크립트: 17. Powershell 명령어에 ';' (semi-colon) 문자가 포함된 경우
12203정성태3/18/202017944오류 유형: 612. warning: 'C:\ProgramData/Git/config' has a dubious owner: '...'.
12202정성태3/18/202021203개발 환경 구성: 486. .NET Framework 프로젝트를 위한 GitLab CI/CD Runner 구성
12201정성태3/18/202018434오류 유형: 611. git-credential-manager.exe: Using credentials for username "Personal Access Token". [1]
12200정성태3/18/202018526VS.NET IDE: 145. NuGet + Github 라이브러리 디버깅 관련 옵션 3가지 - "Enable Just My Code" / "Enable Source Link support" / "Suppress JIT optimization on module load (Managed only)"
12199정성태3/17/202016169오류 유형: 610. C# - CodeDomProvider 사용 시 Unhandled Exception: System.IO.DirectoryNotFoundException: Could not find a part of the path '...\f2_6uod0.tmp'.
12198정성태3/17/202019530오류 유형: 609. SQL 서버 접속 시 "Cannot open user default database. Login failed."
12197정성태3/17/202018821VS.NET IDE: 144. .NET Core 콘솔 응용 프로그램을 배포(publish) 시 docker image 자동 생성 - 두 번째 이야기 [1]
12196정성태3/17/202015945오류 유형: 608. The ServicedComponent being invoked is not correctly configured (Use regsvcs to re-register).
12195정성태3/16/202018266.NET Framework: 902. C# - 프로세스의 모든 핸들을 열람 - 세 번째 이야기
12194정성태3/16/202020995오류 유형: 607. PostgreSQL - Npgsql.NpgsqlException: sorry, too many clients already
12193정성태3/16/202017908개발 환경 구성: 485. docker - SAP Adaptive Server Enterprise 컨테이너 실행 [1]
12192정성태3/14/202019932개발 환경 구성: 484. docker - Sybase Anywhere 16 컨테이너 실행
12191정성태3/14/202021044개발 환경 구성: 483. docker - OracleXE 컨테이너 실행 [1]
12190정성태3/14/202015624오류 유형: 606. Docker Desktop 업그레이드 시 "The process cannot access the file 'C:\Program Files\Docker\Docker\resources\dockerd.exe' because it is being used by another process."
12189정성태3/13/202021228개발 환경 구성: 482. Facebook OAuth 처리 시 상태 정보 전달 방법과 "유효한 OAuth 리디렉션 URI" 설정 규칙
12188정성태3/13/202026020Windows: 169. 부팅 시점에 실행되는 chkdsk 결과를 확인하는 방법
12187정성태3/12/202015586오류 유형: 605. NtpClient was unable to set a manual peer to use as a time source because of duplicate error on '...'.
12186정성태3/12/202017401오류 유형: 604. The SysVol Permissions for one or more GPOs on this domain controller and not in sync with the permissions for the GPOs on the Baseline domain controller.
... 61  62  63  64  65  66  67  68  [69]  70  71  72  73  74  75  ...