Microsoft MVP성태의 닷넷 이야기
WebRequest 요청시 일본어 인코딩 관련 문의 [링크 복사], [링크+제목 복사],
조회: 20266
글쓴 사람
김기룡 (reverse79 at hotmail.com)
홈페이지
첨부 파일

안녕하세요.
네이버에서 일어 워드 번역 서비스가 있어서
매번 접속하는게 귀찮아서 간단하게 C#으로 해당 페이지에 요청해서 결과만 받아오려고 했는데
POST DATA요청때문에 몇 주째 막혀서 별의별 짓을 하다 안되서 문의 해 봅니다.ㅠㅠ;;

http://j2k.naver.com/short_trans/user_trans300_regform.php
위 URL은 네이버의 일한 번역 기능입니다.

http://j2k.naver.com/short_trans/user_trans300_result.php
위 URL에 POST 방식으로 아래와 같은 파라메터를 전달하면 됩니다.

"mode=j2k&body=일어문장"

여기서 궁금한것은 바로 body에 들어가는 [일어문장]이 죽어도 안된다는것입니다.^^;;
맨땅에 해딩하면서 테스트해 본 결과
테스트할 단어가 아래와 같다고 가정 할 경우..

[테스트 단어] メニュ?バ?はSwingの場合と比べると少し複?です。

"メニュ?バ?はSwingの場合と比べると少し複?です。" 단어가 입력되어야 하는데 EUC-KR 인코딩 셋의 경우
네이버에 요청들어갈때 "メニュ?バ?はSwingの場合と比べると少し複?です。" 처럼 변해서 들어가더군요.
첫 문장에서 ?로 일부 단어가 변해서 전송되더라구요.

System.Web.HttpUtility.UrlEncode(requestWord, System.Text.Encoding.GetEncoding("EUC-KR"));
처럼 EUC-KR형태로 변환해서 전달하면 아래처럼 됩니다.

mode=j2k&body=%AB%E1%AB%CB%AB%E5%3F%AB%D0%3F%AA%CFSwing%AA%CE%ED%DE%F9%EA%AA%C8%DD%EF%AA%D9%AA%EB%AA%C8%E1%B4%AA%B7%DC%DC%3F%AA%C7%AA%B9%A1%A3

EUC-KR의 표현범위를 벗어나서 그런것 같은데 정확한 인코딩 셋을 모르겠네요.
UTF-8의 경우에는 화면상에는 정확히 표현되지만 막상 전달되는 데이터는 틀리더라구요.


정확하게 전달되려면 아래처럼 되어야 합니다.
mode=j2k&body=%83%81%83j%83%85%81%5B%83o%81%5B%82%CDSwing%82%CC%8F%EA%8D%87%82%C6%94%E4%82%D7%82%E9%82%C6%8F%AD%82%B5%95%A1%8EG%82%C5%82%B7%81B

즉, body 부분을 보면 EUC-KR의 경우 %AB%E1%AB 처럼 시작하는데
제대로 전송되려면 %83%81%83 처럼 인코딩되어야 하는데 이렇게 인코딩 하려면 어떤식으로 전달해야 하는지 모르겠네요^^;;

メニュ?バ? 단어가 メニュ?バ? 로 깨져서 전달되는 것과 관련이 있는것 같은데...

원래 구현중인 소스는 리치 텍스트박스에서 입력된 문장을 입력받아서 전달하는 방식으로 구현되어있지만
간단하게 테스트할 수 있는 소스를 작성하면 아래와 같습니다.

참고로, 번역결과는 "도구모음은 Swing의 경우와 비교하면 조금 복잡합니다." 입니다.

HttpWebResponse 의 응답결과는 UTF-8이 맞는거 같은데
POST DATA를 전송할때는 어떤식으로 인코딩해서 전송해야 제대로된 결과값을 받을 수 있는지 모르겠네요.

[C#소스]
string Url = "http://j2k.naver.com/short_trans/user_trans300_result.php";
string requestWord = "メニュ?バ?はSwingの場合と比べると少し複?です。";
string postParams = "";

postParams = "mode=j2k&body=" + System.Web.HttpUtility.UrlEncode(requestWord, System.Text.Encoding.GetEncoding("EUC-KR"));

Encoding encoding = Encoding.Default;
byte[] postData = encoding.GetBytes(postParams.ToString());
 
// HttpWebRequest 오브젝트 생성
HttpWebRequest wReqFirst = (HttpWebRequest)WebRequest.Create(Url);

// HttpWebRequest 오브젝트 설정
wReqFirst.Method = "POST";
wReqFirst.ContentType = "application/x-www-form-urlencoded";
wReqFirst.ContentLength = postData.Length;

// POST할 데이터를 입력합니다.
Stream postDataStream = wReqFirst.GetRequestStream();
postDataStream.Write(postData, 0, postData.Length);
postDataStream.Close();

 
HttpWebResponse wRespFirst = (HttpWebResponse)wReqFirst.GetResponse();

// Response의 결과를 스트림을 생성합니다.
StreamReader readerPost = new StreamReader(respPostStream, Encoding.UTF8);

// 생성한 스트림으로부터 string으로 변환합니다.
string resultPost = readerPost.ReadToEnd();



참고로, 웹 브라우저에서 테스트가 수월하도록 "naverJapanTest.html" 파일을 첨부합니다.
해당 파일은 윈도우즈 기본 인코딩 셋으로 저장했기때문에 실행하시면

"メニュ?バ?はSwingの場合と比べると少し複?です。" 단어가
"メニュ?バ?はSwingの場合と比べると少し複?です。" 처럼 일부 단어가 ?로 깨져서 나옵니다.

하지만, 재미있는건(?) 첨부된 파일처럼 기본 언어셋으로 한 상태에서
입력단어를 "メニュ?バ?はSwingの場合と比べると少し複?です。"로 직접 붙여넣고 테스트하면 정상적으로 결과가 나오더군요.

html파일을 "メニュ?バ?はSwingの場合と比べると少し複?です。" 단어가 제대로 나오는 UTF-8형식으로 저장한후 테스트 하면
화면에는단어는 제대로 나오지만 제일 중요한 결과가 엉뚱하게 나오더라구요^^;;;
팝업창의 소스를 보기하면 해당 사이트는 인코딩셋이 UTF-8이던데 정작 UTF-8로 요청하면 왜 안되는건지^^;;;

C#과 웹 전송과정중 인코딩 셋등 복잡한 관계가 얽혀있는것 같은데 C#을 잘 모르다보니 도움을 부탁드려봅니다.








[최초 등록일: ]
[최종 수정일: 12/3/2007]


비밀번호

댓글 작성자
 



2007-12-03 05시57분
UTF-8형식이 아니라 그런지 글 읽기를 하니 입력한 단어가 깨져서 나오는군요^^;;

UTF-8형식으로해서 테스트할 단어를 첨부합니다.
수정 기능에서는 파일 첨부가 안되더라구요^^

좋은하루되세요.
김기룡
2007-12-03 05시57분
혹시 모르니 EUC-KR 말고 iso-8859-1 (28591)이나 DEFAULT로 해보심이 어떨런지 조심스럽게 추측해봅니다
정성태
2007-12-03 05시57분
관심 갖어 주셔서 감사드립니다.
혹시나 해서 그 당시 알고있는 대부분의 인코딩들을 하나씩 대입시에
iso-8859-1이나 Default로는 안되었었습니다.
28591는 뭔지 모르겠네요^^;;
하두 하다 안되고 이젠 시간이 없어서 은근 슬쩍 포기상태가 되어 버렸네요^^
일다는 제가 좀더 내공을 쌓아야 할거 같아요.
김기룡

... [61]  62  63  64  65  66  67  68  69  70  71  72  73  74  75  ...
NoWriterDateCnt.TitleFile(s)
1125박홍균3/19/201316675안녕하십니까. visual studio 에서 TFS 접속 관련으로 궁금한 점 여쭤봅니다.
1124궁금이3/18/201320014IIS 서버 이중화 구성시 데이터 베이스 트랜잭션 관리에 관해서... [1]
1127궁금이3/19/201317126    답변글 [답변]: IIS 서버 이중화 구성시 데이터 베이스 트랜잭션 관리에 관해서...(정성태님 봐주세요)
1122김시현3/11/201318835 Xamarin 에 관련하여 질문드립니다. [4]
1121롬메달2/14/201319536Assembly.Load로 얻은 객체안에서 제3의 어셈블리를 참조할때의 문제입니다. [8]
1120Lyn2/12/201319014안녕하세요. 블로그에 기술관련글을 꾸준히 포스팅 하실 수 있는 원동력이 궁금합니다. [1]
1119박진영2/4/201342000닷넷 DLL 실행 에러 (보호된 메모리를 읽거나 쓰려고 했습니다..) [2]파일 다운로드1
1118C#조으다1/29/201321221공유기 관리 페이지에 접근시 윈도우 인증창이 뜹니다. [4]
1117최윤호1/28/201318906답변주셔서 감사합니다 질문의 요지는 그게 아니고 [1]파일 다운로드1
1116C#조으다1/27/201325714비프음을 컴퓨터 내장 스피커로 출력하려면.. [2]
1114박재율12/28/201219441WCF 세션과 스트리밍 동시사용에 관해. [1]
1113박진영12/28/201230778윈도우 2008 64비트 닷넷 오류 문의드립니다. [13]
1112이대근12/18/201224377[질문] odp.net 배포 관련 궁금한게 있어서 질문좀 드릴게요 [3]
1111나그넹!12/13/201219810안녕하세요. 파일전송에 관련해서 궁금한것좀 여쭈고싶네요. [1]
1110김동현12/11/201222212안녕하세요 닷넷 신입개발자입니다 Clickonce 질문좀 하겠습니다. [6]파일 다운로드1
1109김성우12/5/201219272WCF IIS 호스팅 관련하여 질문 드립니다. [1]
1123윤용한3/13/201319352    답변글 [답변]: WCF IIS 호스팅 관련하여 질문 드립니다.
1107우라미윰11/22/201226526안녕하세요. RSA공개키 알고리즘에 나와있는 글을 보고 응용을 해야 하는데 막히는 부분이 있어서 질문드립니다. [3]파일 다운로드1
1106초급11/21/201219708WCF Server 인증서 및 Client 인증서 문의 [1]
1104hon11/17/201219345VS2008에서 디버그/릴리즈 환경중에 디버그 환경의 빌드시 배열의 자동 초기화 라는 것에 대해서 궁금합니다. [3]
1102최년호11/15/201220799[탭 브라우저의 윈도우 핸들 구하기] 예제에서 활성화 방법 [1]
1100박진영11/7/201228718[긴급] 코드 액세스 보안 정책(CASPOL.exe) 설정해도 SmartClient 보안에러가 발생합니다. [6]
1099Hyey...10/22/201221785php에서 c file compile [4]
1095이지은10/8/201240215중단점이 현재 적중되지 않았습니다 [3]
1094고민남10/6/201219840NScreen 에 대해 어떻게 생각하십니까? [1]
1093이지수10/6/201219208vbs [1]
... [61]  62  63  64  65  66  67  68  69  70  71  72  73  74  75  ...