ssh로 docker 접근을 할 때 "... malformed HTTP status code ..." 오류 발생
갑자기 잘 되던 docker ssh 접근이 이런 오류가 발생하기 시작했습니다.
c:\temp> docker -H ssh://testusr@192.168.100.50 ps
error during connect: Get "http://docker.example.com/v1.47/containers/json": net/http: HTTP/1.x transport connection broken: malformed HTTP status code "was"
관련해서 아래의 글을 보면,
Got an error with connecting daemon over ssh session #3019
; https://github.com/docker/cli/issues/3019
docker가 ssh 연결인 경우 어떤 옵션으로 연결을 시도하는지 확인할 수 있다고 합니다.
c:\temp> docker -H ssh://testusr@192.168.100.50 --debug version
time="2024-10-04T20:56:55+09:00" level=debug msg="commandconn: starting ssh with [-o ConnectTimeout=30 -T -l testusr -- 192.168.100.50 docker system dial-stdio]"
time="2024-10-04T20:56:55+09:00" level=debug msg="commandconn: starting ssh with [-o ConnectTimeout=30 -T -l testusr -- 192.168.100.50 docker system dial-stdio]"
time="2024-10-04T20:56:55+09:00" level=debug msg="commandconn: starting ssh with [-o ConnectTimeout=30 -T -l testusr -- 192.168.100.50 docker system dial-stdio]"
Client:
Version: 27.2.0
API version: 1.47
Go version: go1.21.13
Git commit: 3ab4256
Built: Tue Aug 27 14:17:17 2024
OS/Arch: windows/amd64
Context: default
error during connect: Get "http://docker.example.com/v1.47/version": net/http: HTTP/1.x transport connection broken: malformed HTTP status code "was"
위의 출력 결과를 보면, ssh의 연결 옵션은 대충 다음과 같다고 볼 수 있습니다.
c:\temp> ssh testusr@192.168.100.50 -o ConnectTimeout=30 -T
Welcome to Ubuntu 18.04.6 LTS (GNU/Linux 5.4.0-150-generic x86_64)
* Documentation: https://help.ubuntu.com
* Management: https://landscape.canonical.com
* Support: https://ubuntu.com/pro
/home/testusr/.profile was read
/home/testusr/.bashrc was read
따라서 위와 같은 명령어로 접속이 잘 되면 ssh 연결 자체는 문제가 없고, 결국 docker 측의 문제인 듯합니다.
그런데 해당 이슈에 보면, 오류 메시지의 "status code" 이후에 나오는 문자열이 제각각임을 알 수 있습니다.
error during connect: Get "http://docker.example.com/v1.47/containers/json": net/http: HTTP/1.x transport connection broken: malformed HTTP status code "was"
그리고 다음과 같은 덧글이 나오는데요,
figured it out for future folks landing here:
the remote instance had an 'echo' in bashrc (used for debugging something unrelated), which was tripping docker for some reason (presumably it wasn't expecting that in whatever output stream it was parsing)
removing it fixed it and things are working as expected now'
그러니까, ".bashrc"의 echo 출력을 제거해서 해결했다는 것입니다. 그러고 보니 ssh 연결 시 출력되는 결과에 저도 "echo" 출력이 있습니다.
$ source .bashrc
/home/testusr/.bashrc was read
게다가 오류 메시지에 있던 "status code"의 "was" 문자열이 저 출력에 포함돼 있는데요, 아마도 그로 인해 docker 측의 명령어 해석에 방해가 된 것이 아닌가 싶습니다.
어쨌든, .bashrc에 있는 echo 출력을 주석 처리해 저도 문제를 해결했습니다.
$ cat /home/testusr/.bashrc
# echo "/home/testusr/.bashrc was read"
# ~/.bashrc: executed by bash(1) for non-login shells.
# see /usr/share/doc/bash/examples/startup-files (in the package bash-doc)
# for examples
...[생략]...
그나저나, 희한하군요, 저 echo 출력은 원래 없었던 것인데 어떤 알 수 없는 동작에 의해 추가된 것입니다. 한 가지 더 이상한 것은, (.bashrc가 아닌) .profile에 있는 echo 출력은 문제가 되지 않는다는 점입니다. 단지 .bashrc의 경우 강제로 stderr로 출력을 시키면,
// echo that outputs to stderr
// https://stackoverflow.com/questions/2990414/echo-that-outputs-to-stderr
>&2 echo "/home/testusr/.bashrc was read"
// 또는,
echo "/home/testusr/.bashrc was read" >&2
이번엔 docker over ssh 명령어가 잘 실행됩니다. 그렇다면, .profile의 경우에는 출력 스트림이 다른 것일까요? 테스트를 위해 다음의 2줄을 .profile에 추가해 봤지만,
$ cat /home/testusr/.profile
echo "/home/testusr/.profile was read" >&1
echo "test was read" >&1
...[생략]...
결과는 동일하게 잘 실행됩니다. 음... ^^; 뭐가 문제인지 잘 모르겠군요, 암튼 그냥 무난하게 .bashrc의 echo를 삭제하면 됩니다. (혹시, 이유를 아시는 분 계실까요? ^^)
[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]