(연관된 글이 1개 있습니다.)

행렬 연산으로 본 해밍코드

코딩 더 매트릭스 책에,

코딩 더 매트릭스 
; http://www.yes24.co.kr/24/goods/17967245

해밍코드를 설명하는 절이 나옵니다. 그런데, 번역서를 보면 이게 도대체 무슨 말인가 싶을 정도로 난해합니다. 왜냐하면, 글을 쓴 저자는 이미 독자가 해밍코드와 행렬의 관계에 대해 알고 있다는 가정으로 글을 쓴 것이기 때문에 다소 뜬금없는 내용이 나옵니다.

예를 들어, "5.7.4 선형 코드" 절에 보면 다음과 같은 말이 나옵니다.

선형코드에서 코드워드의 집합 C는 행렬 H의 영공간이다.

라고 하는데, 행렬 H가 어떤 것이라는 설명이 없습니다. 그러면서 "5.7.5 해밍코드" 절에서는 다음과 같은 설명이 등장합니다.

해밍코드에서 코드워드들은 7-벡터들이다.

 $H = \begin{bmatrix} 0 & 0 & 0 & 1 & 1 & 1 & 1 \\ 0 & 1 & 1 & 0 & 0 & 1 & 1 \\ 1 & 0 & 1 & 0 & 1 & 0 & 1 \\ \end{bmatrix}$

그러니까 마치 그다음의 H 행렬이 코드워드의 표현인 것처럼 번역된 것입니다. 그런데, 원문은 다음과 같이 설명하고 있습니다.

In the Hamming code, the codewords are 7-vectors 

 $H = \begin{bmatrix} 0 & 0 & 0 & 1 & 1 & 1 & 1 \\ 0 & 1 & 1 & 0 & 0 & 1 & 1 \\ 1 & 0 & 1 & 0 & 1 & 0 & 1 \\ \end{bmatrix}$

원문에는 ", and"가 있어서 의미가 확 달라집니다. 즉, 원래는 다음과 같이 번역되어야 하는 것입니다.

해밍 코드에서는, 코드워드는 7-벡터들이고 행렬 H는 다음과 같이 정의된다.

 $H = \begin{bmatrix} 0 & 0 & 0 & 1 & 1 & 1 & 1 \\ 0 & 1 & 1 & 0 & 0 & 1 & 1 \\ 1 & 0 & 1 & 0 & 1 & 0 & 1 \\ \end{bmatrix}$

기왕 말이 나왔으니, 좀 더 정리를 해볼까요? ^^

책에서 예를 든 해밍 코드는 데이터 4비트 기준으로 패리티 3비트를 합치는 7-벡터의 코드워드를 기준으로 설명합니다. 그리고 해밍 코드 내용을 읽기 전, 해밍 코드를 행렬 연산으로 다룰 때 나오는 G와 H라는 2개의 대표적인 행렬을 알아야 합니다.

우선 행렬 G는 다음과 같습니다.

 $G = \begin{bmatrix} 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \\ 0 & 1 & 1 & 1 \\ 1 & 0 & 1 & 1 \\ 1 & 1 & 0 & 1 \\ \end{bmatrix}$

이 행렬이 재미있는 것은 4비트의 값을 G 행렬에 곱하면 인코딩된 7비트의 코드워드가 나온다는 점입니다.

이 과정을 MATLAB(또는 Octave)로 표현해 보면 다음과 같습니다. 우선, 행렬 G를 표현하고,

G = [1 0 0 0;
     0 1 0 0;
     0 0 1 0;
     0 0 0 1;
     0 1 1 1;
     1 0 1 1;
     1 1 0 1];

4비트가 가질 수 있는 데이터의 행렬을 마련한 다음,

data = [0 0 0 0;
        0 0 0 1;
        0 0 1 0;
        0 0 1 1;
        0 1 0 0;
        0 1 0 1;
        0 1 1 0;
        0 1 1 1;
        1 0 0 0;
        1 0 0 1;
        1 0 1 0;
        1 0 1 1;
        1 1 0 0;
        1 1 0 1;
        1 1 1 0;
        1 1 1 1 ];

행렬 곱셈을 위해 행렬 data를 전치시킨 후 곱하고 2의 나머지를 취한 값으로 정리합니다.

codewords = G * data';
codewords = mod(codewords, 2);

마지막으로 나온 codewords를 읽기 쉽게 전치시켜서 출력해 보면,

>> codewords'
ans =

   0   0   0   0   0   0   0
   0   0   0   1   1   1   1
   0   0   1   0   1   1   0
   0   0   1   1   0   0   1
   0   1   0   0   1   0   1
   0   1   0   1   0   1   0
   0   1   1   0   0   1   1
   0   1   1   1   1   0   0
   1   0   0   0   0   1   1
   1   0   0   1   1   0   0
   1   0   1   0   1   0   1
   1   0   1   1   0   1   0
   1   1   0   0   1   1   0
   1   1   0   1   0   0   1
   1   1   1   0   0   0   0
   1   1   1   1   1   1   1

이렇게 4비트의 데이터 값에 따른 각각의 인코딩된 7벡터의 코드워드 집합을 얻을 수 있습니다.

그래서, 행렬 G를 해밍 코드의 부호화에 사용하는 "생성 행렬"이라고 합니다. 그다음 행렬 H를 알아보기 전 잠시 "영공간(Null space)"에 대해 설명하겠습니다.

"코딩 더 매트릭스 " 책 182페이지에 정의된 것을 보면,

행렬 A의 영공간은 집합 {v: A * v = 0}이다. 이것은 Null A로 나타낸다.

라고 정의되어 있는데 쉽게 말하면 행렬 A에 어떤 벡터를 곱셈했을 때 그 결과가 0 벡터로 나오게 하는 그 벡터들의 집합을 영공간이라고 하는 것입니다.

예를 들면 행렬 A가 다음과 같다면,

 $A = \begin{bmatrix} 1 & 4 & 5 \\ 2 & 5 & 7 \\ 3 & 6 & 9 \\ \end{bmatrix}$

A * [1, 1, -1]을 곱하면 그 결과가 0 벡터가 나옵니다. MATLAB으로는 다음과 같이 간단하게 연산할 수 있습니다.

>> A = [1 2 3; 4 5 6; 5 7 9]'
A =

   1   4   5
   2   5   7
   3   6   9

>> A * [1 1 -1 ]'
ans =

   0
   0
   0

또한 [2 2 -2]를 곱해도 0 벡터가 나오고 , [3 3 -3],... 을 곱해도 0 벡터가 나옵니다. 이랬을 때 이 값들의 집합을 "영공간(Null sapce)"라고 하는 것입니다.

해밍 코드의 행렬 연산에서 재미있는 것은, 4비트 데이터 + 3비트 패리티 비트가 표현된 7-벡터의 코드 워드들이 전부 행렬 H에 대해 '영공간'이라는 것입니다. 확인을 위해 MATLAB(또는 Octave)으로 다음과 같이 간단하게 계산할 수 있습니다.

H = [0 0 0 1 1 1 1;
     0 1 1 0 0 1 1;
     1 0 1 0 1 0 1];
     
result = (H * codewords)';
result = mod(result, 2);

결과값인 행렬 result는 이렇게 나옵니다.

즉, 데이터 4비트가 인코딩된 7-벡터의 코드워드들은 무조건 행렬 H와 곱셈을 했을 때 결과가 0 벡터가 나와야 합니다. 이 때문에 행렬 H를 "확인 행렬"이라고도 합니다.

"코딩 더 매트릭스 " 책에서는 이를 "선형코드에서 코드워드의 집합 C는 행렬 H의 영공간이다"라는 한마디로 표현한 것입니다.

위의 행렬 연산을 염두에 두고 책을 다시 보면 이제 대충 이해가 갑니다.

4비트 데이터가 인코딩된 코드워드를 c, 오류 비트가 발생한 것을 e라고 보면 다음과 같이 $\bar{c}$ 가 계산됩니다.

 $\bar{c} = {c + e}$

물론, 오류 비트가 하나도 없다면 e = [0 0 0 0 0 0 0 ]일 뿐이고 c == $\bar{c}$ 가 될 뿐입니다. 반면, 오류 비트가 한 개 있는 경우라면 $\bar{c}$ 를 수신한 측에서 어떻게 $\bar{c}$ 만을 보고 오류 계산을 할 수 있는지 다음과 같은 수식으로 풀립니다.

H *  = H * (c + e)
       = H * c + H * e 
       = 0 + H * e 
       = H * e

위의 수식에서 "H * c + H * e = 0 + H * e"가 되는데요. 왜냐하면 "선형코드에서 코드워드의 집합 C는 행렬 H의 영공간"이기 때문에 결국 "H * c"의 결과는 0 벡터가 되는 것입니다.

따라서, 최종 정리는 "H * $\bar{c}$ = H * e"가 됩니다. 수신 측은 행렬 H가 알려져 있고 수신된 $\bar{c}$ 값을 가지고 있으므로 그것을 곱셈 연산을 하면, 그 결과는 "H * e"와 동일하게 되는 것입니다. 결국, 행렬 H와 수신된 코드워드만으로 오류가 발생한 e 벡터의 값을 알게 된 것입니다.

정말이지... 대단한 수학자들입니다. ^^

[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]

Math: 21. "Coding the Matrix" 문제 2.5.1 풀이

[최초 등록일: 8/13/2016]
[최종 수정일: 7/10/2021]

이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.

by SeongTae Jeong, mailto:techsharer at outlook.com

No	Writer	Date	Cnt.	Title	File(s)
12353	정성태	10/2/2020	22860	개발 환경 구성: 518. 비주얼 스튜디오에서 IIS 웹 서버로 "Web Deploy"를 이용해 배포하는 방법
12352	정성태	10/2/2020	25623	개발 환경 구성: 517. Hyper-V Internal 네트워크에 NAT을 이용한 인터넷 연결 제공
12351	정성태	10/2/2020	23551	오류 유형: 659. Nox 실행이 안 되는 경우 - Unable to bind to the underlying transport for ...
12350	정성태	9/25/2020	29791	Windows: 175. 윈도우 환경에서 클라이언트 소켓의 최대 접속 수 [2]	1
12349	정성태	9/25/2020	23082	Linux: 32. Ubuntu 20.04 - docker를 위한 tcp 바인딩 추가
12348	정성태	9/25/2020	23661	오류 유형: 658. 리눅스 docker - Got permission denied while trying to connect to the Docker daemon socket at unix:///var/run/docker.sock
12347	정성태	9/25/2020	38894	Windows: 174. WSL 2의 네트워크 통신 방법 [4]
12346	정성태	9/25/2020	21594	오류 유형: 657. IIS - http://localhost 방문 시 Service Unavailable 503 오류 발생
12345	정성태	9/25/2020	22778	오류 유형: 656. iisreset 실행 시 "Restart attempt failed." 오류가 발생하지만 웹 서비스는 정상적인 경우	1
12344	정성태	9/25/2020	24367	Windows: 173. 서비스 관리자에 "IIS Admin Service"가 등록되어 있지 않다면?
12343	정성태	9/24/2020	36398	.NET Framework: 945. C# - 닷넷 응용 프로그램에서 메모리 누수가 발생할 수 있는 패턴 [5]
12342	정성태	9/24/2020	24664	디버깅 기술: 171. windbg - 인스턴스가 살아 있어 메모리 누수가 발생하고 있는지 확인하는 방법
12341	정성태	9/23/2020	21443	.NET Framework: 944. C# - 인스턴스가 살아 있어 메모리 누수가 발생하고 있는지 확인하는 방법	1
12340	정성태	9/23/2020	21071	.NET Framework: 943. WPF - WindowsFormsHost를 담은 윈도우 생성 시 메모리 누수
12339	정성태	9/21/2020	20964	오류 유형: 655. 코어 모드의 윈도우는 GUI 모드의 윈도우로 교체가 안 됩니다.
12338	정성태	9/21/2020	22874	오류 유형: 654. 우분투 설치 시 "CHS: Error 2001 reading sector ..." 오류 발생
12337	정성태	9/21/2020	22621	오류 유형: 653. Windows - Time zone 설정을 바꿔도 반영이 안 되는 경우
12336	정성태	9/21/2020	27308	.NET Framework: 942. C# - WOL(Wake On Lan) 구현
12335	정성태	9/21/2020	37784	Linux: 31. 우분투 20.04 초기 설정 - 고정 IP 및 SSH 설치
12334	정성태	9/21/2020	22210	오류 유형: 652. windbg - !py 확장 명령어 실행 시 "failed to find python interpreter"
12333	정성태	9/20/2020	22919	.NET Framework: 941. C# - 전위/후위 증감 연산자에 대한 오버로딩 구현 (2)
12332	정성태	9/18/2020	24758	.NET Framework: 940. C# - Windows Forms ListView와 DataGridView의 예제 코드	1
12331	정성태	9/18/2020	24409	오류 유형: 651. repadmin /syncall - 0x80090322 The target principal name is incorrect.
12330	정성태	9/18/2020	24908	.NET Framework: 939. C# - 전위/후위 증감 연산자에 대한 오버로딩 구현 [2]	1
12329	정성태	9/16/2020	27848	오류 유형: 650. ASUS 메인보드 관련 소프트웨어 설치 후 ArmouryCrate.UserSessionHelper.exe 프로세스 무한 종료 현상
12328	정성태	9/16/2020	24271	VS.NET IDE: 150. TFS의 이력에서 "Get This Version"과 같은 기능을 Git으로 처리한다면?

AD BLOCK 해제 요청

행렬 연산으로 본 해밍코드