Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 

2의 30승 이상의 원소를 갖는 경우 버그가 발생하는 이진 검색(Binary Search) 코드

요 며칠 전에 재미있는 트윗을 하나 봤습니다. ^^

세상의 거의 모든 이진 검색, 머지 소트 구현에 버그가 있다고. 수십년 동안 잘 써왔지만, 요즘 들어 원소 개수가 10억개 넘는 경우 등이 생기면서 오동작이 발생한다는 얘기.
; https://twitter.com/roh0sun/status/757199922470858753

Nearly All Binary Searches and Mergesorts Are Broken (2006)
; https://twitter.com/roh0sun/status/757199922470858753

[Google Research Blog] Extra, Extra - Read All About It: Nearly All Binary Searches and Mergesorts are Broken 
; https://research.googleblog.com/2006/06/extra-extra-read-all-about-it-nearly.html

2006년도의 글인데, 그러니까 대부분의 이진 검색 코드에서 중간 위치를 결정하는 코드가 다음과 같이 되어 있을 텐데요.

int mid = (low + high) / 2;

low, high 변수의 타입이 signed integer이고 각각의 값이 2의 30승을 넘으면 오버플로우가 발생하게 됩니다. 따라서 mid의 값이 정상적인 값을 갖지 못하는 버그입니다. 이런 현상이 발생하는 경우는 (low + high)의 값이 Int32.MaxValue 이상이 되어야 하는데, 원소의 수가 230(1,073,741,823)개만 되어도 그렇게 됩니다. 왜냐하면 이진 검색의 특성상 우측으로 계속 재귀 호출이 되다 보면 low가 high의 값에 접근하기 때문입니다.

어쨌든 ^^ 구글다운 글입니다. 10억개의 데이터 정도는 우스울 테니.

블로그에서는 이를 완화하기 위해 다음의 코드를 제시합니다. (물론 완화입니다. 구글 정도되면 10억이나 20억이나 큰 차이는 없을 듯!)

int mid = low + ((high - low) / 2);

(또는)

mid = ((unsigned int)low + (unsigned int)high)) >> 1;

참고로, C#의 이진 검색 코드인 Array.BinarySearch 메서드를 보면 내부의 중간 위치 구하는 코드가 다음과 같이 되어 있습니다.

private static int GetMedian(int low, int hi)
{
    return (low + ((hi - low) >> 1));
}




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 5/26/2022]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




... 121  122  123  124  125  126  127  128  129  130  [131]  132  133  134  135  ...
NoWriterDateCnt.TitleFile(s)
1779정성태10/15/201419620오류 유형: 248. Active Directory에서 OU가 지워지지 않는 경우
1778정성태10/10/201418066오류 유형: 247. The Netlogon service could not create server share C:\Windows\SYSVOL\sysvol\[도메인명]\SCRIPTS.
1777정성태10/10/201421175오류 유형: 246. The processing of Group Policy failed. Windows attempted to read the file \\[도메인]\sysvol\[도메인]\Policies\{...GUID...}\gpt.ini
1776정성태10/10/201418180오류 유형: 245. 이벤트 로그 - Name resolution for the name _ldap._tcp.dc._msdcs.[도메인명]. timed out after none of the configured DNS servers responded.
1775정성태10/9/201419284오류 유형: 244. Visual Studio 디버깅 (2) - Unable to break execution. This process is not currently executing the type of code that you selected to debug.
1774정성태10/9/201426527개발 환경 구성: 246. IIS 작업자 프로세스의 20분 자동 재생(Recycle)을 끄는 방법
1773정성태10/8/201429726.NET Framework: 471. 웹 브라우저로 다운로드가 되는 파일을 왜 C# 코드로 하면 안되는 걸까요? [1]
1772정성태10/3/201418483.NET Framework: 470. C# 3.0의 기본 인자(default parameter)가 .NET 1.1/2.0에서도 실행될까? [3]
1771정성태10/2/201427996개발 환경 구성: 245. 실행된 프로세스(EXE)의 명령행 인자를 확인하고 싶다면 - Sysmon [4]
1770정성태10/2/201421597개발 환경 구성: 244. 매크로 정의를 이용해 파일 하나로 C++과 C#에서 공유하는 방법 [1]파일 다운로드1
1769정성태10/1/201424019개발 환경 구성: 243. Scala 개발 환경 구성(JVM, 닷넷) [1]
1768정성태10/1/201419421개발 환경 구성: 242. 배치 파일에서 Thread.Sleep 효과를 주는 방법 [5]
1767정성태10/1/201424586VS.NET IDE: 94. Visual Studio 2012/2013에서의 매크로 구현 - Visual Commander [2]
1766정성태10/1/201422388개발 환경 구성: 241. 책 "프로그래밍 클로저: Lisp"을 읽고 나서. [1]
1765정성태9/30/201425961.NET Framework: 469. Unity3d에서 transform을 변수에 할당해 사용하는 특별한 이유가 있을까요?
1764정성태9/30/201422176오류 유형: 243. 파일 삭제가 안 되는 경우 - The action can't be comleted because the file is open in System
1763정성태9/30/201423785.NET Framework: 468. PDB 파일을 연동해 소스 코드 라인 정보를 알아내는 방법파일 다운로드1
1762정성태9/30/201424501.NET Framework: 467. 닷넷에서 EIP/RIP 레지스터 값을 구하는 방법 [1]파일 다운로드1
1761정성태9/29/201421498.NET Framework: 466. 윈도우 운영체제의 보안 그룹 이름 및 설명 문자열을 바꾸는 방법파일 다운로드1
1760정성태9/28/201419768.NET Framework: 465. ICorProfilerInfo::GetILToNativeMapping 메서드가 0x80131358을 반환하는 경우
1759정성태9/27/201430954개발 환경 구성: 240. Visual C++ / x64 환경에서 inline-assembly를 매크로 어셈블리로 대체하는 방법파일 다운로드1
1758정성태9/23/201437772개발 환경 구성: 239. 원격 데스크톱 접속(RDP)을 기존의 콘솔 모드처럼 사용하는 방법 [1]
1757정성태9/23/201418360오류 유형: 242. Lync로 모임 참여 시 소리만 들리지 않는 경우 - 두 번째 이야기
1756정성태9/23/201427337기타: 48. NVidia 제품의 과다한 디스크 사용 [2]
1755정성태9/22/201434120오류 유형: 241. Unity Web Player를 설치해도 여전히 설치하라는 화면이 나오는 경우 [4]
1754정성태9/22/201424501VC++: 80. 내 컴퓨터에서 C++ AMP 코드가 실행이 될까요? [1]
... 121  122  123  124  125  126  127  128  129  130  [131]  132  133  134  135  ...