Microsoft MVP성태의 닷넷 이야기
.NET Framework: 276. 중복 없는 숫자를 랜덤으로 배열하는 방법 [링크 복사], [링크+제목 복사],
조회: 50260
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
(연관된 글이 1개 있습니다.)

중복 없는 숫자를 랜덤으로 배열하는 방법

데브피아에서 재미있는 질문이 있었군요. ^^

계산량 문제좀 질문 드리겠습니다. - Random함수 관련  
; http://www.devpia.com/MAEUL/Contents/Detail.aspx?BoardID=17&MAEULNO=8&no=141505&ref=141505

이야기를 정리하자면, a[50000] 배열이 있는데 이 안에 0 ~ 49999까지의 숫자를 중복되지 않게 random으로 배치하고 싶다는 것입니다.

우선, 질문자가 스스로 한 답변을 한번 볼까요?

=== [방법 1] ===
List<int> Area = Enumerable.Range(0, 50000).ToList();
Random rand = new Random((int)DateTime.Now.Ticks);
List<int> list = new List<int>(50000);
for (int i = 0; i < Area.Count; i++)
{
    int num = rand.Next(Area.Count);
    int num2 = Area[num];
    Area.RemoveAt(num);
    list.Add(num2);
}

Stopwatch로 시간을 재어보면, ElapsedMilliseconds == 418이 걸립니다. 자, 이것이 느린 걸까요? 빠른 걸까요?

계속해서 "계산량 문제좀 질문 드리겠습니다. - Random함수 관련" 글의 마지막 답변을 보면 다음과 같은 해결책이 나옵니다.

=== [방법 2] ===
List<int> lstChk = new List<int>(50000);

for(int i = 0; i < lstChk.Capacity; i++)
{
    Random rd = new Random()
    int iChk = rd.Next(lstChk.Capacity);
    while(true)
    {
        if(lstChk.Contains(iChk) == false)
        {
            lstChk.Add(iChk);
            break;
        }
        else
        {
            iChk = rd.Next(lstChk.Capacity);
        }
    }
}

답변자 스스로도 쓰고 있지만 2분이 넘게 걸린다고 합니다. 말할 필요도 없이 "[방법 1]"이 "[방법 2]"보다 낫습니다.

그런데, '방법 2'에는 상당한 비효율이 있습니다. 즉, List에 담아 놓고 Contains 비교를 하기 때문에 O(n)의 검색 시간이 걸리는 것입니다. 따라서, 이 시간을 줄이면 될 텐데요. 간단하게 HashSet으로 바꿔서 구현하면 비약적으로 성능이 향상됩니다.

=== [방법 3] ===
HashSet<int> rands = new HashSet<int>();
Random rand = new Random((int)DateTime.Now.Ticks);
while (true)
{
    int number = rand.Next(50000);

    if (rands.Contains(number) == false)
    {
        rands.Add(number);
        if (rands.Count == 50000)
        {
            break;
        }
    }
}

검색 시간이 이제는 O(1)로 바뀌었으니 당연히 성능향상이 기대되는데요. 실제로 Stopwatch로 구해 보면 ElapsedMilliseconds == 68이 나오니 오히려 이제는 "방법 1"보다도 7배 정도나 빨라졌습니다.

그런데, '방법 3'에도 단점이 있습니다. 바로 시간이 지날수록 비어있는 자리들이 줄어들어서 충돌 횟수가 꽤나 잦아진다는 것입니다. 그런 시간은 그야말로 확률적으로 시간을 소비하게 됩니다.

다행히도, "계산량 문제좀 질문 드리겠습니다. - Random함수 관련" 글의 이원진 님 답변 글에 보면 재미있는 방법이 하나 제시됩니다.

"
만약 1부터 10까지의 숫자를 뽑아야 한다면 배열을 만들어 1부터 10까지 순서대로 넣는다. 
그 배열을 랜덤하게 섞는다.
배열 왼쪽부터 뽑고싶은 갯수만큼 뽑는다.
"

위와 같이만 해준다면 충돌 횟수가 줄어들기 때문에 속도가 더욱 빨라질 수 있을 텐데요. 이를 실제로 코드로 구현해 보면 다음과 같겠지요. ^^

=== [방법 4] ===
Random rand = new Random((int)DateTime.Now.Ticks);
int[] list = Enumerable.Range(0, 50000).ToArray();
int idx, old;
for (int i = 0; i < 50000; i++)
{
    idx = rand.Next(50000);
    old = list[i];
    list[i] = list[idx];
    list[idx] = old;
}

시간을 구해 보면, ElapsedMilliseconds == 4로 가장 빠른 시간을 보여줍니다. 그런데, '방법 4'와 '방법 1'을 잠시 비교해 보시겠어요?

=== [방법 1] ===
List<int> Area = Enumerable.Range(0, 50000).ToList();
Random rand = new Random((int)DateTime.Now.Ticks);
List<int> list = new List<int>(50000);
for (int i = 0; i < Area.Count; i++)
{
    int num = rand.Next(Area.Count);
    int num2 = Area[num];
    Area.RemoveAt(num);
    list.Add(num2);
}

아이디어 면에서 보면 '방법 1'도 충돌이 발생하지 않기 때문에 괜찮아 보이지만, 어째서 '방법 4'와 비교해서 100배 가깝게 낮은 성능을 보이는 걸까요? 문제는 Area.RemoveAt에 있습니다. 특정 index 지점의 요소를 삭제하고 그 이하의 메모리를 앞으로 복사시키는 작업이 포함되기 때문에 엄청난 오버헤드가 발생하는 것입니다. 이 때문에 배열의 요소가 늘어날수록 '방법 1'의 오버헤드가 심각해집니다.

예를 들어 50000 * 2로 요소 수를 늘리면 시간은 다음과 같이 차이가 납니다.

방법 1: 1657  (4배 증가)
방법 2: 120   (2배 증가)
방법 3: 8     (2배 증가)

좀 더 검색을 해보니, 더욱 재미있는 방법이 나오는군요. ^^

LINQ Enumerable 클래스, 1부
; https://docs.microsoft.com/ko-kr/archive/msdn-magazine/2008/july/advanced-basics-the-linq-enumerable-class-part-1

다음과 같이, 코드가 굉장히 간단하게 나옵니다.

=== [방법 5] ===
Random rand = new Random((int)DateTime.Now.Ticks);
int[] list = Enumerable.Range(0, 50000).OrderBy(o => rand.Next()).ToArray();

그런데, 실행 시간은 ElapsedMilliseconds == 42로 '방법 3'에 비하면 좋지 않지만 그래도 2위는 했습니다. 무조건 코드가 짧다고 해서 성능이 좋은 것은 아닌 것 같습니다. ^^

이야기는 여기까지가 끝이고... 혹시 더 좋은 알고리즘이 생각나시는 분 계신가요? ^^

(첨부된 파일은 위의 코드를 포함한 예제 프로젝트입니다.)




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 6/22/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2011-12-09 02시53분
[당근천국] 4번방법에 값을 출력시킨후 출력된 자리에 배열의 맨마지막 값을 넣은후 랜덤구하는 범위를 하나 줄여서 구현하는 방법도 있습니다.
ㅎㅎㅎ

이 글을 토대로 테스트 프로그램을 만들어 보았습니다.
제가 말한 방법에 대한 자세한 설명도 해두었습니다.
http://blog.danggun.net/791
[guest]
2011-12-09 04시22분
방법이 정말 여러가지로 나오는 군요. ^^ 메모리를 2배로 쓴다는 작은 단점만 빼면 제시하신 방법 6도 괜찮은 것 같습니다.
정성태
2012-01-02 10시18분
[게스트] 저런걸 random suffle이라고 하죠
http://blog.naver.com/ezkun78/30071908611
요 링크 재밌네요
[guest]
2012-01-15 11시08분
[yeti] 제가 원하는 함수인데, 재미있게 봤습니다. 꾸뻑^^
[guest]
2023-03-17 10시29분
.NET 8부터 Random.Shuffle이 제공됩니다.

Random.Shuffle Method
; https://learn.microsoft.com/en-us/dotnet/api/system.random.shuffle
정성태

... 16  17  18  19  20  [21]  22  23  24  25  26  27  28  29  30  ...
NoWriterDateCnt.TitleFile(s)
13126정성태9/15/20227476.NET Framework: 2049. C# 11 - 정적 메서드에 대한 delegate 처리 시 cache 적용
13125정성태9/14/20227717.NET Framework: 2048. C# 11 - 구조체 필드의 자동 초기화(auto-default structs)
13124정성태9/13/20227507.NET Framework: 2047. Golang, Python, C#에서의 CRC32 사용
13123정성태9/8/20227861.NET Framework: 2046. C# 11 - 멤버(속성/필드)에 지정할 수 있는 required 예약어 추가
13122정성태8/26/20227825.NET Framework: 2045. C# 11 - 메서드 매개 변수에 대한 nameof 지원
13121정성태8/23/20225668C/C++: 157. Golang - 구조체의 slice 필드를 Reflection을 이용해 변경하는 방법
13120정성태8/19/20227313Windows: 209. Windows NT Service에서 UI를 다루는 방법 [3]
13119정성태8/18/20226879.NET Framework: 2044. .NET Core/5+ 프로젝트에서 참조 DLL이 보관된 공통 디렉터리를 지정하는 방법
13118정성태8/18/20225661.NET Framework: 2043. WPF Color의 기본 색 영역은 (sRGB가 아닌) scRGB [2]
13117정성태8/17/20227883.NET Framework: 2042. C# 11 - 파일 범위 내에서 유효한 타입 정의 (File-local types)파일 다운로드1
13116정성태8/4/20228335.NET Framework: 2041. C# - Socket.Close 시 Socket.Receive 메서드에서 예외가 발생하는 문제파일 다운로드1
13115정성태8/3/20228715.NET Framework: 2040. C# - ValueTask와 Task의 성능 비교 [1]파일 다운로드1
13114정성태8/2/20228871.NET Framework: 2039. C# - Task와 비교해 본 ValueTask 사용법파일 다운로드1
13113정성태7/31/20228203.NET Framework: 2038. C# 11 - Span 타입에 대한 패턴 매칭 (Pattern matching on ReadOnlySpan<char>)
13112정성태7/30/20228568.NET Framework: 2037. C# 11 - 목록 패턴(List patterns) [1]파일 다운로드1
13111정성태7/29/20228325.NET Framework: 2036. C# 11 - IntPtr/UIntPtr과 nint/nuint의 통합파일 다운로드1
13110정성태7/27/20228381.NET Framework: 2035. C# 11 - 새로운 연산자 ">>>" (Unsigned Right Shift)파일 다운로드1
13109정성태7/27/20229783VS.NET IDE: 177. 비주얼 스튜디오 2022를 이용한 (소스 코드가 없는) 닷넷 모듈 디버깅 - "외부 원본(External Sources)" [1]
13108정성태7/26/20227731Linux: 53. container에 실행 중인 Golang 프로세스를 디버깅하는 방법 [1]
13107정성태7/25/20226820Linux: 52. Debian/Ubuntu 계열의 docker container에서 자주 설치하게 되는 명령어
13106정성태7/24/20226616오류 유형: 819. 닷넷 6 프로젝트의 "Conditional compilation symbols" 기본값 오류
13105정성태7/23/20227923.NET Framework: 2034. .NET Core/5+ 환경에서 (프로젝트가 아닌) C# 코드 파일을 입력으로 컴파일하는 방법 - 두 번째 이야기 [1]
13104정성태7/23/202211000Linux: 51. WSL - init에서 systemd로 전환하는 방법
13103정성태7/22/20227492오류 유형: 818. WSL - systemd-genie와 관련한 2가지(systemd-remount-fs.service, multipathd.socket) 에러
13102정성태7/19/20226956.NET Framework: 2033. .NET Core/5+에서는 구할 수 없는 HttpRuntime.AppDomainAppId
13101정성태7/15/202215930도서: 시작하세요! C# 10 프로그래밍
... 16  17  18  19  20  [21]  22  23  24  25  26  27  28  29  30  ...