Microsoft MVP성태의 닷넷 이야기
GethashCode와 String대한 질문 [링크 복사], [링크+제목 복사],
조회: 7547
글쓴 사람
jongs
홈페이지
첨부 파일
 
(연관된 글이 1개 있습니다.)


항상 닷넷 전문가이신 성태님의 자료글을 보면서 많이 배우고 있습니다.
처음으로 질문을 남기게 되었는데, 기초적이면서도 중요한 GetHashCode에 대해 몇 가지 궁금증이 있습니다.
평소에 내심 생각은 하고 있었지만, 명확한 답변이 궁금했던 내용입니다.
항상 하나의 도메인 안에서 작동한다는 가정하에 문의드립니다.

1. 기본 string의 GetHashCode는 문자열 종류마다 항상 다른 해쉬 값을 보장하나요?
- 공식 문서에서도 디테일하게 나와있지 않아 궁금합니다.
기본 기능이므로 최대한 다른 해쉬 값을 보장해줄 것 같긴한데,
GetHashCode는 int 값이다보니 int 범위 값이 존재하는 만큼 string으로 표현가능한 수를 생각해보면
극악의 낮은 확률로 다른 문자열에 동일 해쉬 값이 나올 수 있는지 궁금합니다.


2. object.GetHashCode는 객체마다 항상 다른 해쉬 값을 보장하나요?
- HashSet<object> 혹은 HashSet<MyClass> 이런 식으로 사용할 때, 다른 객체가 같은 HashCode를 반환해서 로직에 오류를 발생할 수 있나요?
  내부적으로 object마다 기본 id를 붙여놓고 해쉬코드에 사용할 것 같은데 궁금합니다!
 
3. 성태님께서는 위 주제들에 대해서 Hash가 민감한 작업을 할 때에는 직접 GetHashCode를 정의해서 사용하시나요?
- 다른 Hash값 보장 혹은 성능 측면 어느 이유든 상관 없이 궁금합니다.

그리고, GetHashCode와 별개로 한 가지 더 궁금한게 있습니다.
4. 같은 상수 string은 하나의 객체로 동일 참조주소를 가지지만, StringBuilder 혹은 임의로 만든 string은 내용물이 같아도 객체가 다르기 때문에 참조주소가 다릅니다.
Java의 GC에는 이를 압축해주는 기능이 있는 것으로 알고있는데, 닷넷 GC에는 이런 기능은 별도로 없을까요?

답변해주시면 감사하겠습니다!


[연관 글]






[최초 등록일: ]
[최종 수정일: 6/11/2021]


비밀번호

댓글 작성자
 



2021-06-11 11시52분
답변 1) 절대 보장하지 않습니다. 관련해서는 다음의 글을 읽어보시면 도움이 될 것입니다.

괜찮은 문자열 해시 함수?
; https://www.sysnet.pe.kr/2/0/1222

괜찮은 문자열 해시함수? - 두 번째 이야기
; https://www.sysnet.pe.kr/2/0/1223

답변 2) 마찬가지의 이유입니다. 이것 또한 관련해서 다음의 글을 읽어보시면 도움이 될 것입니다.

Dictionary.Get(A) 대신 Dictionary.Get(A.GetHashCode())를 사용해서는 안 되는 이유
; https://www.sysnet.pe.kr/2/0/889

답변 3) 이에 대한 답은 "권위"에 기대는 편입니다. ^^ 그래서 가능한 마이크로소프트의 것을 따릅니다. ^^ 어차피 충돌하는데다, 코드를 작성해도 너무 과적합의 문제가 발생할 수 있기 때문입니다. 참고로, 다음과 같은 식으로 만들어진 타입의 hascode를,

public class MyType
{
    int a;
    int b;
}

구하고 싶다면, 저것과 동일한 필드를 담고 있는 C# 9.0의 record 타입을 정의한 후 Reflector 등으로 소스 코드를 살펴 보면 마이크로소프트가 int a와 int b의 필드를 어떻게 버무려 hashcode를 구하는 지 살펴볼 수 있습니다.

사용자 정의 GethashCode 메서드 구현은 C# 9.0의 record 또는 리팩터링에 맡기세요.
; https://www.sysnet.pe.kr/2/0/12669

답변 4) 글쎄요, 자바를 잘 몰라서 관련 기능을 구체적으로 알 수는 없지만, 어쨌든 닷넷에서 들어본 적은 없습니다. 단지, string.Intern 정도의 최적화가 있을 것입니다.

String.Intern(String) Method
; https://docs.microsoft.com/en-us/dotnet/api/system.string.intern
정성태
2021-06-12 03시38분
[jongs] 상세한 답변 감사합니다! 많은 도움이 되었습니다.
[guest]

... 16  17  18  [19]  20  21  22  23  24  25  26  27  28  29  30  ...
NoWriterDateCnt.TitleFile(s)
5455한예지 donator1/16/20216408교재 194페이지 콜백메서드 질문 있습니다! [5]
5454한예지 donator1/15/20216053교재 208쪽 질문....있습니다... [3]
5453안녕하세요1/15/20217485C# dll 파일을 C++에서 사용 시 memory leak 문제 [2]파일 다운로드1
5452예지1/15/20216626var를 사용할 수 없는 이유가 궁금합니다! [3]
5451예지1/14/20215467for문의 초기식에 대해 질문드립니다. [3]
5450예지1/13/20215473Action 델리게이트 사용법 질문있습니다! [2]
5449김성민1/13/20216187Winform UserControl 상속 vs 감싸기? [2]
5448서형주1/13/20215906안녕하세요~~ DataGridView에 데이터를 표시하는 동작방법이 궁금합니다. [2]
5447종범1/11/20217558[WPF/OpenCV] 이미지->영상 저장에 대해서 질문 드립니다!! [5]파일 다운로드1
5446민우1/11/20215568닷넷 런타임을 dll 파일로 포함시킬수 있나요? [2]
5445정도현1/8/20215334directShow RenderFile 관련 재질문드립니다 [5]파일 다운로드1
5444정도현1/8/20215323directShow RenderFile 관련 질문드립니다 [3]
5443윤영호1/7/20215703xml 파일에서 데이터를 가지고 와서 list에 넣는 것을 질문드리고 싶습니다. [1]파일 다운로드1
5442진우1/4/20215490DB연결 객체나 파일 등은 GC 에서 관리해주지 않는 이유가 궁금합니다. [2]
5441한예지 donator1/4/20215918DB 연결 방법 질문 있습니다. [1]
5440한예지 donator1/1/20216523추상클래스로와 new [4]
5439이상호12/31/20208074VC 프로젝트 에서 _main 함수에서 참조되는 확인할 수 없는 외부 기호 [4]파일 다운로드1
5438김윤12/29/202010222C# winform using으로인한 메모리 해제 타이밍과 변수 복사 타이밍 [2]
5437한예지 donator12/25/20207282for문 안에 있는 지역변수의 생성 및 유지 기간에 대해 질문드립니다! [6]
5436영귤12/24/20205984fixed는 자동으로 stackalloc이 되는 건가요? [1]
5435한예지 donator12/24/20205815ArraySegment, Span, ReadOnlySpan 질문있습니다! [1]
5434한예지 donator12/23/20206368ToString 재정의 질문있습니다! [8]
5433한예지 donator12/23/20206360List<ArrarySegment<int>> 사용법 질문드립니다! [2]
5431한예지 donator12/17/20208193비동기 소켓 서버 질문 드립니다! [1]
5430종범12/16/20207333[WPF] Task 관련 재질문 드립니다. [2]파일 다운로드1
5429종범12/16/20207259[WPF] Task 관련 질문 드립니다. [1]파일 다운로드1
... 16  17  18  [19]  20  21  22  23  24  25  26  27  28  29  30  ...