Microsoft MVP성태의 닷넷 이야기
GethashCode와 String대한 질문 [링크 복사], [링크+제목 복사]
조회: 7508
글쓴 사람
jongs
홈페이지
첨부 파일
 
(연관된 글이 1개 있습니다.)


항상 닷넷 전문가이신 성태님의 자료글을 보면서 많이 배우고 있습니다.
처음으로 질문을 남기게 되었는데, 기초적이면서도 중요한 GetHashCode에 대해 몇 가지 궁금증이 있습니다.
평소에 내심 생각은 하고 있었지만, 명확한 답변이 궁금했던 내용입니다.
항상 하나의 도메인 안에서 작동한다는 가정하에 문의드립니다.

1. 기본 string의 GetHashCode는 문자열 종류마다 항상 다른 해쉬 값을 보장하나요?
- 공식 문서에서도 디테일하게 나와있지 않아 궁금합니다.
기본 기능이므로 최대한 다른 해쉬 값을 보장해줄 것 같긴한데,
GetHashCode는 int 값이다보니 int 범위 값이 존재하는 만큼 string으로 표현가능한 수를 생각해보면
극악의 낮은 확률로 다른 문자열에 동일 해쉬 값이 나올 수 있는지 궁금합니다.


2. object.GetHashCode는 객체마다 항상 다른 해쉬 값을 보장하나요?
- HashSet<object> 혹은 HashSet<MyClass> 이런 식으로 사용할 때, 다른 객체가 같은 HashCode를 반환해서 로직에 오류를 발생할 수 있나요?
  내부적으로 object마다 기본 id를 붙여놓고 해쉬코드에 사용할 것 같은데 궁금합니다!
 
3. 성태님께서는 위 주제들에 대해서 Hash가 민감한 작업을 할 때에는 직접 GetHashCode를 정의해서 사용하시나요?
- 다른 Hash값 보장 혹은 성능 측면 어느 이유든 상관 없이 궁금합니다.

그리고, GetHashCode와 별개로 한 가지 더 궁금한게 있습니다.
4. 같은 상수 string은 하나의 객체로 동일 참조주소를 가지지만, StringBuilder 혹은 임의로 만든 string은 내용물이 같아도 객체가 다르기 때문에 참조주소가 다릅니다.
Java의 GC에는 이를 압축해주는 기능이 있는 것으로 알고있는데, 닷넷 GC에는 이런 기능은 별도로 없을까요?

답변해주시면 감사하겠습니다!


[연관 글]






[최초 등록일: ]
[최종 수정일: 6/11/2021]


비밀번호

댓글 작성자
 



2021-06-11 11시52분
답변 1) 절대 보장하지 않습니다. 관련해서는 다음의 글을 읽어보시면 도움이 될 것입니다.

괜찮은 문자열 해시 함수?
; https://www.sysnet.pe.kr/2/0/1222

괜찮은 문자열 해시함수? - 두 번째 이야기
; https://www.sysnet.pe.kr/2/0/1223

답변 2) 마찬가지의 이유입니다. 이것 또한 관련해서 다음의 글을 읽어보시면 도움이 될 것입니다.

Dictionary.Get(A) 대신 Dictionary.Get(A.GetHashCode())를 사용해서는 안 되는 이유
; https://www.sysnet.pe.kr/2/0/889

답변 3) 이에 대한 답은 "권위"에 기대는 편입니다. ^^ 그래서 가능한 마이크로소프트의 것을 따릅니다. ^^ 어차피 충돌하는데다, 코드를 작성해도 너무 과적합의 문제가 발생할 수 있기 때문입니다. 참고로, 다음과 같은 식으로 만들어진 타입의 hascode를,

public class MyType
{
    int a;
    int b;
}

구하고 싶다면, 저것과 동일한 필드를 담고 있는 C# 9.0의 record 타입을 정의한 후 Reflector 등으로 소스 코드를 살펴 보면 마이크로소프트가 int a와 int b의 필드를 어떻게 버무려 hashcode를 구하는 지 살펴볼 수 있습니다.

사용자 정의 GethashCode 메서드 구현은 C# 9.0의 record 또는 리팩터링에 맡기세요.
; https://www.sysnet.pe.kr/2/0/12669

답변 4) 글쎄요, 자바를 잘 몰라서 관련 기능을 구체적으로 알 수는 없지만, 어쨌든 닷넷에서 들어본 적은 없습니다. 단지, string.Intern 정도의 최적화가 있을 것입니다.

String.Intern(String) Method
; https://docs.microsoft.com/en-us/dotnet/api/system.string.intern
정성태
2021-06-12 03시38분
[jongs] 상세한 답변 감사합니다! 많은 도움이 되었습니다.
[guest]

1  2  3  4  5  6  7  [8]  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
5755문정환11/24/20223748싱글스레드 프로그램도 컨텍스트 스위칭이 생길 수 있나요? [4]
5754초급11/24/20223600c# 소켓통신 [1]
5753흰털너부리11/24/20223409List와 ObservableCollection을 비교 해서 다른 값 추출 FirstOrDefault 객체 비교 [4]파일 다운로드1
5752푸헐11/15/20223546app.config 에 connectionStrings를 aspnet_regiis로 enctyption [4]
5751차가워11/8/20224349vs2022 preview net7 AOT 콘솔 실행 성능 [7]
5749차가워11/4/20223766전처리 지시문 #if DEBUG 배포시 실행 여부 [1]
5748김기헌11/3/20224091안녕하세요 선생님 싱글톤 패턴을 꼭 이렇게 사용해야 하나요? [6]
5747김기헌11/2/20223494안녕하세요 선생님 네트워크 관련 용어 중 IP 주소가 왜 논리적 주소라고 표현되는 건가요? [2]
5746물냉면이...11/2/20223679서로 다른 클래스에 있는 동일 함수의 일괄 호출 방법에 대해 궁금합니다. [3]
5745흰털너부리11/1/20224019.net core web api 사용 제한에 관한 질문 입니다. [2]
5744차가워10/31/20224413윈폼 Console.WriteLine(); 연산 문의 [1]
5743흰털너부리10/27/20223734reflection, static, override 질문입니다. [1]
5742차가워10/27/20223640하나의 socket에 여러 스레드가 접근 하는 경우 [1]
5741조호상10/27/20223873OpenCVSharp4 구현 가능 문의 [1]
5740혜성10/26/20224711Visual Studio 2022 C# 콘솔 프로그램 기본 코드 변경된 이유는 무엇인가요? [2]
5739슬픈단잠10/25/20223672조언 주신 방법으로 해봤으나, 여전히 어디가 문제인지 파악을 못했습니다. [2]
5738슬픈단잠10/24/20224056C# 마샬링 관련 질문입니다. [2]
5737감사합니...10/20/20224697찾은 어셈블리의 매니페스트 정의와 어셈블리 참조가 일치하지 않습니다. [8]파일 다운로드1
5736초보 개...10/19/20223704c# winforms 프로그램을 setup 파일로 배포 시, 설정 문의 [2]
5735농상10/17/20224373싱글톤 공부중 질문이 있습니다. [8]
5734mins10/14/20224130델파이 dll을 c#에서 사용하기 관련해서 포인트 관련이라 질문을 올립니다. [2]
5733김경환10/12/20224135선생님 질문하나만드리겠습니다. [1]
5732kss10/8/20224427c# socket.poll 버그인가요? [2]파일 다운로드1
5731kss10/8/20223988c# socket.poll 버그인가요? [3]
5730김재환10/7/20224511WPF에서 디스플레이 배율이 100%가 아닌 경우, Window의 포지션 정보가 부정확해지는 문제 [2]
5729김기헌10/2/20224176안녕하세요 선생님 뮤텍스 관련 질문 드립니다 [2]
1  2  3  4  5  6  7  [8]  9  10  11  12  13  14  15  ...