Microsoft MVP성태의 닷넷 이야기
GethashCode와 String대한 질문 [링크 복사], [링크+제목 복사],
조회: 15155
글쓴 사람
jongs
홈페이지
첨부 파일
 
(연관된 글이 1개 있습니다.)


항상 닷넷 전문가이신 성태님의 자료글을 보면서 많이 배우고 있습니다.
처음으로 질문을 남기게 되었는데, 기초적이면서도 중요한 GetHashCode에 대해 몇 가지 궁금증이 있습니다.
평소에 내심 생각은 하고 있었지만, 명확한 답변이 궁금했던 내용입니다.
항상 하나의 도메인 안에서 작동한다는 가정하에 문의드립니다.

1. 기본 string의 GetHashCode는 문자열 종류마다 항상 다른 해쉬 값을 보장하나요?
- 공식 문서에서도 디테일하게 나와있지 않아 궁금합니다.
기본 기능이므로 최대한 다른 해쉬 값을 보장해줄 것 같긴한데,
GetHashCode는 int 값이다보니 int 범위 값이 존재하는 만큼 string으로 표현가능한 수를 생각해보면
극악의 낮은 확률로 다른 문자열에 동일 해쉬 값이 나올 수 있는지 궁금합니다.


2. object.GetHashCode는 객체마다 항상 다른 해쉬 값을 보장하나요?
- HashSet<object> 혹은 HashSet<MyClass> 이런 식으로 사용할 때, 다른 객체가 같은 HashCode를 반환해서 로직에 오류를 발생할 수 있나요?
  내부적으로 object마다 기본 id를 붙여놓고 해쉬코드에 사용할 것 같은데 궁금합니다!
 
3. 성태님께서는 위 주제들에 대해서 Hash가 민감한 작업을 할 때에는 직접 GetHashCode를 정의해서 사용하시나요?
- 다른 Hash값 보장 혹은 성능 측면 어느 이유든 상관 없이 궁금합니다.

그리고, GetHashCode와 별개로 한 가지 더 궁금한게 있습니다.
4. 같은 상수 string은 하나의 객체로 동일 참조주소를 가지지만, StringBuilder 혹은 임의로 만든 string은 내용물이 같아도 객체가 다르기 때문에 참조주소가 다릅니다.
Java의 GC에는 이를 압축해주는 기능이 있는 것으로 알고있는데, 닷넷 GC에는 이런 기능은 별도로 없을까요?

답변해주시면 감사하겠습니다!


[연관 글]






[최초 등록일: ]
[최종 수정일: 6/11/2021]


비밀번호

댓글 작성자
 



2021-06-11 11시52분
답변 1) 절대 보장하지 않습니다. 관련해서는 다음의 글을 읽어보시면 도움이 될 것입니다.

괜찮은 문자열 해시 함수?
; https://www.sysnet.pe.kr/2/0/1222

괜찮은 문자열 해시함수? - 두 번째 이야기
; https://www.sysnet.pe.kr/2/0/1223

답변 2) 마찬가지의 이유입니다. 이것 또한 관련해서 다음의 글을 읽어보시면 도움이 될 것입니다.

Dictionary.Get(A) 대신 Dictionary.Get(A.GetHashCode())를 사용해서는 안 되는 이유
; https://www.sysnet.pe.kr/2/0/889

답변 3) 이에 대한 답은 "권위"에 기대는 편입니다. ^^ 그래서 가능한 마이크로소프트의 것을 따릅니다. ^^ 어차피 충돌하는데다, 코드를 작성해도 너무 과적합의 문제가 발생할 수 있기 때문입니다. 참고로, 다음과 같은 식으로 만들어진 타입의 hascode를,

public class MyType
{
    int a;
    int b;
}

구하고 싶다면, 저것과 동일한 필드를 담고 있는 C# 9.0의 record 타입을 정의한 후 Reflector 등으로 소스 코드를 살펴 보면 마이크로소프트가 int a와 int b의 필드를 어떻게 버무려 hashcode를 구하는 지 살펴볼 수 있습니다.

사용자 정의 GethashCode 메서드 구현은 C# 9.0의 record 또는 리팩터링에 맡기세요.
; https://www.sysnet.pe.kr/2/0/12669

답변 4) 글쎄요, 자바를 잘 몰라서 관련 기능을 구체적으로 알 수는 없지만, 어쨌든 닷넷에서 들어본 적은 없습니다. 단지, string.Intern 정도의 최적화가 있을 것입니다.

String.Intern(String) Method
; https://docs.microsoft.com/en-us/dotnet/api/system.string.intern
정성태
2021-06-12 03시38분
[jongs] 상세한 답변 감사합니다! 많은 도움이 되었습니다.
[guest]

... 61  62  63  64  65  66  67  68  69  70  71  72  73  74  [75]  ...
NoWriterDateCnt.TitleFile(s)
674황태욱7/5/200716441utf-8 환경에서 파라미터 값에 한글이 있을 경우 깨지는 현상이.. [1]
672땡초7/4/200715660Remoting 객체를 호출하는 순간 Timer 의 Elapsed 이벤트가 멈추는 현상 [2]
670조성택7/3/200715074.Net에서 Timer클래스.. [1]
667홍석헌6/29/200714326[c#] 윈도우 활성화에 관한 질문
669정성태6/30/200714648    답변글 [답변]: [c#] 윈도우 활성화에 관한 질문
666오야6/25/200713387System.Transactions 에서 트랜잭션 실패를 체크하는 방법 [1]
665김성태6/20/200713018안녕하세요^^
668정성태6/30/200714269    답변글 [답변]: 안녕하세요^^
663모름이6/19/200712563Microsoft.Framework 에서 OLE DB 사용하려면.. [1]
664모름이6/20/200713511    답변글 [추가질문]: 다른 OLE DB 를 사용하려면..
662조성택6/13/200714122C#에서 string클래스.. [1]
660신동열6/11/200715325ClickOnce 업데이트시 이전 버젼 제거오류 [1]
659한귀순6/11/200716576윈폼 프로그램 및 디자인. [2]
661한귀순6/12/200714075    답변글 [추가질문]: 윈폼 프로그램 및 디자인. [3]
657정해봉6/8/200724840요청 시간 초과 오류 [2]
655이방은5/28/200715150성태님 UML 도구 뭐 쓰십니까??? [1]
654임정훈5/23/200714016카드스페이스 관련질문
658정성태6/9/200714711    답변글 [답변]: 카드스페이스 관련질문 [1]
653사다수스5/22/200735591아래한글(HwpCtrl) ocx 메모리 릭 문제입니다. [4]파일 다운로드1
645송원석5/15/200716902ASP 의 ByVal 과 ByRef 특성
646정성태5/15/200716616    답변글 [답변]: ASP 의 ByVal 과 ByRef 특성
647송원석5/16/200717002        답변글 [답변]: [답변]: ASP 의 ByVal 과 ByRef 특성 [1]
648정성태5/16/200715758            답변글 [답변]: [답변]: [답변]: ASP의 ByVal과 ByRef 특성 [1]
649장윤태5/16/200714799                답변글 [답변]: [답변]: [답변]: [답변]: ASP 의 ByVal 과 ByRef 특성
650정성태5/16/200712994                    답변글 [답변]: [답변]: [답변]: [답변]: [답변]: ASP의 ByVal과 ByRef 특성 [2]
643해운대끓...5/15/200712387Singleton 패턴 테스트중 하나의 윈폼만 열기 오류파일 다운로드1
... 61  62  63  64  65  66  67  68  69  70  71  72  73  74  [75]  ...