Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 

Golang - (문자가 아닌) 바이트 위치를 반환하는 strings.IndexRune 함수

golang의 경우 string 타입이 내부적으로 utf-8 인코딩을 유지하고 있는데요, 따라서 한글은 한 문자에 대해 3바이트의 공간을 차지합니다.

가령, 다음과 같이 문자열을 열거하는 경우,

val := "테스트1"

for i, ch := range val {
    fmt.Printf("%d - %c\n", i, ch)
}
/* 출력 결과
0 - 테
3 - 스
6 - 트
9 - 1
*/

글자는 하나씩 매핑이 되지만, 인덱스는 0, 3, 6, 9와 같이 나옵니다. 혹은 다음과 같이 열거하게 되면,

for i:=0; i < len(val); i ++ {
    fmt.Printf("%d - %c\n", i, val[i])
}
/* 출력 결과
0 - í
1 - 

2 - Œ
3 - ì
4 - Š
5 - ¤
6 - í
7 - Š
8 - ¸
9 - 1
10
*/

(대부분의 경우에서) 원치 않는 결과를 얻게 됩니다. 이러한 불균형은 rune 타입을 이용하는 것으로 해결할 수 있습니다.

val := "테스트1"

runeVal := []rune(val)

for i, ch := range runeVal {
    fmt.Printf("%d - %c\n", i, ch)
}
/* 출력 결과
0 - 테
1 - 스
2 - 트
3 - 1
*/

fmt.Printf("len(val) == %d\n", utf8.RuneCountInString(val)) // len(val) == 4

여기서, 특정 문자를 찾는 것을 해볼까요? 이를 위해 golang에서는 strings.Index와 strings.IndexRune을 제공합니다.

fmt.Printf("%d\n", strings.IndexRune(val, '1'))
fmt.Printf("%d\n", strings.Index(val, "1"))

/* 출력 결과
9
9
*/

그런데, 보다시피 출력 결과가 byte 기준의 index만을 반환하고 있습니다. 즉, 위의 결과에서 3이 나올 수 있는 Index 함수가 없는 것입니다. 이로 인해 [] rune을 열거하는 for 루프 내에서 IndexRune 함수를 쓰는 것이 매우 애매해집니다.

val := "테스트1"

runeVal := []rune(val)

for i, ch := range runeVal {
  // pos는 바이트 메모리의 위치이므로 runeVal의 위치와 무관
  // 또한 val[i:]도 바이트를 기준으로 한 위치이므로 runeVal의 index와 무관
  pos := strings.IndexRune(val[i:], '1')
}

사실 이를 위해 가장 좋은 방법은 [] rune 타입에서 Index를 제공하는 것인데 현재는 이를 제공하지 않으므로 그냥 만들어 써야 합니다.

How found offset index a string in rune using go
; https://stackoverflow.com/questions/41956391/how-found-offset-index-a-string-in-rune-using-go

val := "테스트1"

runeVal := []rune(val)

fmt.Printf("%d\n", search(runeVal, "i")) // -1
fmt.Printf("%d\n", search(runeVal, "1")) // 3

func search(text []rune, what string) int {
    whatRunes := []rune(what)

    for i := range text {
        found := true
        for j := range whatRunes {
            if text[i+j] != whatRunes[j] {
                found = false
                break
            }
        }

        if found {
            return i
        }
    }
    return -1
}




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 12/23/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




1  2  3  4  5  6  7  8  [9]  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
13398정성태8/3/20234137스크립트: 55. 파이썬 - pyodbc를 이용한 SQL Server 연결 사용법
13397정성태7/23/20233644닷넷: 2134. C# - 문자열 연결 시 string.Create를 이용한 GC 할당 최소화
13396정성태7/22/20233341스크립트: 54. 파이썬 pystack 소개 - 메모리 덤프로부터 콜 스택 열거
13395정성태7/20/20233311개발 환경 구성: 685. 로컬에서 개발 중인 ASP.NET Core/5+ 웹 사이트에 대해 localhost 이외의 호스트 이름으로 접근하는 방법
13394정성태7/16/20233258오류 유형: 873. Oracle.ManagedDataAccess.Client - 쿼리 수행 시 System.InvalidOperationException
13393정성태7/16/20233421닷넷: 2133. C# - Oracle 데이터베이스의 Sleep 쿼리 실행하는 방법
13392정성태7/16/20233299오류 유형: 872. Oracle - ORA-01031: insufficient privileges
13391정성태7/14/20233369닷넷: 2132. C# - sealed 클래스의 메서드를 callback 호출했을 때 인라인 처리가 될까요?
13390정성태7/12/20233340스크립트: 53. 파이썬 - localhost 호출 시의 hang 현상
13389정성태7/5/20233324개발 환경 구성: 684. IIS Express로 호스팅하는 웹을 WSL 환경에서 접근하는 방법
13388정성태7/3/20233515오류 유형: 871. 윈도우 탐색기에서 열리지 않는 zip 파일 - The Compressed (zipped) Folder '[...].zip' is invalid. [1]파일 다운로드1
13387정성태6/28/20233535오류 유형: 870. _mysql - Commands out of sync; you can't run this command now
13386정성태6/27/20233603Linux: 61. docker - 원격 제어를 위한 TCP 바인딩 추가
13385정성태6/27/20233823Linux: 60. Linux - 외부에서의 접속을 허용하기 위한 TCP 포트 여는 방법
13384정성태6/26/20233566.NET Framework: 2131. C# - Source Generator로 해결하는 enum 박싱 문제파일 다운로드1
13383정성태6/26/20233313개발 환경 구성: 683. GPU 런타임을 사용하는 Colab 노트북 설정
13382정성태6/25/20233356.NET Framework: 2130. C# - Win32 API를 이용한 윈도우 계정 정보 (예: 마지막 로그온 시간)파일 다운로드1
13381정성태6/25/20233743오류 유형: 869. Fatal Python error: init_fs_encoding: failed to get the Python codec of the filesystem encoding
13380정성태6/24/20233195스크립트: 52. 파이썬 3.x에서의 동적 함수 추가
13379정성태6/23/20233209스크립트: 51. 파이썬 2.x에서의 동적 함수 추가
13378정성태6/22/20233096오류 유형: 868. docker - build 시 "CANCELED ..." 뜨는 문제
13377정성태6/22/20236899오류 유형: 867. 파이썬 mysqlclient 2.2.x 설치 시 "Specify MYSQLCLIENT_CFLAGS and MYSQLCLIENT_LDFLAGS env vars manually" 오류
13376정성태6/21/20233285.NET Framework: 2129. C# - Polly를 이용한 클라이언트 측의 요청 재시도파일 다운로드1
13375정성태6/20/20232985스크립트: 50. Transformers (신경망 언어모델 라이브러리) 강좌 - 2장 코드 실행 결과
13374정성태6/20/20233110오류 유형: 866. 파이썬 - <class 'AttributeError'> module 'flask.json' has no attribute 'JSONEncoder'
13373정성태6/19/20234398오류 유형: 865. 파이썬 - pymssql 설치 관련 오류 정리
1  2  3  4  5  6  7  8  [9]  10  11  12  13  14  15  ...