Microsoft MVP성태의 닷넷 이야기
VC++: 78. 보이어-무어(Boyer-Moore) 알고리즘이 정말 빠를까? [링크 복사], [링크+제목 복사],
조회: 35102
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
(연관된 글이 2개 있습니다.)

보이어-무어(Boyer-Moore) 알고리즘이 정말 빠를까?

예전에, 알고리즘 책을 보다가 저도 보이어-무어 문자열 검색 코드를 봤었습니다. 뭔가... 책에 나와 있는 문자열 검색 알고리즘을 쓰면 멋있을 것 같아서 코드를 그대로 짜 넣었고 뿌듯해 했던 기억이 납니다.

문제는... 얼마나 성능향상이 있을까 기대하는 마음으로 C 언어의 단순 문자열 검색 함수(strstr)와 비교하고 나서... 충격을 먹었습니다. ^^;

성능이 더 안 좋았던 것입니다. 그 책에 나와 있던 모든 '문자열 검색 알고리즘'들이 하나같이 strstr 함수와의 성능 테스트에서 무너져버렸습니다. 그 이후로 제 기억속에서 문자열 알고리즘은 곧 strstr이 되어 버렸습니다. (기억이 가물가물한데... 그 당시 "라빈-카프", "KMP" 알고리즘도 마찬가지 결과였습니다.)

그러는 와중에, 최근에 트위터에서 다음의 글을 보게 되었습니다.

문자열 검색 개발 - 그러니까 검색엔진을 만든 직후였다. 한참동안 검색 기능을 테스트 하다가 우연히 데이타 파일을 직접 grep 해봤는데, 이럴수가. 내가 만든 엔진보다 grep이 더 빨랐다.... http://tmblr.co/Zx6_Wy1KCFEYH


링크의 글을 읽어 보니,

문자열 검색 개발
; http://likejazz.com/post/90399631505

예전에 보았던 그 "보이어-무어" 검색 알고리즘 이야기가 나왔습니다. 게다가 논문에 가장 가까운 구현 코드를 구현했다고 하는데요. 음... 그래서 순간 호기심이 일었습니다. 혹시나 제가 예전에 봤던 그 책의 "보이어-무어" 검색은 잘못 작성된 예가 아니었을까??? 하는... 머리좋은 사람들이 만들었다는 알고리즘에 대한 일말의 기대가 다시 부활한 것입니다. 그래서 위의 블로거가 작성한 github 소스 코드를 입력하고 역시 이번에도 strstr과의 성능 비교를 해보았습니다.

boyer-moore-string-search 
; https://github.com/likejazz/boyer-moore-string-search/blob/master/boyer-moore.c

test 함수는 boyer_moore 알고리즘을 사용한 것이고, test2는 C 언어의 런타임 함수인 strstr을 쓴 것입니다.

void test(uint8_t *string, uint8_t *pat)
{
    int len_org = strlen((const char *)string);
    int len_searchWord = strlen((const char *)pat);

    __int64 TicksPerSec;
    GetQPF(&TicksPerSec);

    __int64 StartTick = GetQPCTick();

    uint32_t pos = boyer_moore(string, len_org, pat, len_searchWord);
    
    __int64 EndTick = GetQPCTick();

    __int64 elapsed = EndTick - StartTick;

    printf("boyer_moore (%I64d)\n", elapsed);
}

void test2(char *string, char *pat)
{
    __int64 TicksPerSec;
    GetQPF(&TicksPerSec);

    __int64 StartTick = GetQPCTick();

    char *pos = strstr(string, pat);

    __int64 EndTick = GetQPCTick();

    __int64 elapsed = EndTick - StartTick;

    printf("strstr (%I64d)\n", elapsed);
}

성능 측정은 가장 정확도가 높다는 윈도우의 QueryPerformanceCount / QueryPerformanceFrequency 셋을 사용했습니다.

QueryPerformanceCount / QueryPerformanceFrequency
; http://sweeper.egloos.com/viewer/2820035

bool GetQPF(__int64* QPFTicksPerSec)
{
    LARGE_INTEGER li;

    if (QueryPerformanceFrequency(&li) == false)
    {
        return false;
    }

    *QPFTicksPerSec = static_cast<__int64>(li.QuadPart);

    return true;
}

__int64 GetQPCTick(void)
{
    LARGE_INTEGER li;

    QueryPerformanceCounter(&li);

    return static_cast<__int64>(li.QuadPart);
}

그리고 52KB의 문자열을 준비하고 발견되지 않는 문자열로 10번씩 테스트 해보았습니다.

for (int i = 0; i < 10; i ++)
{
    test((uint8_t *)full.c_str(), (uint8_t *)"adbda");
}

printf("\n");

for (int i = 0; i < 10; i++)
{
    test2((char *)full.c_str(), "adbda");
}

결과는 strstr의 압승입니다.

// x86/Release 빌드
// (낮을 수록 빠릅니다.)
// boyer_moore 검색 시간
boyer_moore (1253)
boyer_moore (827)
boyer_moore (821)
boyer_moore (1000)
boyer_moore (819)
boyer_moore (931)
boyer_moore (820)
boyer_moore (820)
boyer_moore (827)
boyer_moore (887)

// strstr 검색 시간
strstr (86)
strstr (81)
strstr (82)
strstr (80)
strstr (80)
strstr (81)
strstr (81)
strstr (80)
strstr (80)
strstr (95)

혹시나 싶어, 1/3 지점 앞 부분에 나오는 약간 긴 텍스트로 검색해 보았습니다.

for (int i = 0; i < 10; i++)
{
    test((uint8_t *)full.c_str(), (uint8_t *)"85e39934c9c3c6ab5cd2f0e607adff92T");
}
printf("\n");
for (int i = 0; i < 10; i++)
{
    test2((char *)full.c_str(), "85e39934c9c3c6ab5cd2f0e607adff92T");
}

// boyer_moore 검색 시간
boyer_moore (36)
boyer_moore (31)
boyer_moore (62)
boyer_moore (81)
boyer_moore (33)
boyer_moore (31)
boyer_moore (30)
boyer_moore (29)
boyer_moore (29)
boyer_moore (29)

// strstr 검색 시간
strstr (10)
strstr (10)
strstr (10)
strstr (9)
strstr (12)
strstr (11)
strstr (10)
strstr (10)
strstr (10)
strstr (11)

이전보다 많은 차이는 아니지만 역시 strstr의 승입니다. 정말 혹시나 싶어 이번에는 뒤에서 1/3 지점에 나오는 짧은 텍스트로 검색을 해보았습니다.

for (int i = 0; i < 10; i++)
{
    test((uint8_t *)full.c_str(), (uint8_t *)"dff92Q");
}
printf("\n");
for (int i = 0; i < 10; i++)
{
    test2((char *)full.c_str(), "dff92T");
}

boyer_moore (518)
boyer_moore (464)
boyer_moore (557)
boyer_moore (510)
boyer_moore (675)
boyer_moore (734)
boyer_moore (520)
boyer_moore (496)
boyer_moore (501)
boyer_moore (483)

strstr (13)
strstr (11)
strstr (14)
strstr (12)
strstr (13)
strstr (13)
strstr (13)
strstr (12)
strstr (13)
strstr (13)

역시나 strstr의 압승입니다. 현란한 boyer_moore 알고리즘을 어떻게 strstr이 이겼는지 궁금하시나요? 다음은 Visual C++의 런타임 소스로 공개되어 있는 strstr의 코드입니다.

// C:\Program Files (x86)\Microsoft Visual Studio 12.0\VC\crt\src\strstr.c

#include <cruntime.h>
#include <string.h>

char * __cdecl strstr (const char * str1, const char * str2)
{
    char *cp = (char *) str1;
    char *s1, *s2;

    if ( !*str2 )
        return((char *)str1);

    while (*cp)
    {
        s1 = cp;
        s2 = (char *) str2;

        while ( *s1 && *s2 && !(*s1-*s2) )
                s1++, s2++;

        if (!*s2)
                return(cp);

        cp++;
    }

    return(NULL);
}

도대체 어떤 특수한 경우를 만들어 줘야 Boyer-Moore 알고리즘이 strstr을 이길 수 있을까요?

좀 더 자세한 Boyer-Moore 알고리즘 소개글 하나.

Boyer-Moore 스트링 매칭 알고리즘 
; http://web.skhu.ac.kr/~mckim1/Lecture/DS/dna/class12/class12_05.html

참고로 검색해 보니 Boyer-Moore가 KMP보다 성능이 더 좋다고 하는 글도 보이는군요.

KMP, Boyer-Moore 성능 비교
; http://blog.naver.com/gskjhyoo/100198701888

(물론 이 글의 첨부 파일로 포함해 두었습니다.)






기타...

Using Trie Class for Efficient Text Pattern Searching in C#
; https://code-maze.com/csharp-using-trie-class-for-efficient-text-pattern-searching/



[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 3/16/2023]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2014-09-29 02시39분
[꿈꾸는개발자] 안드로이드 어플리케이션 개발자입니다. 어플리케이션 내에서 검색기능 구현을 위하여, 알고리즘 공부 단계에 있습니다. 혹시 자바에서도 분석 해 보신적이 있으시나요?
[guest]
2014-09-29 10시18분
이 글의 결과에도 나오지만, 검색 문자열이 긴 경우에 (건너뛰기를 멀리할 수 있으니) boyer-moore 알고리즘은 효율적입니다. (하지만, 현실에서 사람들이 던지는 검색어가 긴 경우는 사실 많지 않지요.)

알고리즘이란 것이 프로그램 언어에 종속적인 경우는 거의 없으니, 자바에서도 유사한 결과가 나옵니다. 그래도 기왕에 말을 꺼내신 ^^ "꿈꾸는개발자"님께서 한번 테스트 해보시고 결과를 공유해 주시면 어떨까요?
정성태
2015-01-14 12시22분
[체스맨] 고려가 필요한 부분이 두 가지 정도 있는데요.

첫째로 vc의 실제 strstr 함수는 저 코드가 아닙니다. asm 코드로 따로 들어있어요. 저 코드 긁어다 빌드해서 돌려보시면 BF에 memcmp 쓴 거 보다도 느리게 나올 겁니다.
CPU cache 이용을 극대화할 수 있도록 asm 코드가 작성된 걸로 압니다. 알고리즘이 빠르냐 느리냐만을 놓고 보면 정당한 비교가 될 수 없어요.

그리고, BM 구현된 거 얼핏 보아도, malloc 이 매번 호출되는데, 이건 성능에 지대한 영향을 미칠 수가 있으니, 미리 할당된 버퍼를 사용하도록 수정할 필요가 있구요.
최적화도 더 필요한 코드 같네요.
[guest]
2015-01-14 04시21분
좋은 의견 감사합니다. ^^ 덕분에 asm 코드로 따로 있는 것도 확인했습니다. 빠른 이유가 있었군요. ^^ 말씀하신 대로 C 코드만으로 테스트 했을 때는 BM 구현이 대체로 빨랐습니다.
정성태
2015-03-04 05시39분
[이상] 추측이지만 보이어 무어 알고리즘에 시스템 콜이 포함된 것 같군요.
[guest]
2015-03-04 10시09분
@이상 님, 위의 체스맨님 의견과 같이 어쨌든 공정한 테스트는 아니었던 것 같습니다. ^^ 참고로, 아래의 글도 약간 관련이 있는 글입니다.

무시할 수 없는 Visual C++ 런타임 함수 성능
; http://www.sysnet.pe.kr/2/0/1843
정성태

... 91  92  93  94  95  96  97  98  99  100  101  102  103  [104]  105  ...
NoWriterDateCnt.TitleFile(s)
11326정성태10/15/201718565.NET Framework: 690. coreclr 소스코드로 알아보는 .NET 4.0의 모듈 로딩 함수 [1]
11325정성태10/14/201719420.NET Framework: 689. CLR 4.0 환경에서 DLL 모듈의 로드 주소(Base address) 알아내는 방법
11324정성태10/13/201720996디버깅 기술: 101. windbg - "*** WARNING: Unable to verify checksum for" 경고 없애는 방법
11322정성태10/13/201718450디버깅 기술: 100. windbg - .NET 4.0 응용 프로그램의 Main 메서드에 Breakpoint 걸기
11321정성태10/11/201720020.NET Framework: 688. NGen 모듈과 .NET Profiler
11320정성태10/11/201720845.NET Framework: 687. COR_PRF_USE_PROFILE_IMAGES 옵션과 NGen의 "profiler-enhanced images" [1]
11319정성태10/11/201728364.NET Framework: 686. C# - string 배열을 담은 구조체를 직렬화하는 방법
11318정성태10/7/201721109VS.NET IDE: 122. 비주얼 스튜디오에서 관리자 권한을 요구하는 C# 콘솔 프로그램 제작 [1]
11317정성태10/4/201726263VC++: 120. std::copy 등의 함수 사용 시 _SCL_SECURE_NO_WARNINGS 에러 발생
11316정성태9/30/201724278디버깅 기술: 99. (닷넷) 프로세스(EXE)에 디버거가 연결되어 있는지 아는 방법 [4]
11315정성태9/29/201740297기타: 68. "시작하세요! C# 6.0 프로그래밍: 기본 문법부터 실전 예제까지" 구매하신 분들을 위한 C# 7.0/7.1 추가 문법 PDF [8]
11314정성태9/28/201722096디버깅 기술: 98. windbg - 덤프 파일로부터 닷넷 버전 확인하는 방법
11313정성태9/25/201719439디버깅 기술: 97. windbg - 메모리 덤프로부터 DateTime 형식의 값을 알아내는 방법파일 다운로드1
11312정성태9/25/201722556.NET Framework: 685. C# - 구조체(값 형식)의 필드를 리플렉션을 이용해 값을 바꾸는 방법파일 다운로드1
11311정성태9/20/201716908.NET Framework: 684. System.Diagnostics.Process 객체의 명시적인 해제 권장
11310정성태9/19/201720447.NET Framework: 683. WPF의 Window 객체를 생성했는데 GC 수집 대상이 안 되는 이유 [3]
11309정성태9/13/201718498개발 환경 구성: 335. Octave의 명령 창에서 실행한 결과를 복사하는 방법
11308정성태9/13/201719588VS.NET IDE: 121. 비주얼 스튜디오에서 일부 텍스트 파일을 무조건 메모장으로만 여는 문제파일 다운로드1
11307정성태9/13/201722142오류 유형: 421. System.Runtime.InteropServices.SEHException - 0x80004005
11306정성태9/12/201720204.NET Framework: 682. 아웃룩 사용자를 위한 중국어 스팸 필터 Add-in
11305정성태9/12/201721696개발 환경 구성: 334. 기존 프로젝트를 Visual Studio를 이용해 Github의 신규 생성된 repo에 올리는 방법 [1]
11304정성태9/11/201718797개발 환경 구성: 333. 3ds Max를 Hyper-V VM에서 실행하는 방법
11303정성태9/11/201722082개발 환경 구성: 332. Inno Setup 파일의 관리자 권한을 제거하는 방법
11302정성태9/11/201718292개발 환경 구성: 331. SQL Server Express를 위한 방화벽 설정
11301정성태9/11/201717188오류 유형: 420. SQL Server Express 연결 오류 - A network-related or instance-specific error occurred while establishing a connection to SQL Server.
11300정성태9/10/201721173.NET Framework: 681. dotnet.exe - run, exec, build, restore, publish 차이점 [3]
... 91  92  93  94  95  96  97  98  99  100  101  102  103  [104]  105  ...