Microsoft MVP성태의 닷넷 이야기
VC++: 78. 보이어-무어(Boyer-Moore) 알고리즘이 정말 빠를까? [링크 복사], [링크+제목 복사],
조회: 35144
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
(연관된 글이 2개 있습니다.)

보이어-무어(Boyer-Moore) 알고리즘이 정말 빠를까?

예전에, 알고리즘 책을 보다가 저도 보이어-무어 문자열 검색 코드를 봤었습니다. 뭔가... 책에 나와 있는 문자열 검색 알고리즘을 쓰면 멋있을 것 같아서 코드를 그대로 짜 넣었고 뿌듯해 했던 기억이 납니다.

문제는... 얼마나 성능향상이 있을까 기대하는 마음으로 C 언어의 단순 문자열 검색 함수(strstr)와 비교하고 나서... 충격을 먹었습니다. ^^;

성능이 더 안 좋았던 것입니다. 그 책에 나와 있던 모든 '문자열 검색 알고리즘'들이 하나같이 strstr 함수와의 성능 테스트에서 무너져버렸습니다. 그 이후로 제 기억속에서 문자열 알고리즘은 곧 strstr이 되어 버렸습니다. (기억이 가물가물한데... 그 당시 "라빈-카프", "KMP" 알고리즘도 마찬가지 결과였습니다.)

그러는 와중에, 최근에 트위터에서 다음의 글을 보게 되었습니다.

문자열 검색 개발 - 그러니까 검색엔진을 만든 직후였다. 한참동안 검색 기능을 테스트 하다가 우연히 데이타 파일을 직접 grep 해봤는데, 이럴수가. 내가 만든 엔진보다 grep이 더 빨랐다.... http://tmblr.co/Zx6_Wy1KCFEYH


링크의 글을 읽어 보니,

문자열 검색 개발
; http://likejazz.com/post/90399631505

예전에 보았던 그 "보이어-무어" 검색 알고리즘 이야기가 나왔습니다. 게다가 논문에 가장 가까운 구현 코드를 구현했다고 하는데요. 음... 그래서 순간 호기심이 일었습니다. 혹시나 제가 예전에 봤던 그 책의 "보이어-무어" 검색은 잘못 작성된 예가 아니었을까??? 하는... 머리좋은 사람들이 만들었다는 알고리즘에 대한 일말의 기대가 다시 부활한 것입니다. 그래서 위의 블로거가 작성한 github 소스 코드를 입력하고 역시 이번에도 strstr과의 성능 비교를 해보았습니다.

boyer-moore-string-search 
; https://github.com/likejazz/boyer-moore-string-search/blob/master/boyer-moore.c

test 함수는 boyer_moore 알고리즘을 사용한 것이고, test2는 C 언어의 런타임 함수인 strstr을 쓴 것입니다.

void test(uint8_t *string, uint8_t *pat)
{
    int len_org = strlen((const char *)string);
    int len_searchWord = strlen((const char *)pat);

    __int64 TicksPerSec;
    GetQPF(&TicksPerSec);

    __int64 StartTick = GetQPCTick();

    uint32_t pos = boyer_moore(string, len_org, pat, len_searchWord);
    
    __int64 EndTick = GetQPCTick();

    __int64 elapsed = EndTick - StartTick;

    printf("boyer_moore (%I64d)\n", elapsed);
}

void test2(char *string, char *pat)
{
    __int64 TicksPerSec;
    GetQPF(&TicksPerSec);

    __int64 StartTick = GetQPCTick();

    char *pos = strstr(string, pat);

    __int64 EndTick = GetQPCTick();

    __int64 elapsed = EndTick - StartTick;

    printf("strstr (%I64d)\n", elapsed);
}

성능 측정은 가장 정확도가 높다는 윈도우의 QueryPerformanceCount / QueryPerformanceFrequency 셋을 사용했습니다.

QueryPerformanceCount / QueryPerformanceFrequency
; http://sweeper.egloos.com/viewer/2820035

bool GetQPF(__int64* QPFTicksPerSec)
{
    LARGE_INTEGER li;

    if (QueryPerformanceFrequency(&li) == false)
    {
        return false;
    }

    *QPFTicksPerSec = static_cast<__int64>(li.QuadPart);

    return true;
}

__int64 GetQPCTick(void)
{
    LARGE_INTEGER li;

    QueryPerformanceCounter(&li);

    return static_cast<__int64>(li.QuadPart);
}

그리고 52KB의 문자열을 준비하고 발견되지 않는 문자열로 10번씩 테스트 해보았습니다.

for (int i = 0; i < 10; i ++)
{
    test((uint8_t *)full.c_str(), (uint8_t *)"adbda");
}

printf("\n");

for (int i = 0; i < 10; i++)
{
    test2((char *)full.c_str(), "adbda");
}

결과는 strstr의 압승입니다.

// x86/Release 빌드
// (낮을 수록 빠릅니다.)
// boyer_moore 검색 시간
boyer_moore (1253)
boyer_moore (827)
boyer_moore (821)
boyer_moore (1000)
boyer_moore (819)
boyer_moore (931)
boyer_moore (820)
boyer_moore (820)
boyer_moore (827)
boyer_moore (887)

// strstr 검색 시간
strstr (86)
strstr (81)
strstr (82)
strstr (80)
strstr (80)
strstr (81)
strstr (81)
strstr (80)
strstr (80)
strstr (95)

혹시나 싶어, 1/3 지점 앞 부분에 나오는 약간 긴 텍스트로 검색해 보았습니다.

for (int i = 0; i < 10; i++)
{
    test((uint8_t *)full.c_str(), (uint8_t *)"85e39934c9c3c6ab5cd2f0e607adff92T");
}
printf("\n");
for (int i = 0; i < 10; i++)
{
    test2((char *)full.c_str(), "85e39934c9c3c6ab5cd2f0e607adff92T");
}

// boyer_moore 검색 시간
boyer_moore (36)
boyer_moore (31)
boyer_moore (62)
boyer_moore (81)
boyer_moore (33)
boyer_moore (31)
boyer_moore (30)
boyer_moore (29)
boyer_moore (29)
boyer_moore (29)

// strstr 검색 시간
strstr (10)
strstr (10)
strstr (10)
strstr (9)
strstr (12)
strstr (11)
strstr (10)
strstr (10)
strstr (10)
strstr (11)

이전보다 많은 차이는 아니지만 역시 strstr의 승입니다. 정말 혹시나 싶어 이번에는 뒤에서 1/3 지점에 나오는 짧은 텍스트로 검색을 해보았습니다.

for (int i = 0; i < 10; i++)
{
    test((uint8_t *)full.c_str(), (uint8_t *)"dff92Q");
}
printf("\n");
for (int i = 0; i < 10; i++)
{
    test2((char *)full.c_str(), "dff92T");
}

boyer_moore (518)
boyer_moore (464)
boyer_moore (557)
boyer_moore (510)
boyer_moore (675)
boyer_moore (734)
boyer_moore (520)
boyer_moore (496)
boyer_moore (501)
boyer_moore (483)

strstr (13)
strstr (11)
strstr (14)
strstr (12)
strstr (13)
strstr (13)
strstr (13)
strstr (12)
strstr (13)
strstr (13)

역시나 strstr의 압승입니다. 현란한 boyer_moore 알고리즘을 어떻게 strstr이 이겼는지 궁금하시나요? 다음은 Visual C++의 런타임 소스로 공개되어 있는 strstr의 코드입니다.

// C:\Program Files (x86)\Microsoft Visual Studio 12.0\VC\crt\src\strstr.c

#include <cruntime.h>
#include <string.h>

char * __cdecl strstr (const char * str1, const char * str2)
{
    char *cp = (char *) str1;
    char *s1, *s2;

    if ( !*str2 )
        return((char *)str1);

    while (*cp)
    {
        s1 = cp;
        s2 = (char *) str2;

        while ( *s1 && *s2 && !(*s1-*s2) )
                s1++, s2++;

        if (!*s2)
                return(cp);

        cp++;
    }

    return(NULL);
}

도대체 어떤 특수한 경우를 만들어 줘야 Boyer-Moore 알고리즘이 strstr을 이길 수 있을까요?

좀 더 자세한 Boyer-Moore 알고리즘 소개글 하나.

Boyer-Moore 스트링 매칭 알고리즘 
; http://web.skhu.ac.kr/~mckim1/Lecture/DS/dna/class12/class12_05.html

참고로 검색해 보니 Boyer-Moore가 KMP보다 성능이 더 좋다고 하는 글도 보이는군요.

KMP, Boyer-Moore 성능 비교
; http://blog.naver.com/gskjhyoo/100198701888

(물론 이 글의 첨부 파일로 포함해 두었습니다.)






기타...

Using Trie Class for Efficient Text Pattern Searching in C#
; https://code-maze.com/csharp-using-trie-class-for-efficient-text-pattern-searching/



[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]

[연관 글]






[최초 등록일: ]
[최종 수정일: 3/16/2023]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 



2014-09-29 02시39분
[꿈꾸는개발자] 안드로이드 어플리케이션 개발자입니다. 어플리케이션 내에서 검색기능 구현을 위하여, 알고리즘 공부 단계에 있습니다. 혹시 자바에서도 분석 해 보신적이 있으시나요?
[guest]
2014-09-29 10시18분
이 글의 결과에도 나오지만, 검색 문자열이 긴 경우에 (건너뛰기를 멀리할 수 있으니) boyer-moore 알고리즘은 효율적입니다. (하지만, 현실에서 사람들이 던지는 검색어가 긴 경우는 사실 많지 않지요.)

알고리즘이란 것이 프로그램 언어에 종속적인 경우는 거의 없으니, 자바에서도 유사한 결과가 나옵니다. 그래도 기왕에 말을 꺼내신 ^^ "꿈꾸는개발자"님께서 한번 테스트 해보시고 결과를 공유해 주시면 어떨까요?
정성태
2015-01-14 12시22분
[체스맨] 고려가 필요한 부분이 두 가지 정도 있는데요.

첫째로 vc의 실제 strstr 함수는 저 코드가 아닙니다. asm 코드로 따로 들어있어요. 저 코드 긁어다 빌드해서 돌려보시면 BF에 memcmp 쓴 거 보다도 느리게 나올 겁니다.
CPU cache 이용을 극대화할 수 있도록 asm 코드가 작성된 걸로 압니다. 알고리즘이 빠르냐 느리냐만을 놓고 보면 정당한 비교가 될 수 없어요.

그리고, BM 구현된 거 얼핏 보아도, malloc 이 매번 호출되는데, 이건 성능에 지대한 영향을 미칠 수가 있으니, 미리 할당된 버퍼를 사용하도록 수정할 필요가 있구요.
최적화도 더 필요한 코드 같네요.
[guest]
2015-01-14 04시21분
좋은 의견 감사합니다. ^^ 덕분에 asm 코드로 따로 있는 것도 확인했습니다. 빠른 이유가 있었군요. ^^ 말씀하신 대로 C 코드만으로 테스트 했을 때는 BM 구현이 대체로 빨랐습니다.
정성태
2015-03-04 05시39분
[이상] 추측이지만 보이어 무어 알고리즘에 시스템 콜이 포함된 것 같군요.
[guest]
2015-03-04 10시09분
@이상 님, 위의 체스맨님 의견과 같이 어쨌든 공정한 테스트는 아니었던 것 같습니다. ^^ 참고로, 아래의 글도 약간 관련이 있는 글입니다.

무시할 수 없는 Visual C++ 런타임 함수 성능
; http://www.sysnet.pe.kr/2/0/1843
정성태

... 121  122  [123]  124  125  126  127  128  129  130  131  132  133  134  135  ...
NoWriterDateCnt.TitleFile(s)
10849정성태9/14/201557159오류 유형: 307. CLR20r3 오류 해결을 위해 mscorlib.dll을 덮어쓸때 주의할 점 [12]
10848정성태9/8/201527500VS.NET IDE: 103. Visual Studio의 Ctrl + F5 실행 동작파일 다운로드1
10847정성태9/8/201523661VS.NET IDE: 102. 목록(List) 타입의 값을 디버깅 중 Watch 창에서 확인하는 방법 [1]파일 다운로드1
10846정성태9/8/201521023오류 유형: 306. "query user" 명령어에 공백 문자가 포함된 계정을 전달하는 경우
10845정성태9/3/201522111오류 유형: 305. 윈도우 백업 시 오류 - 0x80780166
10844정성태9/2/201523323.NET Framework: 528. C# - 상호 참조하는 경우의 정적 생성자 동작 방식 [4]파일 다운로드1
10843정성태9/1/201524017VS.NET IDE: 101. Visual Studio 2015의 솔루션 탐색기가 클래스 뷰 정보로 인해 느려지는 현상
10842정성태9/1/201521074.NET Framework: 527. 닷넷 사용자 정의 예외 클래스의 최소 구현 코드 - 세 번째 이야기
10841정성태8/31/201530382개발 환경 구성: 276. Visual Studio 2013에서 C# 6과 닷넷 4.6 기능을 사용하려면?
10839정성태8/22/201528929Windows: 112. 윈도우 10에서 터치 키보드를 안 뜨게 할 수 있는 방법 [4]
10838정성태8/22/201539253오류 유형: 304. Windows 10에서 VPN 연결이 실패한다면? [3]
10837정성태8/21/201519522오류 유형: 303. Your computer is low on memory. Save your files and close these programs...
10836정성태8/21/201520543오류 유형: 302. 설치 파일 실행 시 "This app can't run on your PC" 오류가 뜬다면?
10835정성태8/21/201529000웹: 31. Microsoft Edge 브라우저를 명령행에서 띄우는 방법 [1]
10834정성태8/19/201521203.NET Framework: 526. 닷넷 - 값 형식을 new 없이 생성하면 0으로 초기화되지 않는다?
10833정성태8/18/201525716.NET Framework: 525. C# - 닷넷에서 프로세스가 열고 있는 파일 목록을 구하는 방법파일 다운로드1
10832정성태8/17/201530099디버깅 기술: 74. x64 콜 스택 인자 추적과 windbg의 Child-SP, RetAddr, Args to Child 값 확인 [8]파일 다운로드2
10831정성태8/13/201530186.NET Framework: 524. .NET 4.0과 .NET 4.5의 컴파일 결과 차이점 [1]파일 다운로드1
10830정성태8/12/201524113개발 환경 구성: 275. Web.config이 적용되지 않는 프로젝트에서 Razor 템플릿 파일의 C# 컴파일러 버전 제어 [1]
10829정성태8/10/201526209개발 환경 구성: 274. PowerShell/명령행에서 JDK/JRE를 무인(unattended)/자동 설치를 하는 방법 [3]
10828정성태8/10/201531771웹: 30. Edge 브라우저에서 "이 웹 사이트에는 Internet Explorer가 필요함" 단계를 없애는 방법 [1]
10827정성태7/8/201533193개발 환경 구성: 273. Visual Studio 2015에서 Github와 연동하는 방법 [3]
10826정성태7/8/201522865오류 유형: 301. The trust relationship between this workstation and the primary domain failed. - 두 번째 이야기
10825정성태7/8/201522362개발 환경 구성: 272. Visual Studio IDE 설치 없이 Visual Studio SDK 설치하는 방법
10824정성태7/7/201527514개발 환경 구성: 271. Team Foundation Server 2015 설치 방법 [1]
10823정성태7/7/201528066오류 유형: 300. SqlException (0x80131904): Unable to open the physical file
... 121  122  [123]  124  125  126  127  128  129  130  131  132  133  134  135  ...