Microsoft MVP성태의 닷넷 이야기
오류 유형: 755. 파이썬 - konlpy 사용 시 JVM과 jpype1 관련 오류 [링크 복사], [링크+제목 복사]
조회: 8578
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 

파이썬 - konlpy 사용 시 JVM과 jpype1 관련 오류

다음과 같이 konlpy 사용 시,

from konlpy.corpus import kolaw
from konlpy.tag import Kkma, Hannanum

msg = """
...[생략]...
"""
h = Hannanum()
h.morphs(msg)

이런 오류가 발생한다면?

Traceback (most recent call last):
  File "C:/pycharm/work/pytest/main.py", line 12, in <module>
    kkma = Hannanum()
  File "C:\Anaconda3\lib\site-packages\konlpy\tag\_hannanum.py", line 108, in __init__
    jvm.init_jvm(jvmpath, max_heap_size)
  File "C:\Anaconda3\lib\site-packages\konlpy\jvm.py", line 55, in init_jvm
    jvmpath = jvmpath or jpype.getDefaultJVMPath()
  File "C:\Anaconda3\lib\site-packages\jpype\_jvmfinder.py", line 74, in getDefaultJVMPath
    return finder.get_jvm_path()
  File "C:\Anaconda3\lib\site-packages\jpype\_jvmfinder.py", line 215, in get_jvm_path
    .format(self._libfile))
jpype._jvmfinder.JVMNotFoundException: No JVM shared library file (jvm.dll) found. Try setting up the JAVA_HOME environment variable properly.

이상하군요, 분명히 제 경우에 JVM_HOME이 정의돼 있는데 jvm.dll을 찾지 못한다고 합니다. 재미있는 것은, Hannanum의 경우 발생하고 Kkma의 경우에는,

kkma = Kkma()
print(kkma.sentences(msg))

정상 동작합니다. 일단 확실히 하기 위해 파이썬 코드에서 JAVA_HOME 환경 변수를 출력해 봤는데요,

print(os.environ.get('JAVA_HOME'))

/* 출력 결과
C:\Program Files\AdoptOpenJDK\jdk-11.0.10.9-hotspot\
*/

아무래도 OpenJDK의 탓인 걸까요? 그래서 명시적으로 Oracle JDK를 명시해 줬더니,

os.environ['JAVA_HOME'] = r'C:\Program Files\Java\jdk1.8.0_161'
print(os.environ.get('JAVA_HOME'))

h = Hannanum()
print(h.morphs(msg))

잘 동작합니다. ^^; 그러니까, Kkma는 내부 코드에서 OpenJDK를 지원하는 것이고, Hannanum은 그렇지 못한 것입니다.




참고로, 저렇게 했는데도 이런 오류가 발생한다면?

Traceback (most recent call last):
  File "C:/pycharm/work/pytest/main.py", line 12, in <module>
    kkma = Kkma()
  File "C:\Anaconda3\lib\site-packages\konlpy\tag\_kkma.py", line 95, in __init__
    jvm.init_jvm(jvmpath, max_heap_size)
  File "C:\Anaconda3\lib\site-packages\konlpy\jvm.py", line 67, in init_jvm
    convertStrings=True)
  File "C:\Anaconda3\lib\site-packages\jpype\_core.py", line 227, in startJVM
    ignoreUnrecognized, convertStrings, interrupt)
SystemError: java.nio.file.InvalidPathException: Illegal char <*> at index 43: C:\Anaconda3\lib\site-packages\konlpy\java\*

이 문제는 JPype1과 현재 파이썬 버전의 불일치라고 합니다. 그런데, konlpy 설치 당시의 출력을 보면,

(base) C:\Users\testusr> pip install konlpy
Collecting konlpy
  Downloading konlpy-0.5.2-py2.py3-none-any.whl (19.4 MB)
     |████████████████████████████████| 19.4 MB 840 kB/s
...[생략]...
Collecting JPype1>=0.7.0
  Downloading JPype1-1.3.0-cp37-cp37m-win_amd64.whl (361 kB)
     |████████████████████████████████| 361 kB 6.8 MB/s
...[생략]...
Successfully installed JPype1-1.3.0 beautifulsoup4-4.6.0 konlpy-0.5.2 typing-extensions-3.10.0.0
WARNING: You are using pip version 21.2.2; however, version 21.2.3 is available.
You should consider upgrading via the 'C:\Anaconda3\python.exe -m pip install --upgrade pip' command.

cp37은 CPython3.7을 의미하는 듯하고, 따라서 현재 설치된 파이썬 3.7.3이기 때문에,

(base) C:\Users\testusr> python
Python 3.7.3 (default, Mar 27 2019, 17:13:21) [MSC v.1915 64 bit (AMD64)] :: Anaconda, Inc. on win32
Type "help", "copyright", "credits" or "license" for more information.

JPype1 버전이 정상적으로 설치된 것입니다. 그래서 이 문제를 딱히 해결할 수 없었는데, 다음의 글에서 해법을 찾았습니다.

2021년 5월 konlpy 설치시 문제점들
; https://daewonyoon.tistory.com/386

위의 글에서는 파이썬 3.7과 3.8에서의 오류 상황을 해결하고 있는데요, 제 경우에는 3.7이었으므로 다음과 같이 제시한 명령어를 실행했더니,

(base) C:\Users\testusr> pip install "jpype1<1"
Collecting jpype1<1
  Downloading JPype1-0.7.5-cp37-cp37m-win_amd64.whl (1.4 MB)
     |████████████████████████████████| 1.4 MB 1.7 MB/s
Installing collected packages: jpype1
  Attempting uninstall: jpype1
    Found existing installation: JPype1 1.3.0
    Uninstalling JPype1-1.3.0:
      Successfully uninstalled JPype1-1.3.0
Successfully installed jpype1-0.7.5

다행히 이후 잘 동작합니다. ^^




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 8/14/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




1  2  3  4  5  6  7  8  9  10  11  12  13  [14]  15  ...
NoWriterDateCnt.TitleFile(s)
13272정성태2/27/20234215오류 유형: 850. SSMS - mdf 파일을 Attach 시킬 때 Operating system error 5: "5(Access is denied.)" 에러
13271정성태2/25/20234148오류 유형: 849. Sql Server Configuration Manager가 시작 메뉴에 없는 경우
13270정성태2/24/20233757.NET Framework: 2098. dotnet build에 /p 옵션을 적용 시 유의점
13269정성태2/23/20234293스크립트: 46. 파이썬 - uvicorn의 콘솔 출력을 UDP로 전송
13268정성태2/22/20234847개발 환경 구성: 667. WSL 2 내부에서 열고 있는 UDP 서버를 호스트 측에서 접속하는 방법
13267정성태2/21/20234772.NET Framework: 2097. C# - 비동기 소켓 사용 시 메모리 해제가 finalizer 단계에서 발생하는 사례파일 다운로드1
13266정성태2/20/20234375오류 유형: 848. .NET Core/5+ - Process terminated. Couldn't find a valid ICU package installed on the system
13265정성태2/18/20234287.NET Framework: 2096. .NET Core/5+ - PublishSingleFile 유형에 대한 runtimeconfig.json 설정
13264정성태2/17/20235785스크립트: 45. 파이썬 - uvicorn 사용자 정의 Logger 작성
13263정성태2/16/20233918개발 환경 구성: 666. 최신 버전의 ilasm.exe/ildasm.exe 사용하는 방법
13262정성태2/15/20235006디버깅 기술: 191. dnSpy를 이용한 (소스 코드가 없는) 닷넷 응용 프로그램 디버깅 방법 [1]
13261정성태2/15/20234299Windows: 224. Visual Studio - 영문 폰트가 Fullwidth Latin Character로 바뀌는 문제
13260정성태2/14/20234083오류 유형: 847. ilasm.exe 컴파일 오류 - error : syntax error at token '-' in ... -inf
13259정성태2/14/20234209.NET Framework: 2095. C# - .NET5부터 도입된 CollectionsMarshal
13258정성태2/13/20234107오류 유형: 846. .NET Framework 4.8 Developer Pack 설치 실패 - 0x81f40001
13257정성태2/13/20234203.NET Framework: 2094. C# - Job에 Process 포함하는 방법 [1]파일 다운로드1
13256정성태2/10/20235056개발 환경 구성: 665. WSL 2의 네트워크 통신 방법 - 두 번째 이야기
13255정성태2/10/20234350오류 유형: 845. gihub - windows2022 이미지에서 .NET Framework 4.5.2 미만의 프로젝트에 대한 빌드 오류
13254정성태2/10/20234262Windows: 223. (WMI 쿼리를 위한) PowerShell 문자열 escape 처리
13253정성태2/9/20235038Windows: 222. C# - 다른 윈도우 프로그램이 실행되었음을 인식하는 방법파일 다운로드1
13252정성태2/9/20233852오류 유형: 844. ssh로 명령어 수행 시 멈춤 현상
13251정성태2/8/20234317스크립트: 44. 파이썬의 3가지 스레드 ID
13250정성태2/8/20236114오류 유형: 843. System.InvalidOperationException - Unable to configure HTTPS endpoint
13249정성태2/7/20234925오류 유형: 842. 리눅스 - You must wait longer to change your password
13248정성태2/7/20234046오류 유형: 841. 리눅스 - [사용자 계정] is not in the sudoers file. This incident will be reported.
13247정성태2/7/20234962VS.NET IDE: 180. Visual Studio - 닷넷 소스 코드 디버깅 중 "Decompile source code"가 동작하는 않는 문제
1  2  3  4  5  6  7  8  9  10  11  12  13  [14]  15  ...