안녕하세요 선배님 ^^ 오랜만에 질문 글 남깁니다.
현재 제가 하려는것은 PDF파일을 읽어 DOM tree 구조로 Data를 추출하는 것 입니다.
10여개가 넘는 라이브러리를 살펴보았으나, TextContent는 대체적으로 잘 읽어오지만..
논리적인 tree구조를 잡기위한 Data추출이 가능한 라이브러리가 안보이네요.ㅠㅠ
PDF파일 Binary를 읽어 직접 구현해볼까도 했지만, 그에 대한 자료도 찾지 못했습니다.ㅎㅎ
혹시 위의 기능이 구현된 라이브러리나, 직접 구현하기 위한 방법을 알고 계신가요?
[최초 등록일: ]
[최종 수정일: 5/29/2017]