Microsoft MVP성태의 닷넷 이야기
PDF Reader 라이브러리.. [링크 복사], [링크+제목 복사],
조회: 18204
글쓴 사람
후배
홈페이지
첨부 파일
 

안녕하세요 선배님 ^^ 오랜만에 질문 글 남깁니다.

현재 제가 하려는것은 PDF파일을 읽어 DOM tree 구조로 Data를 추출하는 것 입니다.
10여개가 넘는 라이브러리를 살펴보았으나, TextContent는 대체적으로 잘 읽어오지만..
논리적인 tree구조를 잡기위한 Data추출이 가능한 라이브러리가 안보이네요.ㅠㅠ

PDF파일 Binary를 읽어 직접 구현해볼까도 했지만, 그에 대한 자료도 찾지 못했습니다.ㅎㅎ

혹시 위의 기능이 구현된 라이브러리나, 직접 구현하기 위한 방법을 알고 계신가요?








[최초 등록일: ]
[최종 수정일: 5/29/2017]


비밀번호

댓글 작성자
 



2017-05-29 02시01분
PDF 조작은 해본 적이 없군요. 스펙은 아마도 다음의 문서로 잘 공개된 것 같은데... 바닥부터 직접 구현하는 것이 쉽지 않을텐데요... ^^;

PDF Reference, version 1.7 - Adobe
; http://wwwimages.adobe.com/content/dam/Adobe/en/devnet/pdf/pdfs/PDF32000_2008.pdf
정성태
2017-05-30 01시45분
[후배] 넵. 답변 감사합니다 ^^
[guest]
2021-04-16 11시27분
UglyToad/PdfPig - Read and extract text and other content from PDFs in C# (port of PdfBox)
; https://github.com/UglyToad/PdfPig

QuestPDF/QuestPDF
; https://github.com/QuestPDF/QuestPDF

QuestPDF is an open-source, modern and battle-tested library that can help you with generating PDF documents by offering friendly, discoverable and predictable C# fluent API.

How to Export Data from Database to PDF Document using Asp.net Core MVC C#
; https://labpys.com/how-to-export-data-from-database-to-pdf-document-using-asp-net-core-mvc-c/

----------------------------------
itext7 - Install-Package itext7 -Version 8.0.2
정성태

NoWriterDateCnt.TitleFile(s)