Microsoft MVP성태의 닷넷 이야기
PDF Reader 라이브러리.. [링크 복사], [링크+제목 복사],
조회: 18248
글쓴 사람
후배
홈페이지
첨부 파일
 

안녕하세요 선배님 ^^ 오랜만에 질문 글 남깁니다.

현재 제가 하려는것은 PDF파일을 읽어 DOM tree 구조로 Data를 추출하는 것 입니다.
10여개가 넘는 라이브러리를 살펴보았으나, TextContent는 대체적으로 잘 읽어오지만..
논리적인 tree구조를 잡기위한 Data추출이 가능한 라이브러리가 안보이네요.ㅠㅠ

PDF파일 Binary를 읽어 직접 구현해볼까도 했지만, 그에 대한 자료도 찾지 못했습니다.ㅎㅎ

혹시 위의 기능이 구현된 라이브러리나, 직접 구현하기 위한 방법을 알고 계신가요?








[최초 등록일: ]
[최종 수정일: 5/29/2017]


비밀번호

댓글 작성자
 



2017-05-29 02시01분
PDF 조작은 해본 적이 없군요. 스펙은 아마도 다음의 문서로 잘 공개된 것 같은데... 바닥부터 직접 구현하는 것이 쉽지 않을텐데요... ^^;

PDF Reference, version 1.7 - Adobe
; http://wwwimages.adobe.com/content/dam/Adobe/en/devnet/pdf/pdfs/PDF32000_2008.pdf
정성태
2017-05-30 01시45분
[후배] 넵. 답변 감사합니다 ^^
[guest]
2021-04-16 11시27분
UglyToad/PdfPig - Read and extract text and other content from PDFs in C# (port of PdfBox)
; https://github.com/UglyToad/PdfPig

QuestPDF/QuestPDF
; https://github.com/QuestPDF/QuestPDF

QuestPDF is an open-source, modern and battle-tested library that can help you with generating PDF documents by offering friendly, discoverable and predictable C# fluent API.

How to Export Data from Database to PDF Document using Asp.net Core MVC C#
; https://labpys.com/how-to-export-data-from-database-to-pdf-document-using-asp-net-core-mvc-c/

----------------------------------
itext7 - Install-Package itext7 -Version 8.0.2
정성태

... 91  92  93  94  95  96  [97] 
NoWriterDateCnt.TitleFile(s)
29정성태12/17/200310835    답변글 [답변]: IE에서 submit 버튼을 누를때 발생하는 이벤트를 받을수 있나요?
24임영택9/14/200310906실행중인 DLL과 통신하는 방법?
25임영택9/15/200311039    답변글 [답변]: 자답(해결했습니다)
21박용운7/29/200310582잠긴파일에서...
22박용운7/30/200312002    답변글 왜 MoveFileEx가 먹히지를 않을까요?
23박용운7/30/200311906        답변글 [자답]
19김진호7/28/200311019atl 디버깅
20정성태7/29/200310846    답변글 [답변]: atl 디버깅
17박용운7/23/200311320[질문] 보안모듈? [1]
13박용운7/23/200311896"IE BHO 개체를 개발할 때, 인터넷 익스플로러가 아닌 탐색기에서 활성화 되는 문제 해결" 문서를 읽고...
14정성태7/23/200310737    답변글 [답변]: "IE BHO 개체를 개발할 때, 인터넷 익스플로러가 아닌 탐색기에서 활성화 되는 문제 해결" 문서를 읽고...
16박용운7/23/200311324        답변글 [답변]: [답변]: "IE BHO 개체를 개발할 때, 인터넷 익스플로러가 아닌 탐색기에서 활성화 되는 문제 해결" 문서를 읽고...
7박용운7/21/200313017HTTP 프로토콜로 통신하는법? [5]
6박용운7/21/200313371POST값을 못읽는 사이트는? [1]
1박용운7/18/200315292[질문] IWebBrowser2로 POST값 구하기 [4]파일 다운로드1
... 91  92  93  94  95  96  [97]