Microsoft MVP성태의 닷넷 이야기
PDF Reader 라이브러리.. [링크 복사], [링크+제목 복사],
조회: 18174
글쓴 사람
후배
홈페이지
첨부 파일
 

안녕하세요 선배님 ^^ 오랜만에 질문 글 남깁니다.

현재 제가 하려는것은 PDF파일을 읽어 DOM tree 구조로 Data를 추출하는 것 입니다.
10여개가 넘는 라이브러리를 살펴보았으나, TextContent는 대체적으로 잘 읽어오지만..
논리적인 tree구조를 잡기위한 Data추출이 가능한 라이브러리가 안보이네요.ㅠㅠ

PDF파일 Binary를 읽어 직접 구현해볼까도 했지만, 그에 대한 자료도 찾지 못했습니다.ㅎㅎ

혹시 위의 기능이 구현된 라이브러리나, 직접 구현하기 위한 방법을 알고 계신가요?








[최초 등록일: ]
[최종 수정일: 5/29/2017]


비밀번호

댓글 작성자
 



2017-05-29 02시01분
PDF 조작은 해본 적이 없군요. 스펙은 아마도 다음의 문서로 잘 공개된 것 같은데... 바닥부터 직접 구현하는 것이 쉽지 않을텐데요... ^^;

PDF Reference, version 1.7 - Adobe
; http://wwwimages.adobe.com/content/dam/Adobe/en/devnet/pdf/pdfs/PDF32000_2008.pdf
정성태
2017-05-30 01시45분
[후배] 넵. 답변 감사합니다 ^^
[guest]
2021-04-16 11시27분
UglyToad/PdfPig - Read and extract text and other content from PDFs in C# (port of PdfBox)
; https://github.com/UglyToad/PdfPig

QuestPDF/QuestPDF
; https://github.com/QuestPDF/QuestPDF

QuestPDF is an open-source, modern and battle-tested library that can help you with generating PDF documents by offering friendly, discoverable and predictable C# fluent API.

How to Export Data from Database to PDF Document using Asp.net Core MVC C#
; https://labpys.com/how-to-export-data-from-database-to-pdf-document-using-asp-net-core-mvc-c/

----------------------------------
itext7 - Install-Package itext7 -Version 8.0.2
정성태

1  2  3  4  5  6  7  [8]  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
5783구직자1/7/202310117C#개발자 구인광고와 초급개발자 [3]파일 다운로드1
5782Sqli...1/5/202310931윈도우11 노트북에서 exe(Sqlite)만들어 윈도우 7 PC에 설치 시 [5]
5781List맨1/5/202310979List.Add("newobj") 속도는 빠른 편인지요? [11]
5780임세1/3/202312553C# 프로그래밍 10 책 구매한 사람입니다. 3부 자료는 어디서 다운 받을 수 있나요? [4]
5779이건우1/2/202310776안녕하십니까 루프안에서 메세지처리에 관하여 질문드립니다! [2]
5778이건우12/30/202212059안녕하세요 c#에서 dll참조 관련 질문드립니다. [4]
5777감사합니...12/29/202210829UI Thread에 Invoke 처리관련 궁금합니다. [3]
5776pdf맨12/28/202210426C# MouseUp Event + pdf [10]
5775민성12/28/202210149안녕하세요 Class 관련해서 예외처리를 하나로 받아낼수 있는 방법 [1]
5774중급12/27/202211417중급개발자란 어느 수준인지요? [4]
5773김영식12/26/202210413c# 압축파일 읽어 올 때 BinaryRead 한글 처리 문제 [1]
5772눈송이12/26/202211125Excel VSTO 는 왜 Net Core, Net 5, 6 버전을 사용하지 않나요? [2]
5771김훈12/26/202210984c# .net client application 망분리(내부망,외부망) 환경에서 의문의 외부사이트 호출 대기 [2]
5770lsh12/26/202210368클라우디움안에 있는 파일을 File.Copy 하고싶은데 코드로는 접근을 못하나요? [1]
5769울타리12/20/202210860Active Directory 2012R2 2016 또는 2019 마이그렝션 문의 드립니다. [1]
5768c++12/14/202213113Thread를 사용한 C++ DLL에 관련된 질문입니다. [6]파일 다운로드2
5767민성12/9/202210773안녕하세요 ashx로 화일을 저장하고 화일명을 리턴하는데요 [1]
5766김명훈12/9/202210912웹브라우저에서 묻지 않고 바로 다운로드 [2]
5765hong12/1/202211293Winform(.Net6) 클라이언트에서 SignalR Core 웹서버에 접속시 인증서 문제 [3]파일 다운로드1
5764요한11/30/202211482c++ 동일한 객체인지 비교 방법문의 [2]
5763고필석11/30/202210690시작하자마자 비정상 종료하는 프로세스에 대한 문제 해결 조언 요청 드립니다. [3]
5762흰털너부리11/30/202210715wpf mvvm ui update 로딩중 표시 [1]
5761민성11/29/202210634죄송하지만 한가지만 더 여쭈어 보겠습니다 [1]
5760민성11/29/202210566안녕하세요 [2]
5759문정환11/28/202210754c# socket 통신할때 빅엔디언으로 바꿔줘야 하나요? [1]
5758라떼11/28/202213227Linux 에서 winform UI 어플리케이션 실행하기 [3]
1  2  3  4  5  6  7  [8]  9  10  11  12  13  14  15  ...