Microsoft MVP성태의 닷넷 이야기
PDF Reader 라이브러리.. [링크 복사], [링크+제목 복사],
조회: 19724
글쓴 사람
후배
홈페이지
첨부 파일
 

안녕하세요 선배님 ^^ 오랜만에 질문 글 남깁니다.

현재 제가 하려는것은 PDF파일을 읽어 DOM tree 구조로 Data를 추출하는 것 입니다.
10여개가 넘는 라이브러리를 살펴보았으나, TextContent는 대체적으로 잘 읽어오지만..
논리적인 tree구조를 잡기위한 Data추출이 가능한 라이브러리가 안보이네요.ㅠㅠ

PDF파일 Binary를 읽어 직접 구현해볼까도 했지만, 그에 대한 자료도 찾지 못했습니다.ㅎㅎ

혹시 위의 기능이 구현된 라이브러리나, 직접 구현하기 위한 방법을 알고 계신가요?








[최초 등록일: ]
[최종 수정일: 5/29/2017]


비밀번호

댓글 작성자
 



2017-05-29 02시01분
PDF 조작은 해본 적이 없군요. 스펙은 아마도 다음의 문서로 잘 공개된 것 같은데... 바닥부터 직접 구현하는 것이 쉽지 않을텐데요... ^^;

PDF Reference, version 1.7 - Adobe
; http://wwwimages.adobe.com/content/dam/Adobe/en/devnet/pdf/pdfs/PDF32000_2008.pdf
정성태
2017-05-30 01시45분
[후배] 넵. 답변 감사합니다 ^^
[guest]
2021-04-16 11시27분
UglyToad/PdfPig - Read and extract text and other content from PDFs in C# (port of PdfBox)
; https://github.com/UglyToad/PdfPig

QuestPDF/QuestPDF
; https://github.com/QuestPDF/QuestPDF

QuestPDF is an open-source, modern and battle-tested library that can help you with generating PDF documents by offering friendly, discoverable and predictable C# fluent API.

How to Export Data from Database to PDF Document using Asp.net Core MVC C#
; https://labpys.com/how-to-export-data-from-database-to-pdf-document-using-asp-net-core-mvc-c/

----------------------------------
itext7 - Install-Package itext7 -Version 8.0.2
정성태

1  2  3  4  5  [6]  7  8  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
5841guest3/3/202311655프로그램 판매 시 - Upgrade 버전 판매 [2]
5840joe3/2/202312496C# 클래스 라이브러리 수정 -> C++에서 참조시 함수 목록 갱신되지 않음. [4]파일 다운로드1
5839guest3/2/202312550윈도우 서비스 프로그램 - FORM 애플리케이션 감시서비스 [8]
5838랄랄라3/1/202310880event 사용 시 두 표현의 차이점이 있을까요? [1]
5837감사합니...2/28/202311669오라클 DB서버 접속관련 문의 드립니다.(Load Balancing, HA Events) [2]
5836박지범2/27/202310944static instance의 initialize 순서가 보장되나요? [6]
5835주민호2/25/202318553Windows Software Development Kit - 최신버전 1개 남기고 다 삭제하면 안되는지요? [10]파일 다운로드1
5834guest2/24/202310898Python IDE - 비주얼스튜디오 [3]
5833무지남2/23/202310117Async 메서드 그리고 나서 Bool 메서드 [5]
5832김지우2/21/202310901event와 delegate의 차이 , event를 써야하는 이유 [1]
5831이우람2/20/202312187ref 전역변수가 pinned가 될수 있나요? [2]
5830냉수마찰2/19/202311357C# GridView에 Column별 데이터 추가하는 방법에 대해 [1]
5829수박942/19/202313044키움 API를 윈폼과 WPF의 네임스페이스 없이 콘솔이나 WinUI3에서 사용할 수 있는 방법이 있나요? [2]파일 다운로드1
5828김재영2/19/202311759장기적으로는 this 구문을 안쓰는게 맞을까요? [2]
5827lee2/18/202313478파이썬 설치 오류 질문입니다 [1]
5826Syong2/14/202313261Socket 관련 Leak (OverlappedAsyncResult, OverlappedData) 관련 문의 [7]파일 다운로드1
5825박성원2/14/202312354Listview 컨트롤의 화면 전환 시 갱신 속도 [1]
5823검은콩2/13/202315364catch(Exception ex)의 line번호를 쉽게 알 수 없는지요? [7]
5822김지우2/11/202314640책을 보면서 sync, async 이해가 되지 않는 부분이 있습니다. [5]파일 다운로드2
5821검은콩2/9/202311420Async 신뢰성과 소켓데이터 [4]
5820차가워2/8/202311259다른 프로세스 실행 후 포커스 가져오기 [3]
5819취준생2/7/202311868WPF 관련 실무가 궁금합니다. [3]
5818윤길2/7/202311072ObservableCollection 에서 INotifyPropertyChanged 구현해야하나요? [2]
5817흰털너부리2/7/202310610배포 시 winform 실행 콘솔로그 보는 방법 [1]
5816흰털너부리2/6/202310936.net core json array validation 질문 드립니다. [1]
5815김재영2/6/202310800종단간 암호화에 대해 시나리오인데 타당한 시나리오일까요? [2]
1  2  3  4  5  [6]  7  8  9  10  11  12  13  14  15  ...