Microsoft MVP성태의 닷넷 이야기
PDF Reader 라이브러리.. [링크 복사], [링크+제목 복사],
조회: 19830
글쓴 사람
후배
홈페이지
첨부 파일
 

안녕하세요 선배님 ^^ 오랜만에 질문 글 남깁니다.

현재 제가 하려는것은 PDF파일을 읽어 DOM tree 구조로 Data를 추출하는 것 입니다.
10여개가 넘는 라이브러리를 살펴보았으나, TextContent는 대체적으로 잘 읽어오지만..
논리적인 tree구조를 잡기위한 Data추출이 가능한 라이브러리가 안보이네요.ㅠㅠ

PDF파일 Binary를 읽어 직접 구현해볼까도 했지만, 그에 대한 자료도 찾지 못했습니다.ㅎㅎ

혹시 위의 기능이 구현된 라이브러리나, 직접 구현하기 위한 방법을 알고 계신가요?








[최초 등록일: ]
[최종 수정일: 5/29/2017]


비밀번호

댓글 작성자
 



2017-05-29 02시01분
PDF 조작은 해본 적이 없군요. 스펙은 아마도 다음의 문서로 잘 공개된 것 같은데... 바닥부터 직접 구현하는 것이 쉽지 않을텐데요... ^^;

PDF Reference, version 1.7 - Adobe
; http://wwwimages.adobe.com/content/dam/Adobe/en/devnet/pdf/pdfs/PDF32000_2008.pdf
정성태
2017-05-30 01시45분
[후배] 넵. 답변 감사합니다 ^^
[guest]
2021-04-16 11시27분
UglyToad/PdfPig - Read and extract text and other content from PDFs in C# (port of PdfBox)
; https://github.com/UglyToad/PdfPig

QuestPDF/QuestPDF
; https://github.com/QuestPDF/QuestPDF

QuestPDF is an open-source, modern and battle-tested library that can help you with generating PDF documents by offering friendly, discoverable and predictable C# fluent API.

How to Export Data from Database to PDF Document using Asp.net Core MVC C#
; https://labpys.com/how-to-export-data-from-database-to-pdf-document-using-asp-net-core-mvc-c/

----------------------------------
itext7 - Install-Package itext7 -Version 8.0.2
정성태

... 76  77  78  79  80  81  82  83  84  [85]  86  87  88  89  90  ...
NoWriterDateCnt.TitleFile(s)
343선재빠4/10/200614120아래와 같은 에러가 나네요.
341선재빠4/8/200613887테스트 페이지를 보면 프레임만 나오고 안에 내용이 나오지 않는군요 [1]
340김형태4/4/200612961파일서버 관련 질문드립니다.. (데브피아 답변에 이어) [2]
339조남정4/4/200613013post 주소 읽어오기 [1]
338장두헌4/4/200614643SDK PlatForm 다시 질문 - 데브피아의 내용 [1]
337강완모4/3/200614913Cab파일이 아닌 설치용 파일로 OCX들 설치하기... [1]
335비니3/23/200616142밑에 Smart Client에 대해서 질문했던 초보입니다.. TreeView컨트롤은 보이는데 안에 내용이 안보여요. [1]
336비니3/24/200613839    답변글 [재질문]:자꾸 죄송합니다...링크페이지로 이동을 안해요.... [1]
334비니3/23/200613565Smart Client강의 따라해보다가 xml에서 활성스키마는 <Tree>,<L> 요소는 지원하지 않는다고 나와요.ㅠㅠ [1]
332정준명3/21/200613599[자문자답] VS.NET에서 COM을 참조했는데, 강력한 서명이 없다고 사용불가네요.
333정성태3/22/200611907    답변글 [답변]: [자문자답] VS.NET에서 COM을 참조했는데, 강력한 서명이 없다고 사용불가네요. [1]
330심현철3/3/200615148[질문] VS2005에서 C#으로 개발한 DLL을 Javascript에서 접근할 수 없습니다. (ActiveX with C#) [2]
329권인성2/27/200612976스마트클라이언트(clickonce) 버전관리 [1]
327권인성2/24/200612912clickonce를 통해 설치 및 업데이트하려고 하는데요...보안때문에요..
331정성태3/12/200613910    답변글 [답변]: clickonce를 통해 설치 및 업데이트하려고 하는데요...보안때문에요..
325권인성2/23/200612493SETUP 및 배포관련 [1]
326권인성2/23/200612072    답변글 [답변]: 한가지만 더 질문할게요.... [1]
323정보문2/21/200612526메일 내용에서 한글이 깨집니다. [1]파일 다운로드1
321셈토2/18/200612344SPOOL --> EMF --> TEXTOUT [1]
320정보문2/18/200612061파일의 최대 크기2 [1]
318정보문2/18/200613165파일의 최대 크기
319정성태2/18/200613209    답변글 [답변]: 파일의 최대 크기 [1]
317narc...2/17/200612282[IE embeded SmartClient]에서 닷넷 리모팅 프록시 사용시 처음 2분간 딜레이현상이 발생합니다. [1]
322narc...2/20/200613111    답변글 [답변]: 다시한번 부탁드리겠습니다..
316이경찬2/15/200614634MSDN 매거진 정기구독 신청은 어디서 할수있나요? [1]
315정준명2/15/200617984[DxFramework Lite] 분산 트랜잭션에 참여하는 동안 오류가 발생했습니다. [2]
... 76  77  78  79  80  81  82  83  84  [85]  86  87  88  89  90  ...