반응형
Python을 사용하여 PDF 파일에 저장된 제목, 저자, 주제 및 키워드와 같은 속성 / 메타 데이터를 어떻게 읽을 수 있습니까?
해결 방법
from pdfminer.pdfparser import PDFParser
from pdfminer.pdfdocument import PDFDocument
fp = open('diveintopython.pdf', 'rb')
parser = PDFParser(fp)
doc = PDFDocument(parser)
print(doc.info) # The "Info" metadata
출력은 다음과 같습니다.
>>> [{'CreationDate': 'D:20040520151901-0500',
'Creator': 'DocBook XSL Stylesheets V1.52.2',
'Keywords': 'Python, Dive Into Python, tutorial, object-oriented, programming, documentation, book, free',
'Producer': 'htmldoc 1.8.23 Copyright 1997-2002 Easy Software Products, All Rights Reserved.',
'Title': 'Dive Into Python'}]
참조 페이지 https://stackoverflow.com/questions/14209214
반응형
'파이썬' 카테고리의 다른 글
파이썬 색인으로 목록에 액세스하려고 할 때 Python 오류- "목록 색인은 str이 아닌 정수 여야합니다." (0) | 2021.01.29 |
---|---|
파이썬 IOError : [Errno 32] 깨진 파이프 : Python (0) | 2021.01.29 |
파이썬 Jinja2 속기 조건부 (0) | 2021.01.29 |
파이썬 목록에서 여러 문자를 제거하려면 어떻게해야합니까? (0) | 2021.01.29 |
파이썬 바이너리 파일을 구조체로 읽기 (0) | 2021.01.29 |
댓글