파이썬 Python에서 PDF 속성 / 메타 데이터 읽기

Python을 사용하여 PDF 파일에 저장된 제목, 저자, 주제 및 키워드와 같은 속성 / 메타 데이터를 어떻게 읽을 수 있습니까?

해결 방법

from pdfminer.pdfparser import PDFParser
from pdfminer.pdfdocument import PDFDocument

fp = open('diveintopython.pdf', 'rb')
parser = PDFParser(fp)
doc = PDFDocument(parser)

print(doc.info)  # The "Info" metadata

출력은 다음과 같습니다.

>>> [{'CreationDate': 'D:20040520151901-0500',
  'Creator': 'DocBook XSL Stylesheets V1.52.2',
  'Keywords': 'Python, Dive Into Python, tutorial, object-oriented, programming, documentation, book, free',
  'Producer': 'htmldoc 1.8.23 Copyright 1997-2002 Easy Software Products, All Rights Reserved.',
  'Title': 'Dive Into Python'}]

참조 페이지 https://stackoverflow.com/questions/14209214

'파이썬' 카테고리의 다른 글

파이썬 색인으로 목록에 액세스하려고 할 때 Python 오류- "목록 색인은 str이 아닌 정수 여야합니다." (0)	2021.01.29
파이썬 IOError : [Errno 32] 깨진 파이프 : Python (0)	2021.01.29
파이썬 Jinja2 속기 조건부 (0)	2021.01.29
파이썬 목록에서 여러 문자를 제거하려면 어떻게해야합니까? (0)	2021.01.29
파이썬 바이너리 파일을 구조체로 읽기 (0)	2021.01.29

프로그램 샘플 소스

파이썬 Python에서 PDF 속성 / 메타 데이터 읽기

해결 방법

'파이썬' 카테고리의 다른 글

댓글

티스토리툴바

파이썬 Python에서 PDF 속성 / 메타 데이터 읽기

해결 방법

'파이썬' 카테고리의 다른 글

관련글

댓글

티스토리툴바