如何使用Python获取PDF文件元数据'页面大小'?

问题描述:

我尝试在Python 3中使用PyPDF2模块,但我无法显示'页面大小'属性。 我想知道在扫描到PDF文件之前纸张尺寸是多少。如何使用Python获取PDF文件元数据'页面大小'?

事情是这样的:

import PyPDF2 
pdf=PdfFileReader("sample.pdf","rb") 
print(pdf.getNumPages()) 

但是我正在寻找另一个Python函数,而不是例如getNumPages()...

下面这个命令打印某种元数据,但没有页面大小:

pdf_info=pdf.getDocumentInfo() 
print(pdf_info) 

此代码应帮助您:

import PyPDF2 
pdf = PyPDF2.PdfFileReader("a.pdf","rb") 
p = pdf.getPage(1) 

w_in_user_space_units = p.mediaBox.getWidth() 
h_in_user_space_units = p.mediaBox.getHeight() 

# 1 user space unit is 1/72 inch 
# 1/72 inch ~ 0.352 millimeters 

w = float(p.mediaBox.getWidth()) * 0.352 
h = float(p.mediaBox.getHeight()) * 0.352