从Python中的PDF中提取文本及其字体详细信息(样式和大小)
答
这是一个python库。请看看PDFMiner。
http://www.unixuser.org/~euske/python/pdfminer/index.html。
pdftext.py给你提炼出来的PDF文本,它也给你喜欢的字体和字体大小等
你可以尝试其他的信息。
注:的Python 3不支持
可以共享任何特定链接。我无法弄清楚相应的api选项。 –
'PDFMiner.six'支持'Python 3'。 – craned