从Python中的PDF中提取文本及其字体详细信息(样式和大小)

问题描述:

我期待从Python中的PDF中提取文本及其字体详细信息(样式和大小)。从Python中的PDF中提取文本及其字体详细信息(样式和大小)

我需要读取/解析文本内容并获取字体细节。请建议。

这是一个python库。请看看PDFMiner。

http://www.unixuser.org/~euske/python/pdfminer/index.html

pdftext.py给你提炼出来的PDF文本,它也给你喜欢的字体和字体大小等

你可以尝试其他的信息。

注:的Python 3不支持

+0

可以共享任何特定链接。我无法弄清楚相应的api选项。 –

+0

'PDFMiner.six'支持'Python 3'。 – craned