如何从ruby中的pdf文件中获取元数据?
问题描述:
我想从ruby中的pdf文件中获取元数据。 不仅仅是创建日期,但更像是:如何从ruby中的pdf文件中获取元数据?
- 版本
- 页面
- 安全
- 创建了 - [最重要的]
- CodingSoftware:MAC OS X 10.12.6
我已经看过pdfreader,但我没有找到一种方法从文件中提取这个
答
大多数这些信息是与宝石访问:
require 'pdf/reader'
PDF::Reader.open("my-file.pdf") do |reader|
puts reader.info.inspect
puts reader.metadata.inspect
puts reader.page_count
puts reader.pdf_version
end
+0
这没有为我工作。 reader.metadata.inspect返回nil。我最终使用了一个为我工作的'Henkei'。 –
这是[内置](http://www.rubydoc.info/gems/rmagick/Magick/Image#crop-instance_method)到你提到的图书馆。我们能否看到一个PDF文件的具体例子,其中必要的元数据不被宝石显示? –