如何从ruby中的pdf文件中获取元数据?

问题描述:

我想从ruby中的pdf文件中获取元数据。 不仅仅是创建日期,但更像是:如何从ruby中的pdf文件中获取元数据?

  • 版本
  • 页面
  • 安全
  • 创建了 - [最重要的]
  • CodingSoftware:MAC OS X 10.12.6

我已经看过pdfreader,但我没有找到一种方法从文件中提取这个

+0

这是[内置](http://www.rubydoc.info/gems/rmagick/Magick/Image#crop-instance_method)到你提到的图书馆。我们能否看到一个PDF文件的具体例子,其中必要的元数据不被宝石显示? –

大多数这些信息是与宝石访问:

require 'pdf/reader' 

PDF::Reader.open("my-file.pdf") do |reader| 
    puts reader.info.inspect 
    puts reader.metadata.inspect 
    puts reader.page_count 
    puts reader.pdf_version 
end 
+0

这没有为我工作。 reader.metadata.inspect返回nil。我最终使用了一个为我工作的'Henkei'。 –