您的位置: 首页 > 文章 > 关于页面预览和pdf导出功能的实践和思路

关于页面预览和pdf导出功能的实践和思路

分类: 文章 • 2025-06-16 22:52:58

方案一：前端爬虫

这个方案是基于node的一个工具，名字叫nightmare（没有深入了解，可自行搜索），通过后端启动调用，传入指定的url，就能将对应的网址爬取成pdf，这个方案是我个人感觉很不错的一种。

优点：pdf高清，无需配置对应的模板
缺点：个人感觉其实没啥大的缺点，可能需要点学习成本。

公司由于护网行动，node直接访问url时，走域名访问，端口不能回流，走ip访问，nginx不给开ip访问权限，最终不了了之。

方案二：基于开源软件wkhtmltox

关于页面预览和pdf导出功能的实践和思路
网上有很多相关资料，官网使用教程也很简单，这里不做过多描述。

优点：安装使用都很简单，支持多种语言调用
缺点：只能访问静态资源，但现在大部分网址都是动态的，比如vue项目。
改进思路：个人尝试了下，先爬虫动态页面到本地，再用这个软件将本地的静态资源转pdf。由于同样绕不开端口回流问题，没有深入研究，理论上是可行的，需要个人研究下动态爬虫。

方案三：使用word模板，再转pdf

本地配置word模板，将其转换成对应的xml配置文件。用户动态配置里面的数据，生成对应的word，再使用类似openOffice的软件，将word转换成pdf。

优点：方案成熟，网上有很多可参考的资料和代码。
缺点：不灵活，word模板配置很死板，而且很难调。