puppeteer爬虫自学(一)——安装node.js和puppeteer组件
puppeteer爬虫自学(一)——安装node.js和puppeteer组件
一、 node.js简介
Node.js平台使用的开发语言是JavaScript,平台提供了操作系统底层的API,方便做服务器端编程;运行于浏览器的Javascript,浏览器就是Javascript代码的解析器,而Node.js则是服务器端JS的代码解析器,存于服务器端的JS代码由Node.js来解析和应用。
二、node.js 的安装与配置
主要操作环境是win10系统。
-
下载node.js ,
下载网址:http://nodejs.cn/download/下载与电脑相对应的版本
注 我使用的是二进制包 64位,解压后可直接使用. -
查看node.js的版本信息 ,
在命令提示符中进入到nodejs目录下,然后输入 node -v(需要在node的目录下面)
3、安装puppeteer模块
Puppeteer是什么?
Puppeteer 是一个Node库, 它提供高级API,通过DevTools Protocol 来控制Chrome 或 Chromium。 Puppeteer 默认运行为headless ,但是可以配置为运行为non-headless 。
可以做什么
生成页面截图或PDF
抓取SPA 并生成预渲染内容(SSR)
参考:https://jingyan.baidu.com/article/d5c4b52ba71fa0da560dc51d.html