Node.js常用模块(小白向_含爬虫)

1.Node.js采用的Common.js规范的使用方式有三种

  • 内置模块

    内置模块就是默认绑定在全局变量 global 身上的方法,类似: window.location,内置模块就是Node提供的 内置方法,可以直接去使用,不需要安装,在官网文档/API文档中侧边栏中内容,格式: const 变量 = require('内置模块名')

  • 第三方模块

    前端的第三方模块在npmjs.com都可以找到,需要通过npm下载,如果下载速度过慢可以通过切换镜像源或 者cnpm下载,切换镜像源的具体方法上篇博客中有提到。

    npm是国外的服务器,安装过程中有可能因为网络问题产生丢包,可以采用cnpm进行安装

    cnpm install:淘宝镜https://blog.****.net/quuqu/article/details/64121812

    Dos 下面按照顺序将下面的三句命令复制执行。

    npm config set registry https://registry.npm.taobao.org

    npm config get registry

    npm install -g cnpm --registry=https://registry.npm.taobao.org

    npm cache clean -f :清除npm的缓存

  • 自定义模块

    自定义模块就是自己觉得自己写的模块不错或者想要与别人一起分享讨论,可以将自己写的模块上传到 npmjs上面,既然是采用的Common.js规范,肯定要使用Common.js规范的方法,首先使用 module.exports 导出一个模块,定义模块,然后使用require 引入一个模块,然后将你的自定义包上传到 npm源,这里有几点需要注意的,第一是上传时可以先进行搜索,是不可以重名的,第二是自定义包中 必须要有说明文件package.json,如果没有的话可以输入DOS命令npm init -y,然后输入npm adduser后 依次输入账号,密码,邮箱即可,最后使用npm publish进行推送

2.Node.js中常用的几个模块

使用模块前需要明白几个Node的基本概念,首先从严格意义上来讲,Node.js并不是一个后端语言,但它可以做类似后端语言的功能,它是使用了谷歌V8引擎,是js的一个运行环境,具有非阻塞I/O特点(非阻塞的意思就是异步,浏览器端多用异步,服务端都为同步),并且采用了Common.js规范,Node.js作为中间层连接了客户端和服务端,扩展了js的能力,可以实现很多原生js无法实现的东西,比如文件操作能力,数据库操作能力,dns解析能力,os解析能力等,并且Node.js的包管理器npm是全球最大的开源库生态系统

Node.js的内置模块的API可以在Node.js的官网进行查看,接下来为大家介绍几种常用的模块的常用方法

url模块

url模块主要是用于处理url的地址,方便对统一资源定位符进行操作处理

Node.js常用模块(小白向_含爬虫)

 

path模块

Node.js常用模块(小白向_含爬虫)

 

querystring模块

querystring 模块提供用于解析和格式化 URL 查询字符串的实用工具。 可以使用以下方式访问它:

Node.js常用模块(小白向_含爬虫)

 

http模块

http模块可以用于创建一个静态服务器,也可以用于爬虫,清洗工具需要用到第三方模块cheerio,具体使用案例如下:

创建静态服务器

Node.js常用模块(小白向_含爬虫)

 

爬虫:

Node.js常用模块(小白向_含爬虫)

Node.js常用模块(小白向_含爬虫)

 

 

fs模块

fs模块就是用于文件系统的增删改查,没什么好说的,查看API的使用方法即可

stream+zlib模块

可以使用代码将文件或者文件夹进行压缩,具体方法如下:

Node.js常用模块(小白向_含爬虫)

 

以上就是关于Node.js一些关于模块方面的内容,比较基础,如有错误或者疑惑,欢迎多多进行交流学习