python爬虫基础知识

一、浏览器的请求与响应

1、解释名词:
DNS:域名解析器(是一个可以将域名和ip地址相互映射的分布式数据库,使得人们不用去记住复杂的ip字符串)
分布式数据库:指数据分存在计算机网络中的各台计算机上的数据库

2、过程流程图:
python爬虫基础知识
3、常用请求:
get:速度快,明文不安全,参数长度有限
post:安全,上传文件
put(不完全)
delete(删除一些信息)

ps:发送网络请求也可以不带参数(如直接在地址栏输入域名地址)

4、network中的一些信息参数
head(请求头)
(1)accept:文本格式
(2)accept-encoding:编码格式
(3)connection:长链接短链接
(4)cookie:缓存个人验证信息
(5)hsot:域名
(6)referer:标志从哪个页面跳转过来的
(7)user-agent:浏览器和用户的信息