http代理服务器的实现原理

1.代理服务器

代理服务器(Proxy Server)的功能是代理网络用户去取得网络信息,它是网络信息的中转站,是个人网络和Internet服务商之间的中间代理机构,负责转发网络信息。

代理服务器可以实现一下功能:
1.隐藏身份
2.充当防火墙
3.防止攻击
4.权限控制

代理服务器按照其使用方式和作用,分为正向代理服务器,反向代理服务器.
http代理服务器的实现原理

1.1代理服务器的分类

(1) HTTP代理 :能够代理客户机的HTTP访问,主要是代理浏览器访问网页。

(2)FTP代理:能够代理客户机上的FTP软件访问FTP服务器。

(3)RTSP代理:代理客户机上的Realplayer访问Real流媒体服务器。

(4)POP3代理:代理客户机上的邮件软件用POP3方式收发邮件。

(5)v*n代理:指在共用网络上建立专用网络的技术。之所以称为虚拟网主要是因为整个v*n网络的任意两个结点之间的

1.2.代理服务体现为网络进程的通信

1.2.1本地进程间通信

本地进程间通信主要包括管道、系统IPC(包括消息队列、信号量、信号、共享内存等)、以及套接字socket

1.2.2网络进程通信方式

通信 : 通信协议 + 计算机网络

http代理服务器的实现原理

两个应用进程之间进行通信发送报文需要经过计算机网络,而应用进程一般由开发者控制,计算机网络由操作系统控制,所以计算机应用把通信的报文传给网络是通过一个socket(套接字)的软件接口来实现,因此套接字也被称为应用程序和网络之间的应用程序编程接口。

http代理服务器的实现原理

2.HTTP正向代理

http代理方式如下图,负责将http请求和响应进行转发。
http代理服务器的实现原理

2.1.用户使用http代理

进程由ip地址和端口号来标识,网络的http代理提供方式都是诸如: ip地址:端口号 的方式,所以我们使用时也是在浏览器或者程序中设置ip和端口号就可以走网络的http代理服务。

2.2.代理认证

代理认证:

前文提到代理服务器可以做到权限控制,即控制用户使用相关资源。而网络商的http代理服务器商也是使用代理认证的方式来区分是否客户。

如何认证:
对于http代理的认证方式,分为basic认证和digest认证,目前主流都是使用basic认证,通过在http请求头传递用户名和密码的base64加密字符串来实现认证。

http代理服务器的实现原理

2.3.http正向代理的实现
2.3.1.socket套接字编程具体原理

前面说到应用程序往网络传输层传递报文是通过套接字编程来实现的,所以http正向代理也是通过socket来实现的。

客户端去访问服务器时,服务器的进程应该确保已经运行起来,服务器进程会启动一个serverSocket(欢迎套接字),该套接字是所有客户端与服务器接触的起点,随后该套接字会生成一个新的套接字,称为连接套接字,连接套接字负责和客户端的套接字进行报文数据的交换,使用流的方式来传输。

http代理服务器的实现原理http代理服务器的实现原理
图片引自博客

2.3.2.http代理服务器实现逻辑

http代理服务器的实现原理

2.3.3.参考例子

开发一个http代理服务器
java实现的简单http代理服
基于netty实现的代理服务
《计算机网络 自定向下方法》第六版