Linux 网络协议栈开发(三)—— 链路层基础

(转自 http://blog.csdn.net/u010246947/article/details/18223085)


一、链路层原理:

1、链路层在干什么:


  在报文接收方向上,网卡驱动把接收到的数据按照其对应的链路层协议(如以太网)组装成报文,然后把它上交给链路层,接口是netif_receive_skb,至此网卡驱动的任务就结束了,报文交给链路层处理;

  

  在报文发送方向上,网卡驱动受链路层驱使,链路层告知其有报文要发送时,网卡驱动才开始工作,接口是dev_queue_xmit。


  上面是链路层和网卡驱动层的接口,然而在链路层不一定是报文最终的归宿,从报文接收角度看,绝大多数报文都要最终给目的主机的应用层,协议报文会在不同协议所属层次终结,所以大多数报文都还要由链路层处理后(或不处理)再向上层转发,比如IP报文,在链路层由ip_rcv函数进入网络层处理,比如由应用程序通过原始套接字获取的报文将在链路层被直接送往socket层,比如arp协议报文会被送往arp模块去处理……


  再从报文发送角度看,不同的处理模块,会通过其专有接口通知链路层要发送报文,比如对于网络层,通过ip_finish_output(最终是ip_finish_output2)告诉链路层要发送报文(事实上是经由邻居子系统模块实际发送,邻居子系统实现链路层和网络层的映射,可以认为属于链路层和网络层的中间层),当然原始套接字的情况则比较简单,直接调用dev_queue_xmit通知网卡驱动,然而对于网桥、vlan子接口的收发,链路层的处理就显得极为必要,而从网络分层理论看,网桥、vlan,正是逻辑链路层的内容,这些都属于linux链路层的核心工作,典型的对于以太网的链路层,以太网类型、vlan、源目MAC地址是链路层的协议字段


 此外,在链路层的无需三层协议转发的二层隧道转发方式,典型如按网络层IP地址转发的eoip(Ethernet over ip),也是链路层的任务。

从功能上看,链路层完成以下任务:


1、实现与网卡驱动和协议栈上层的接口;

2、实现网桥,即实现按MAC地址转发的二层交换机功能;

3、实现vlan处理,实现带vlan报文的传输;

4、实现邻居子系统,即实现链路层和网络层的映射;

5、根据以太网类型,实现根据链路层协议类型收发报文;

6、实现二层隧道功能(典型如依托于网络层IP地址转发的eoip隧道);


Linux 网络协议栈开发(三)—— 链路层基础

  如上图,链路层由netif_receive_skb收到报文后,依次进行网桥处理、L2隧道处理、按以太网类型处理(事实上在按以太网类型处理前,还可能有其他处理),网桥处理中会根据报文是否发给本机还是转发做不同的处理,发给本机将修改报文输入接口为桥端口并返回


  netif_receive_skb重新进协议栈处理,转发则直接调用dev_queue_xmit从对应接口发送;L2隧道处理则根据所属隧道的目的IP寻找路由,并根据路由结果指示的出接口转发报文;按以太网类型处理,就根据以太网类型调用在之前注册过的协议处理函数,如vlan报文调用vlan_skb_recv,IP报文调用ip_rcv,arp报文调用arp_rcv等等;


 需要注意对于网桥和vlan的上本机的报文,会更新报文的输入接口,由从网卡驱动接收接口改为对应的桥端口或vlan子接口(vlan报文还会去除vlan头),这是因为事实上上层协议栈关心报文的“逻辑”输入接口,而不是“物理”输入接口,这些报文的反向报文也是由上层协议栈发送到桥端口或vlan子接口,再继而转换为其原始的报文输入接口通往网卡驱动,简单的说就是网桥、vlan报文对于上层协议栈可见的是桥端口、vlan子接口。


  综上所述,链路层的功能是提供协议栈与网卡驱动的接口、协议栈上层的接口(按以太网类型)、直接转发(网桥或L2隧道),另外邻居子系统实现了链路层和网络层的映射(对于IPV4为arp),另外需要注意,netif_receive_skb是在软中断处理函数调用的,也就是说整个协议栈报文处理是处于软中断中。



2、接口的概念:

  接口可以理解为链路层的每一个收发单元,每一个接口可以对应实际的一个网卡,也可以是一个没有实际物理设备驱动对应的“虚”接口,比如网桥接口、vlan子接口,不论是“虚”接口还是“实”接口,在内核中都是以net_device结构体描述;


  对于网络层,最重要的工作是选路,即确定路由,而确定路由就是确定报文是转发还是上送本机,如果是转发的话从哪个接口发送(skb->_skb_dst),并且路由判决所需条件也包括报文的输入接口即报文是从哪个接口上到网络层的(skb->dev),除路由之外,上层协议栈其他部分也经常关注报文的输入接口和路由转发接口; 


  所以接口是报文实际输入输出的逻辑路径,但不一定是物理路径,如某报文的路由结果是从eth0.5接口转发出去,那么这个eth0.5就是转发的逻辑路径,但它并没有实际的物理驱动,而是再通过vlan子接口处理最终仍由eth0实际转发报文,再如某报文由网桥br0上送到网络层,那么br0是该报文的逻辑路径,上层协议栈认为该报文就是从br0接收的,而实际该报文可能是由eth1实际接收的,经过网桥处理后输入接口变为br0的。


  之所以会有“虚”接口,都是因为一些特殊的目的,linux需要实现网桥,需要实现vlan,而这些都是逻辑上的概念,并不真的存在某种物理设备叫网桥或者叫vlan,所以需要人为的制造出这些“虚”接口,以满足上层协议栈向下处理的统一性,而这些“虚”接口和“实接口的“虚实转换”,就是需要链路层实现的内容。


 “实”接口一般由网卡驱动生成,因为网卡驱动管理实际的物理设备,所以一般诸如eth0、wlan1、usb2之类“实”接口由网卡驱动生成,网卡驱动负责这些“实”接口的ops实现;而“虚”接口一般由应用程序生成,如网桥、vlan子接口,内核源码负责这些类型的“虚”接口的ops。


  可以把linux机器想象成一台能够实现交换机、路由器、主机的L2/3/4/5功能的结合体机器,“实”接口就是这个结合体机器的每个物理端口,“虚”接口表面上实现一些二层网络功能,如vlan子接口实现物理端口的vlan功能,网桥接口实现二层交换功能,而实际上这些“虚”接口同样被这个结合体机器的L3/4/5所识别