Linux 310 kernel bridge转发逻辑Word下载.docx

上传人:b****8 文档编号:22620960 上传时间:2023-02-04 格式:DOCX 页数:16 大小:19.07KB
下载 相关 举报
Linux 310 kernel bridge转发逻辑Word下载.docx_第1页
第1页 / 共16页
Linux 310 kernel bridge转发逻辑Word下载.docx_第2页
第2页 / 共16页
Linux 310 kernel bridge转发逻辑Word下载.docx_第3页
第3页 / 共16页
Linux 310 kernel bridge转发逻辑Word下载.docx_第4页
第4页 / 共16页
Linux 310 kernel bridge转发逻辑Word下载.docx_第5页
第5页 / 共16页
点击查看更多>>
下载资源
资源描述

Linux 310 kernel bridge转发逻辑Word下载.docx

《Linux 310 kernel bridge转发逻辑Word下载.docx》由会员分享,可在线阅读,更多相关《Linux 310 kernel bridge转发逻辑Word下载.docx(16页珍藏版)》请在冰豆网上搜索。

Linux 310 kernel bridge转发逻辑Word下载.docx

}

这个函数可以给设备(net_device)注册接收函数,然后在__netif_receive_skb函数中根据接收skb的设备接口,再调用这个被注册的接收函数。

比如为网桥下的接口注册br_handle_frame函数,为bonding接口注册bond_handle_frame函数。

这相对于老式的网桥处理更灵活,有了这个机制也可以在模块中自行注册处理函数。

比如3.10中的openvswitch(OpenvSwitch在3.10已经合入了内核)创建netdevvport的函数netdev_create。

lnetdev_create

staticstructvport*netdev_create(conststructvport_parms*parms)

structvport*vport;

/....../

err=netdev_rx_handler_register(netdev_vport->

dev,netdev_frame_hook,vport);

这个函数在创建netdevvport时将设备的接收函数设置为netdev_frame_hook函数,这也是整个openvswitch的入口函数,如果查看OpenvSwitch的源码可以看到当安装于2.6内核时这里是替换掉bridge的br_handle_frame_hook函数,从而由bridge逻辑进入OpenvSwitch逻辑。

2.Bridge转发逻辑分析

还是先从netif_receive_skb函数分析,这个函数算是进入协议栈的入口。

lnetif_receive_skb

intnetif_receive_skb(structsk_buff*skb)

intret;

if(skb_defer_rx_timestamp(skb))

returnNET_RX_SUCCESS;

rcu_read_lock();

/*RPS逻辑处理,现在内核中使用了RPS机制,将报文分散到各个cpu的接收队列中进行负载均衡处理*/

#ifdefCONFIG_RPS

if(static_key_false(&

rps_needed)){

structrps_dev_flowvoidflow,*rflow=&

voidflow;

intcpu=get_rps_cpu(skb->

dev,skb,&

rflow);

if(cpu>

=0){

ret=enqueue_to_backlog(skb,cpu,&

rflow->

last_qtail);

rcu_read_unlock();

returnret;

}

#endif

ret=__netif_receive_skb(skb);

netif_receive_skb只是对数据包进行了RPS的处理,然后调用__netif_receive_skb。

__netif_receive_skb并没有其他多余的处理逻辑,主要调用__netif_receive_skb_core,这个函数才真正相当于2.6内核的netif_receive_skb。

以下代码省略了和bridge无关的逻辑。

l__netif_receive_skb_core

staticint__netif_receive_skb_core(structsk_buff*skb,boolpfmemalloc)

structpacket_type*ptype,*pt_prev;

rx_handler_func_t*rx_handler;

structnet_device*orig_dev;

structnet_device*null_or_dev;

booldeliver_exact=false;

intret=NET_RX_DROP;

__be16type;

/*......*/

orig_dev=skb->

dev;

skb_reset_network_header(skb);

pt_prev=NULL;

skb->

skb_iif=skb->

dev->

ifindex;

/*ptype_all协议处理,tcpdump抓包就在这里*/

list_for_each_entry_rcu(ptype,&

ptype_all,list){

if(!

ptype->

dev||ptype->

dev==skb->

dev){

if(pt_prev)

ret=deliver_skb(skb,pt_prev,orig_dev);

pt_prev=ptype;

/*调用接收设备的rx_handler*/

rx_handler=rcu_dereference(skb->

rx_handler);

if(rx_handler){

if(pt_prev){

switch(rx_handler(&

skb)){

caseRX_HANDLER_CONSUMED:

ret=NET_RX_SUCCESS;

gotoout;

caseRX_HANDLER_ANOTHER:

gotoanother_round;

caseRX_HANDLER_EXACT:

deliver_exact=true;

caseRX_HANDLER_PASS:

break;

default:

BUG();

/*根据skb->

protocol传递给上层协议*/

type=skb->

protocol;

list_for_each_entry_rcu(ptype,&

ptype_base[ntohs(type)&

PTYPE_HASH_MASK],list){

if(ptype->

type==type&

&

(ptype->

dev==null_or_dev||ptype->

dev||ptype->

dev==orig_dev)){

if(unlikely(skb_orphan_frags(skb,GFP_ATOMIC)))

gotodrop;

else

ret=pt_prev->

func(skb,skb->

dev,pt_prev,orig_dev);

}else{

drop:

atomic_long_inc(&

skb->

rx_dropped);

kfree_skb(skb);

ret=NET_RX_DROP;

out:

如果一个dev被添加到一个bridge(做为bridge的一个接口),的这个接口设备的rx_handler被设置为br_handle_frame函数,这是在br_add_if函数中设置的,而br_add_if(net/bridge/br_if.c)是在向网桥设备上添加接口时设置的。

进入br_handle_frame也就进入了bridge的逻辑代码。

lbr_add_if

intbr_add_if(structnet_bridge*br,structnet_device*dev)

err=netdev_rx_handler_register(dev,br_handle_frame,p);

lbr_handle_frame

rx_handler_result_tbr_handle_frame(structsk_buff**pskb)

structnet_bridge_port*p;

structsk_buff*skb=*pskb;

constunsignedchar*dest=eth_hdr(skb)->

h_dest;

br_should_route_hook_t*rhook;

if(unlikely(skb->

pkt_type==PACKET_LOOPBACK))

returnRX_HANDLER_PASS;

is_valid_ether_addr(eth_hdr(skb)->

h_source))

skb=skb_share_check(skb,GFP_ATOMIC);

skb)

returnRX_HANDLER_CONSUMED;

/*获取dev对应的bridgeport*/

p=br_port_get_rcu(skb->

dev);

/*特殊目的mac地址的处理*/

if(unlikely(is_link_local_ether_addr(dest))){

/*

*SeeIEEE802.1DTable7-10Reservedaddresses

*

*AssignmentValue

*BridgeGroupAddress01-80-C2-00-00-00

*(MACControl)802.301-80-C2-00-00-01

*(LinkAggregation)802.301-80-C2-00-00-02

*802.1XPAEaddress01-80-C2-00-00-03

*802.1ABLLDP01-80-C2-00-00-0E

*Othersreservedforfuturestandardization

*/

switch(dest[5]){

case0x00:

/*BridgeGroupAddress*/

/*IfSTPisturnedoff,thenmustforwardtokeeploopdetection*/

if(p->

br->

stp_enabled==BR_NO_STP)

gotoforward;

case0x01:

/*IEEEMAC(Pause)*/

/*Allowselectiveforwardingformostotherprotocols*/

group_fwd_mask&

(1u<

<

dest[5]))

/*LOCAL_INhook点,注意经过这个hook点并不代表发送到主机协议栈(只有特殊目的mac01-80-C2才会走到这里)*/

if(NF_HOOK(NFPROTO_BRIDGE,NF_BR_LOCAL_IN,skb,skb->

dev,

NULL,br_handle_local_finish)){

/*consumedbyfilter*/

*pskb=skb;

/*continueprocessing*/

/*转发逻辑*/

forward:

switch(p->

state){

caseBR_STATE_FORWARDING:

rhook=rcu_dereference(br_should_route_hook);

if(rhook){

if((*rhook)(skb)){

dest=eth_hdr(skb)->

/*fallthrough*/

caseBR_STATE_LEARNING:

/*skb的目的mac和bridge的mac一样,则将skb发往本机协议栈*/

if(ether_addr_equal(p->

dev_addr,dest))

pkt_type=PACKET_HOST;

/*NF_BR_PRE_ROUTINGhook点*/

NF_HOOK(NFPROTO_BRIDGE,NF_BR_PRE_ROUTING,skb,skb->

dev,NULL,br_handle_frame_finish);

default:

returnRX_HANDLER_CONSUMED;

经过NF_BR_LOCAL_INhook点会执行br_handle_local_finish函数。

lbr_handle_local_finish

staticintbr_handle_local_finish(structsk_buff*skb)

structnet_bridge_port*p=br_port_get_rcu(skb->

u16vid=0;

/*获取skb的vlanid(3.10的bridge支持vlan)*/

br_vlan_get_tag(skb,&

vid);

/*更新bridge的mac表,注意vlanid也是参数,说明每个vlan有一个独立的mac表*/

br_fdb_update(p->

br,p,eth_hdr(skb)->

h_source,vid);

/*processfurther*/

经过NF_BR_PRE_ROUTINGhook点会执行br_handle_frame_finish函数。

lbr_handle_frame_finish

intbr_handle_frame_finish(structsk_buff*skb)

structnet_bridge*br;

structnet_bridge_fdb_entry*dst;

structnet_bridge_mdb_entry*mdst;

structsk_buff*skb2;

p||p->

state==BR_STATE_DISABLED)

/*这个判断主要是vlan的相关检查,如是否和接收接口配置的vlan相同*/

br_allowed_ingress(p->

br,nbp_get_vlan_info(p),skb,&

vid))

/*insertintoforwardingdatabaseafterfilteringtoavoidspoofing*/

br=p->

br;

/*更新转发数据库*/

br_fdb_update(br,p,eth_hdr(skb)->

/*多播mac的处理*/

is_broadcast_ether_addr(dest)&

is_multicast_ether_addr(dest)&

br_multicast_rcv(br,p,skb))

state==BR_STATE_LEARNING)

BR_INPUT_SKB_CB(skb)->

brdev=br->

/*Thepacketskb2goestothelocalhost(NULLtoskip).*/

skb2=NULL;

/*如果网桥被设置为混杂模式*/

if(br->

flags&

IFF_PROMISC)

skb2=skb;

dst=NULL;

/*如果skb的目的mac是广播*/

if(is_broadcast_ether_addr(dest))

elseif(is_multicast_ether_addr(dest)){/*多播*/

mdst=br_mdb_get(br,skb,vid);

if(mdst||BR_INPUT_SKB_CB_MROUTERS_ONLY(skb)){

if((mdst&

mdst->

mglist)||

br_multicast_is_router(br))

br_multicast_forward(mdst,skb,skb2);

skb=NULL;

skb2)

}else

br->

stats.multicast++;

}elseif((dst=__br_fdb_get(br,dest,vid))&

dst->

is_local){/*目的地址是本机mac,则发往本机协议栈*/

/*Donotforwardthepacketsinceit'

slocal.*/

if(skb){

if(dst){

used=jiffies;

br_forward(dst->

dst,skb,skb2);

//转发给目的接口

br_flood_forward(br,skb,skb2);

//找不到目的接口则广播

if(skb2)

returnbr_pass_frame_up(skb2);

//发往本机协议栈

我们先看发往本机协议栈的函数br_pass_frame_up。

lbr_pass_frame_up

staticintbr_pass_frame_up(structsk_buff*skb)

structnet_device*indev,*brdev=BR_INPUT_SKB_CB(skb)->

brdev;

structnet_bridge*br=netdev_priv(brdev);

//更新统计计数(略)

/*Bridgeisjustlikeanyotherport.Makesurethe

*packetisallowedexceptinpromiscmoduewhensomeone

*mayberunningpacketcapture.

(brdev->

IFF_PROMISC)&

!

br_allowed_egress(br,br_get_vlan_info(br),skb)){

//如果不是混杂模式且vlan处理不合要求则丢弃

returnNET_RX_DROP;

//vlan处理逻辑

skb=br_handle_vlan(br,br_get_vlan_info(br),skb);

indev=skb->

dev=brdev;

//重点,这里修改了skb->

dev为bridge

//经过NF_BR_LOCAL_IN再次进入协议栈

returnNF_HOOK(NFPROTO_BRIDGE,NF_BR_LOCAL_IN,skb,indev,NULL,

netif_receive_skb);

再次进入netif_receive_skb,由于skb-dev被设置成了bridge,而bridge设备的rx_handler函数是没有被设置的,所以就不会再次进入bridge逻辑,而直接进入了主机上层协议栈。

下面看转发逻辑,转发逻辑主要在br_forward函数中,而b

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 医学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1