SKBBUFF整理笔记Word文件下载.docx
《SKBBUFF整理笔记Word文件下载.docx》由会员分享,可在线阅读,更多相关《SKBBUFF整理笔记Word文件下载.docx(13页珍藏版)》请在冰点文库上搜索。
数据部分会在尾部包含一个附加的头部。
下图是TCP(L4)向下发送数据给链路层L2的过程。
注意skb_buff-&
data在从L4向L2穿越过程中的变化
几个len的区别?
(1)sk_buff-&
len:
表示当前协议数据包的长度。
它包括主缓冲区中的数据长度(data指针指向它)和分片中的数据长度。
比如,处在网络层,len指的是ip包的长度,如果包已经到了应用层,则len是应用层头部和数据载荷的长度。
(2)sk_buff-&
data_len:
data_len只计算分片中数据的长度,即skb_shared_info中有效数据总长度(包括frag_list,frags[]中的扩展数据),一般为0
(3)sk_buff-&
truesize:
这是缓冲区的总长度,包括sk_buff结构和数据部分。
如果申请一个len字节的缓冲区,alloc_skb函数会把它初始化成len+sizeof(sk_buff)。
当skb-&
len变化时,这个变量也会变化。
通常,DataBuffer只是一个简单的线性buffer,这时候len就是线性buffer中的数据长度;
但在有‘pageddata’情况下,DataBuffer不仅包括第一个线性buffer,还包括多个pagebuffer;
这种情况下,‘data_len’指的是pagebuffer中数据的长度,’len’指的是线性buffer加上pagebuffer的长度;
len–data_len就是线性buffer的长度。
二.sk_buff结构操作函数
内核通过alloc_skb()和dev_alloc_skb()为套接字缓存申请内存空间。
这两个函数的定义位于net/core/skbuff.c文件内。
通过这alloc_skb()申请的内存空间有两个,一个是存放实际报文数据的内存空间,通过kmalloc()函数申请;
一个是sk_buff数据结构的内存空间,通过kmem_cache_alloc()函数申请。
dev_alloc_skb()的功能与alloc_skb()类似,它只被驱动程序的中断所调用,与alloc_skb()比较只是申请的内存空间长度多了16个字节。
内核通过kfree_skb()和dev_kfree_skb()释放为套接字缓存申请的内存空间。
dev_kfree_skb()被驱动程序使用,功能与kfree_skb()一样。
users为1时kfree_skb()才会执行释放内存空间的动作,否则只会减少skb-&
users的值。
skb-&
users为1表示已没有其他用户使用该缓存了。
skb_reserve()函数为skb_buff缓存结构预留足够的空间来存放各层网络协议的头信息。
该函数在在skb缓存申请成功后,加载报文数据前执行。
在执行skb_reserve()函数前,skb-&
head,skb-&
data和skb-&
tail指针的位置的一样的,都位于skb内存空间的开始位置。
这部份空间叫做headroom。
有效数据后的空间叫tailroom。
skb_reserve的操作只是把skb-&
tail指针向后移,但缓存总长不变。
运行skb_reserve()前sk_buff的结构
sk_buff
--------------------------------&
skb-&
data,skb-&
tail
||
-------------------------------&
end
运行skb_reserve()后sk_buff的结构
head
|headroom|
|---------------------|----------&
skb_put()向后扩大数据区空间,tailroom空间减少,skb-&
data指针不变,skb-&
tail指针下移。
skb_push()向前扩大数据区空间,headroom空间减少,skb-&
tail指针不变,skb-&
data指针上移
skb_pull()缩小数据区空间,headroom空间增大,skb-&
data指针下移,skb-&
tail指针不变。
skb_shared_info结构位于skb-&
end后,用skb_shinfo函数申请内存空间。
该结构主要用以描述data内存空间的信息。
--------------------------------&
|sk_buff|
|---------------------|-----------&
|skb_share_info|
---------------------
skb_clone和skb_copy可拷贝一个sk_buff结构,skb_clone方式是clone,只生成新的sk_buff内存区,不会生成新的data内存区,新sk_buff的skb-&
data指向旧data内存区。
skb_copy方式是完全拷贝,生成新的sk_buff内存区和data内存区。
。
三.skb的分配细节
1.关于SKB的分配细节.
LINUX中SKB的分配最终是由函数:
structsk_buff*__alloc_skb(unsignedintsize,gfp_tgfp_mask,intfclone)来完成.
SKB可以分为SKB描述符与SKB数据区两个部分,其中描述符必须从CACHE中来分配:
或者从skbuff_fclone_cache中分配,或者从skbuff_head_cache中来分配.
如果从分配描述符失败,则直接反悔NULL,表示SKB分配失败.
SKB描述符分配成功后,即可分配数据区.
在具体分配数据区之前首先要对数据区的长度进行ALIGN操作,通过宏SKB_DATA_ALIGN来重新确定size大小.然后戏台调用kmalloc函数分配数据区:
data=kmalloc(size+sizeof(structskb_shared_info),gfp_mask);
需要注意的是数据区的大小是SIZE的大小加上skb_shared_info结构的大小.
数据区分配成功后,便对SKB描述符进行与此数据区相关的赋值操作:
memset(skb,0,offsetof(structsk_buff,truesize));
truesize=size+sizeof(structsk_buff);
atomic_set(&
amp;
users,1);
head=data;
data=data;
tail=data;
end=data+size;
需要主意的是,SKB的truesize的大小并不包含skb_shared_info结构的大小.另外,skb的end成员指针也就是skb_shared_info结构的起始指针,系统用
一个宏:
skb_shinfo来完成寻找skb_shared_info结构指针的操作.
最后,系统初始化skb_shared_info结构的成员变量:
(skb_shinfo(skb)-&
dataref),1);
skb_shinfo(skb)-&
nr_frags=0;
tso_size=0;
tso_segs=0;
frag_list=NULL;
ufo_size=0;
ip6_frag_id=0;
最后,返回SKB的指针.
2.SKB的分配时机
SKB的分配时机主要有两种,最常见的一种是在网卡的中断中,有数据包到达的时,系统分配SKB包进行包处理;
第二种情况是主动分配SKB包用于各种调试或者其他处理环境.
3.SKB的reserve操作
SKB在分配的过程中使用了一个小技巧:
即在数据区中预留了128个字节大小的空间作为协议头使用,通过移动SKB的data与tail指针的位置来实现这个功能.
4.SKB的put操作
put操作是SKB中一个非常频繁也是非常重要的操作,但是,skb_put()函数其实什么也没做!
它只是根据数据的长度移动了tail指针并改写了skb-&
len的值,其他的什么都没做,然后就返回了skb-&
data指针(就是tail指针在移动之前的位置).看上去此函数仿佛要拷贝数据到skb的数据区中,其实这事儿是insl这个函数干的,跟skb_put()函数毫不相关,不过它仍然很重要.
5.中断环境下SKB的分配流程
当数据到达网卡后,会触发网卡的中断,从而进入ISR中,系统会在ISR中计算出此次接收到的数据的字节数:
pkt_len,然后调用SKB分配函数来分配SKB:
skb=dev_alloc_skb(pkt_len+5);
我们可以看到,实际上传入的数据区的长度还要比实际接收到的字节数多,这实际上是一种保护机制.实际上,在dev_alloc_skb函数调用__dev_alloc_skb函数,而__dev_alloc_skb函数又调用alloc_skb函数时,其数据区的大小又增加了128字节,这128字节就事前面我们所说的reserve机制预留的header空间.
四.不同情况下构造skb数据包的实现
在我这个网络接口的程序中(can0),其实难点就是怎样组包。
怎样在原来数据包的基础加上自己的数据,怎样构造ip头,怎样构造udp头。
调试了两个星期,终于是调通了,在这个过程中,通过看内核源代码和自己组包的尝试,大概对组包的方法有了些了解,记录在此,留做备忘,也希望能给需要这方面信息的朋友一点帮助吧。
1,正常网卡收到数据包后的情况:
她的工作就是剥离mac头,然后给一些字段赋值,最后调用netif_rx将剥离mac头后的数据报(比如ip数据包)发送到上层协议。
由协议栈处理。
在此以ldd3中的snull为例,虽然snull跟硬件不相关,但这个过程都是类似的。
structsk_buff*skb;
structsnull_priv*priv=netdev_priv(dev);
skb=dev_alloc_skb(pkt-&
datalen+2);
if(!
skb){
if(printk_ratelimit())
printk(KERN_NOTICE"
snullrx:
lowonmem-packetdropped/n"
);
priv-&
stats.rx_dropped++;
gotoout;
}
skb_reserve(skb,2);
/*alignIPon16Bboundary*/
memcpy(skb_put(skb,pkt-&
datalen),pkt-&
data,pkt-&
datalen);
/*Writemetadata,andthenpasstothereceivelevel*/
dev=dev;
protocol=eth_type_trans(skb,dev);
ip_summed=CHECKSUM_UNNECESSARY;
/*don'
tcheckit*/
stats.rx_packets++;
stats.rx_bytes+=pkt-&
datalen;
netif_rx(skb);
注意:
上面代码中红色放大的地方是重要的。
因为此刻收到的数据包的格式如下:
mac+ip+udp/udp+data
这时候的处理就是剥离mac头,然后需要更新的一些域值。
这些都是在函数eth_type_trans函数里做的。
需要注意的是,skb-&
这条语句是很重要的,如果没有此语句,将会导致系统错误而死机(至少在我的板子上是这样的)。
eth_type_trans()函数主要赋值的是:
mac.raw,skb-&
protocol和skb-&
pkt_type。
见下面的代码有无mac头的情况。
2,完全从一个字符串开始构造一个新的skb数据包。
以前只是看过如何修改数据包,自己构造数据包,这还是头一次,刚开始确实给我难住了,来来经过看内核代码和自己摸索,我自己写的代码如下:
/*假设:
data是一个指向字符串的指针,data_len是data的长度*/
structipv6hdr*ipv6h;
structudphdr*udph;
structsk__buff*new_skb;
intlength=data_len+sizeof(structipv6hdr)+sizeof(udphdr);
new_skb=dev_alloc_skb(length);
if(!
new_skb)
{
printk("
lowmemory.../n"
):
return-1;
skb_reserve(new_skb,length);
memcpy(skb_push(new_skb,data_len),data,data_len);
new_skb-&
h.uh=udph=(structudphdr*)skb_push(new_skb,sizeof(structudphdr));
memcpy(udph,&
udph_tmp,sizeof(structudphdr));
//注意,此刻我的udph_tmp是在另一个过程中截获的数据包的udp头,如果完全是自己构造数据包,则需要自己填充udp数据头中的字段。
udph-&
len=..............;
//此处需要给udph-&
len赋值。
注意udph-&
len是__u16的。
存储时是高低位互换的,所以你应该先将你要更新的数字编成16进制的数,然后高低位互换,在赋值给udh-&
len。
udplen=new_skb-&
len;
nh.ipv6h=ipv6h=(structipv6hdr*)skb_push(new_skb,sizeof(structipv6hdr));
memcpy(ipv6h,&
ipv6h_tmp,sizeof(structipv6hdr));
//同udp头注释。
ipb6h-&
payload_len=..........;
//此处同udph-&
len.需要注意的是,此处所指的长度并不包括ipv6头的长度,而是去掉ipv6头后的长度。
check=0;
check=csum_ipv6_magic(&
ipv6h-&
saddr,&
daddr,udplen,IPPROTO_UDP,csum_partial((char*)udph,udplen,0));
///////////////注意,如果是ipv4,则还需要计算ip校验和,但此处是ipv6,不用计算ip检验和,所以此处没有ipv6头的校验。
//////////////////////////
mac.raw=new_skb-&
data;
//因为无mac头
protocol=htons(ETH_P_IPV6);
//表明包是ipv6数据包
pkt_type=PACKET_HOST;
//表明是发往本机的包
dev=&
can_control;
//此处很重要,如果没有这条语句,则内核跑死。
至少在我板子上是这样的。
can_control是我的net_device结构体变量。
netif_rx(new_skb);
3,当需要改变原有skb的数据域的情况。
此时,有两种办法:
可以先判断skb的tailroom,如果空间够大,则我们可以把需要添加的数据放在skb的tailroom里。
如果tailroom不够大,则需要调用skb_copy_expand函数来扩充tailroom或者headroom。
例如我们需要在skb的后面加上一个16个字节的字符串,则代码类似如下:
if(skb_tailroom(skb)&
lt;
16)
{
nskb=skb_copy_expand(skb,skb_headroom(skb),skb_tailroom(skb)+16,GFP_ATOMIC);
if(!
nskb)
lowmemory..../n"
dev_kfree_skb(skb);
else
kfree_skb(skb);
//注意,如果此时是钩子函数钩出来的,则skb不能在这里释放,否则会造成死机。
skb=nskb;
memcpy(skb_put(skb,16),ipbuf,16);
//ipbuf为要加到skb后面的字符串
udplen=skb-&
len-sizeof(structipv6hdr);
udph-&
len+=0x1000;
//换成十进制为+16
ipv6h-&
payload_len+=0x1000;
daddr,udplen,IPPROTO_UDP,csum_partial((char*)udph,udplen,0));
}
当调用skb_copy_expand或者修改了skb的数据域后,一定要更新udph-&
len和ipv6h-&
payload_len。
否则上层应用(比如udp套接字)收到的数据包还是原来的数据包而不是修改后的数据包,因为udph-&
len的原因。
本文来自CSDN博客,转载请标明出处: