linuxnetfilteriptable_filter

作者：重报礼坊官肀网 | 来源：互联网 | 2023-09-17 16:02

内核中将filter模块被组织成了一个独立的模块，每个这样独立的模块中都有个类似的init()初始化函数；首先来看一下filter模块是如何将自己的钩子

内核中将filter模块被组织成了一个独立的模块&＃xff0c;每个这样独立的模块中都有个类似的init()初始化函数&＃xff1b;首先来看一下filter模块是如何将自己的钩子函数注册到netfilter所管辖的几个hook点。

filter 模块钩子点:

/* 在LOCAL_IN&＃xff0c;FORWARD, LOCAL_OUT钩子点工作 */
#define FILTER_VALID_HOOKS ((1 <(1 < \(1 <

static const struct xt_table packet_filter &＃61; {.name &＃61; "filter",.valid_hooks &＃61; FILTER_VALID_HOOKS,.me &＃61; THIS_MODULE,.af &＃61; NFPROTO_IPV4,.priority &＃61; NF_IP_PRI_FILTER,.table_init &＃61; iptable_filter_table_init,
};

ilist

struct ipt_standard {struct ipt_entry entry;struct xt_standard_target target;
};
struct ipt_error {struct ipt_entry entry;struct xt_error_target target;
};void *ipt_alloc_initial_table(const struct xt_table *info)
{unsigned int hook_mask &＃61; info->valid_hooks; //LOCAL_IN、FORWARD、LOCAL_OUT unsigned int nhooks &＃61; hweight32(hook_mask); //这里得到3&＃xff0c;上面hookmask对应三个hook点。unsigned int bytes &＃61; 0, hooknum &＃61; 0, i &＃61; 0;
//看到函数的最后&＃xff0c;知道返回值是tbl&＃xff0c;而这里的结构体内嵌的三个结构体是tbl的组成&＃xff0c;三个结构体的数据结构拓扑图如图11.1.3。struct {struct ipt_replace repl; struct ipt_standard entries[nhooks]; struct ipt_error term; } *tbl &＃61; kzalloc(sizeof(*tbl), GFP_KERNEL); if (tbl &＃61;&＃61; NULL) return NULL; strncpy(tbl->repl.name, info->name, sizeof(tbl->repl.name)); tbl->term &＃61; (struct ipt_error)IPT_ERROR_INIT; tbl->repl.valid_hooks &＃61; hook_mask; tbl->repl.num_entries &＃61; nhooks &＃43; 1; tbl->repl.size &＃61; nhooks * sizeof(struct ipt_standard) &＃43; sizeof(struct ipt_error); for (; hook_mask !&＃61; 0; hook_mask >>&＃61; 1, &＃43;&＃43;hooknum) {if (!(hook_mask & 1)) continue; tbl->repl.hook_entry[hooknum] &＃61; bytes; tbl->repl.underflow[hooknum] &＃61; bytes; tbl->entries[i&＃43;&＃43;] &＃61; (struct ipt_standard) IPT_STANDARD_INIT(NF_ACCEPT); bytes &＃43;&＃61; sizeof(struct ipt_standard); }return tbl;
}
/*filter模块初始化时先调用ipt_register_table向Netfilter完成filter过滤表的注册&＃xff0c;然后调用ipt_register_hooks完成自己钩子函数的注册
*/

initial_table.repl&＃61; { "filter", FILTER_VALID_HOOKS, 4,sizeof(struct ipt_standard) * 3 &＃43; sizeof(struct ipt_error),{ [NF_IP_LOCAL_IN] &＃61; 0,[NF_IP_FORWARD] &＃61; sizeof(struct ipt_standard),[NF_IP_LOCAL_OUT] &＃61; sizeof(struct ipt_standard) * 2},{ [NF_IP_LOCAL_IN] &＃61; 0,[NF_IP_FORWARD] &＃61; sizeof(struct ipt_standard),[NF_IP_LOCAL_OUT] &＃61; sizeof(struct ipt_standard) * 2},0, NULL, { }
}&＃xff1b;

static int __net_init iptable_filter_table_init(struct net *net)
{struct ipt_replace *repl;int err;
/* filter表已经被初始化了&＃xff0c;返回 */if (net->ipv4.iptable_filter)return 0;
/* 分配初始化表&＃xff0c;用于下面的表注册 */repl &＃61; ipt_alloc_initial_table(&packet_filter);if (repl &＃61;&＃61; NULL)return -ENOMEM;/* Entry 1 is the FORWARD hook *//* 入口1是否为FORWARD钩子点时的verdict值设置 */((struct ipt_standard *)repl->entries)[1].target.verdict &＃61;forward ? -NF_ACCEPT - 1 : -NF_DROP - 1;err &＃61; ipt_register_table(net, &packet_filter, repl, filter_ops,&net->ipv4.iptable_filter);kfree(repl);return err;
}

---最后一个柔性数组struct ipt_entry entries[0]中保存了默认的那四条规则

test

/*
简而言之ipt_register_table()所做的事情就是从模板initial_table变量的repl成员里取出初始化数据&＃xff0c;然后申请一块内存并用repl里的值来初始化它&＃xff0c;
之后将这块内存的首地址赋给packet_filter表的private成员&＃xff0c;最后将packet_filter挂载到xt[2].tables的双向链表中。
*/
////iptable netfilter表注册添加到该链表中 iptable_filter.ko里面用结构xt_table,该表现源从packet_filter来的见xt_register_table
//table头部:net->xt.tables[table->af],所有table的头部链表
int ipt_register_table(struct net *net, const struct xt_table *table,const struct ipt_replace *repl,const struct nf_hook_ops *ops, struct xt_table **res)
{int ret;struct xt_table_info *newinfo;struct xt_table_info bootstrap &＃61; {0};void *loc_cpu_entry;struct xt_table *new_table;newinfo &＃61; xt_alloc_table_info(repl->size);//malloc for xt_table filter size为sizeof(struct ipt_standard) * 3 &＃43; sizeof(struct ipt_error),if (!newinfo)return -ENOMEM;loc_cpu_entry &＃61; newinfo->entries;//将表中的规则入口地址赋值给loc_cpu_entrymemcpy(loc_cpu_entry, repl->entries, repl->size);//拷贝repl里面的entries规则到xt_table_info表里面的entries里面/*translate_table函数将由newinfo所表示的table的各个规则进行边界检查&＃xff0c;然后对于newinfo所指的xt_talbe_info结构中的hook_entries和underflows赋予正确的值&＃xff0c;最后将表项向其他cpu拷贝*/ret &＃61; translate_table(net, newinfo, loc_cpu_entry, repl);if (ret !&＃61; 0)goto out_free;
/*
packet_filter中没对其private成员进行初始化&＃xff0c;那么这个工作自然而然的就留给了xt_register_table()函数来完成&＃xff0c;它也定义在x_tables.c文件中&＃xff0c;它主要完成两件事&＃xff1a;1&＃xff09;、将由newinfo参数所存储的表里面关于规则的基本信息结构体xt_table_info{}变量赋给由table参数所表示的packet_filter{}的private成员变量&＃xff1b;2&＃xff09;、根据packet_filter的协议号af&＃xff0c;将filter表挂到变量xt中tables成员变量所表示的双向链表里。
*/new_table &＃61; xt_register_table(net, table, &bootstrap, newinfo);if (IS_ERR(new_table)) {ret &＃61; PTR_ERR(new_table);goto out_free;}/* set res now, will see skbs right after nf_register_net_hooks */WRITE_ONCE(*res, new_table);ret &＃61; nf_register_net_hooks(net, ops, hweight32(table->valid_hooks));if (ret !&＃61; 0) {__ipt_unregister_table(net, new_table);*res &＃61; NULL;}return ret;out_free:xt_free_table_info(newinfo);return ret;
}

Filter回调函数

在上述ipt_register_table 实现中会调用nf_register_net_hooks 注册钩子回调函数

Netfilter中默认表filter在建立时则在NF_IP_LOCAL_IN&＃xff0c;NF_IP_FORWARD&＃xff0c;NF_IP_LOCAL_OUT钩子点注册了钩子函数iptable_filter_hook&＃xff0c;其核心ipt_do_table()对相对应的表和钩子点的规则进行遍历

static unsigned int
iptable_filter_hook(void *priv, struct sk_buff *skb,const struct nf_hook_state *state)
{/* LOCAL_OUT && (数据长度不足ip头 || 实际ip头部长度不足最小ip头)&＃xff0c;在使用raw socket */if (state->hook &＃61;&＃61; NF_INET_LOCAL_OUT &&(skb->len <sizeof(struct iphdr) ||ip_hdrlen(skb) <sizeof(struct iphdr)))/* root is playing with raw sockets. */return NF_ACCEPT;
/* 核心规则匹配流程 */return ipt_do_table(skb, state, state->net->ipv4.iptable_filter);
}

可知其回调函数核心函数为&＃xff1a;

/* Returns one of the generic firewall policies, like NF_ACCEPT.
包过滤子功能&＃xff1a;包过滤一共定义了四个hook函数&＃xff0c;这四个hook函数本质最后都调用了ipt_do_table()函数。
实际上是直接调用ipt_do_table(ip_tables.c)函数接下来就是根据table里面的entry来处理数据包了一个table就是一组防火墙规则的集合而一个entry就是一条规则&＃xff0c;每个entry由一系列的matches和一个target组成一旦数据包匹配了该某个entry的所有matches&＃xff0c;就用target来处理它
Match又分为两部份&＃xff0c;一部份为一些基本的元素&＃xff0c;如来源/目的地址&＃xff0c;进/出网口&＃xff0c;协议等&＃xff0c;对应了struct ipt_ip&＃xff0c;
我们常常将其称为标准的match&＃xff0c;另一部份match则以插件的形式存在&＃xff0c;是动态可选择&＃xff0c;也允许第三方开发的&＃xff0c;
常常称为扩展的match&＃xff0c;如字符串匹配&＃xff0c;p2p匹配等。同样&＃xff0c;规则的target也是可扩展的。这样&＃xff0c;一条规则占用的空间&＃xff0c;
可以分为&＃xff1a;struct ipt_ip&＃43;n*match&＃43;n*target&＃xff0c;&＃xff08;n表示了其个数&＃xff0c;这里的match指的是可扩展的match部份&＃xff09;。
*/
unsigned int
ipt_do_table(struct sk_buff *skb,const struct nf_hook_state *state,struct xt_table *table)
{unsigned int hook &＃61; state->hook;static const char nulldevname[IFNAMSIZ] __attribute__((aligned(sizeof(long))));const struct iphdr *ip;/* Initializing verdict to NF_DROP keeps gcc happy. */unsigned int verdict &＃61; NF_DROP;const char *indev, *outdev;const void *table_base;struct ipt_entry *e, **jumpstack;unsigned int stackidx, cpu;const struct xt_table_info *private;struct xt_action_param acpar;unsigned int addend;/* Initialization */stackidx &＃61; 0;ip &＃61; ip_hdr(skb);indev &＃61; state->in ? state->in->name : nulldevname;outdev &＃61; state->out ? state->out->name : nulldevname;/* We handle fragments by dealing with the first fragment as* if it was a normal packet. All other fragments are treated* normally, except that they will NEVER match rules that ask* things we don&＃39;t know, ie. tcp syn flag or ports). If the* rule is also a fragment-specific rule, non-fragments won&＃39;t* match it. */acpar.fragoff &＃61; ntohs(ip->frag_off) & IP_OFFSET;acpar.thoff &＃61; ip_hdrlen(skb);acpar.hotdrop &＃61; false;acpar.net &＃61; state->net;acpar.in &＃61; state->in;acpar.out &＃61; state->out;acpar.family &＃61; NFPROTO_IPV4;acpar.hooknum &＃61; hook;IP_NF_ASSERT(table->valid_hooks & (1 << hook));local_bh_disable();addend &＃61; xt_write_recseq_begin();private &＃61; table->private;cpu &＃61; smp_processor_id();/** Ensure we load private-> members after we&＃39;ve fetched the base* pointer.*/smp_read_barrier_depends();table_base &＃61; private->entries;jumpstack &＃61; (struct ipt_entry **)private->jumpstack[cpu];/* Switch to alternate jumpstack if we&＃39;re being invoked via TEE.* TEE issues XT_CONTINUE verdict on original skb so we must not* clobber the jumpstack.** For recursion via REJECT or SYNPROXY the stack will be clobbered* but it is no problem since absolute verdict is issued by these.*/if (static_key_false(&xt_tee_enabled))jumpstack &＃43;&＃61; private->stacksize * __this_cpu_read(nf_skb_duplicated);e &＃61; get_entry(table_base, private->hook_entry[hook]);do {const struct xt_entry_target *t;const struct xt_entry_match *ematch;struct xt_counters *counter;IP_NF_ASSERT(e);/*匹配IP包&＃xff0c;成功则继续匹配下去&＃xff0c;否则跳到下一个规则 ip_packet_match匹配标准match, 也就是ip报文中的一些基本的元素&＃xff0c;如来源/目的地址&＃xff0c;进/出网口&＃xff0c;协议等&＃xff0c;因为要匹配的内容是固定的&＃xff0c;所以具体的函数实现也是固定的。而IPT_MATCH_ITERATE &＃xff08;应该猜到实际是调用第二个参数do_match函数&＃xff09;匹配扩展的match&＃xff0c;如字符串匹配&＃xff0c;p2p匹配等&＃xff0c;因为要匹配的内容不确定&＃xff0c;所以函数的实现也是不一样的&＃xff0c;所以do_match的实现就和具体的match模块有关了。这里的&e->ip就是上面的ipt_ip结构*/if (!ip_packet_match(ip, indev, outdev,&e->ip, acpar.fragoff)) {//遍历匹配match
no_match:e &＃61; ipt_next_entry(e);continue;}xt_ematch_foreach(ematch, e) {acpar.match &＃61; ematch->u.kernel.match;acpar.matchinfo &＃61; ematch->data;if (!acpar.match->match(skb, &acpar))goto no_match;}counter &＃61; xt_get_this_cpu_counter(&e->counters);ADD_COUNTER(*counter, skb->len, 1);
/* ipt_get_target获取当前target&＃xff0c;t是一个ipt_entry_target结构&＃xff0c;这个函数就是简单的返回e&＃43;e->target_offset每个entry只有一个target&＃xff0c;所以不需要像match一样遍历&＃xff0c;直接指针指过去了*/t &＃61; ipt_get_target(e);IP_NF_ASSERT(t->u.kernel.target);#if IS_ENABLED(CONFIG_NETFILTER_XT_TARGET_TRACE)/* The packet is traced: log it */if (unlikely(skb->nf_trace))trace_packet(state->net, skb, hook, state->in,state->out, table->name, private, e);
#endif
/* 这里都还是和扩展的match的匹配很像&＃xff0c;但是下面一句有句注释&＃xff1a;Standard target? 判断当前target是否标准的target&＃xff1f;而判断的条件是u.kernel.target->target&＃xff0c;就是ipt_target结构里的target函数是否为空&＃xff0c;
而下面还出现了ipt_standard_target结构和verdict变量&＃xff0c;好吧&＃xff0c;先停下&＃xff0c;看看ipt_standard_target结构再说
ipt_standard_target的定义&＃xff1a;
struct ipt_standard_target
{struct ipt_entry_target target;int verdict;
};
也就比ipt_entry_target多了一个verdict&＃xff08;判断&＃xff09;&＃xff0c;请看前面的nf_hook_slow&＃xff08;&＃xff09;函数&＃xff0c;里面也有verdict变量&＃xff0c;
用来保存hook函数的返回值&＃xff0c;常见的有这些
#define NF_DROP 0
#define NF_ACCEPT 1
#define NF_STOLEN 2
#define NF_QUEUE 3
#define NF_REPEAT 4
#define RETURN IPT_RETURN
#define IPT_RETURN (-NF_MAX_VERDICT - 1)
#define NF_MAX_VERDICT NF_REPEAT
我们知道chain&＃xff08;链&＃xff09;是某个检查点上检查的规则的集合。除了默认的chain外&＃xff0c;用户还可以创建新的chain。在iptables中&＃xff0c;
同一个chain里的规则是连续存放的。默认的chain的最后一条规则的target是chain的policy。用户创建的chain的最后一条
规则的target的调用返回值是NF_RETURN&＃xff0c;遍历过程将返回原来的chain。规则中的target也可以指定跳转到某个用户创建的chain上&＃xff0c;
这时它的target是ipt_stardard_target&＃xff0c;并且这个target的verdict值大于0。如果在用户创建的chain上没有找到匹配的规则&＃xff0c;
遍历过程将返回到原来chain的下一条规则上。事实上&＃xff0c;target也是分标准的和扩展的&＃xff0c;但前面说了&＃xff0c;毕竟一个是条件&＃xff0c;一个是动作&＃xff0c;
target的标准和扩展的关系和match还是不太一样的&＃xff0c;不能一概而论&＃xff0c;而且在标准的target里还可以根据verdict的值再
划分为内建的动作或者跳转到自定义链简单的说&＃xff0c;标准target就是内核内建的一些处理动作或其延伸
扩展的当然就是完全由用户定义的处理动作
*/if (!t->u.kernel.target->target) {int v;v &＃61; ((struct xt_standard_target *)t)->verdict;/*v小于0&＃xff0c;动作是默认内建的动作&＃xff0c;也可能是自定义链已经结束而返回return标志*/if (v <0) { /*如果v大于0,记录是跳转偏移量,小于0,是标准target*//* Pop from stack? */if (v !&＃61; XT_RETURN) {verdict &＃61; (unsigned int)(-v) - 1;break;}/* e和back分别是当前表的当前Hook的规则的起始偏移量和上限偏移量&＃xff0c;即entry的头和尾&＃xff0c;e&＃61;back */if (stackidx &＃61;&＃61; 0) {e &＃61; get_entry(table_base,private->underflow[hook]);} else {e &＃61; jumpstack[--stackidx];e &＃61; ipt_next_entry(e);}continue;}/* v大于等于0&＃xff0c;处理用户自定义链&＃xff0c;如果当前链后还有规则&＃xff0c;而要跳到自定义链去执行&＃xff0c;那么需要保存一个back点&＃xff0c;以指示程序在匹配完自定义链后&＃xff0c;应当继续匹配的规则位置&＃xff0c;自然地&＃xff0c; back点应该为当前规则的下一条规则&＃xff08;如果存在的话&＃xff09;
至于为什么下一条规则的地址是table_base&＃43;v, 就要去看具体的规则是如何添加的了 */if (table_base &＃43; v !&＃61; ipt_next_entry(e) &&!(e->ip.flags & IPT_F_GOTO))jumpstack[stackidx&＃43;&＃43;] &＃61; e;e &＃61; get_entry(table_base, v); /*根据verdict的偏移量找到跳转的rule*/continue;}acpar.target &＃61; t->u.kernel.target;acpar.targinfo &＃61; t->data; /*如果是扩展target&＃xff0c;就执行扩展targe的target处理函数*/verdict &＃61; t->u.kernel.target->target(skb, &acpar);/* Target might have changed stuff. */ip &＃61; ip_hdr(skb);if (verdict &＃61;&＃61; XT_CONTINUE)e &＃61; ipt_next_entry(e);else/* Verdict */break;} while (!acpar.hotdrop);xt_write_recseq_end(addend);local_bh_enable();if (acpar.hotdrop)return NF_DROP;else return verdict;
}

filter回调函数和 match、target之间的关系&＃xff1a;

转:https://www.cnblogs.com/codestack/p/10850663.html

推荐阅读

split
java解析json转Map

java解析json转Map前段时间在做json报文处理的时候，写了一个针对不同格式json转map的处理工具方法，总结记录如下：1、单节点单层级、单节点多层级json转mapim ... [详细]

蜡笔小新 2024-11-15 18:21:27
function
C语言编写线程池的简单实现方法

2019独角兽企业重金招聘Python工程师标准好文章，一起分享——有时我们会需要大量线程来处理一些相互独立的任务，为了避免频繁的申请释放线程所带 ... [详细]

蜡笔小新 2024-11-14 20:11:23
const
普通树(每个节点可以有任意数量的子节点)级序遍历

普通树(每个节点可以有任意数量的子节点)级序遍历 ... [详细]

蜡笔小新 2024-11-14 18:53:26
js
自然语言处理(NLP)——LDA模型:对电商购物评论进行情感分析

目录一、2020数学建模美赛C题简介需求评价内容提供数据二、解题思路三、LDA简介四、代码实现1.数据预处理1.1剔除无用信息1.1.1剔除掉不需要的列1.1.2找出无效评论并剔除 ... [详细]

蜡笔小新 2024-11-14 18:21:21
const
MySQL初级篇——字符串、日期时间、流程控制函数的相关应用

文章目录：1.字符串函数2.日期时间函数2.1获取日期时间2.2日期与时间戳的转换2.3获取年月日、时分秒、星期数、天数等函数2.4时间和秒钟的转换2. ... [详细]

蜡笔小新 2024-11-14 10:57:02
io
C#实现文件的压缩与解压

2019独角兽企业重金招聘Python工程师标准一、准备工作1、下载ICSharpCode.SharpZipLib.dll文件2、项目中引用这个dll二、文件压缩与解压共用类 ... [详细]

蜡笔小新 2024-11-14 10:37:34
function
Python基础：使用NLTK和Python构建机器学习应用

本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节，作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识，为后续的机器学习应用打下坚实的基础。 ... [详细]

蜡笔小新 2024-11-13 21:23:34
spring
Spring – Bean Life Cycle

Spring – Bean Life Cycle ... [详细]

蜡笔小新 2024-11-13 13:24:40
split
深入解析Java中的空指针异常及其预防策略

空指针异常（NullPointerException，简称NPE）是Java编程中最常见的异常之一。尽管其成因显而易见，但开发人员往往容易忽视或未能及时采取措施。本文将详细介绍如何有效避免空指针异常，帮助开发者提升代码质量。 ... [详细]

蜡笔小新 2024-11-15 15:04:40
io
稀疏数组的高效存储与转换

稀疏数组是一种用于存储和处理大部分元素为零或相同值的数组的技术。通过记录非零元素的位置和值，稀疏数组可以显著减少存储空间和提高处理效率。 ... [详细]

蜡笔小新 2024-11-15 11:10:47
spring
嵌入式Linux工程师笔试题精选

本文整理了一份基础的嵌入式Linux工程师笔试题，涵盖填空题、编程题和简答题，旨在帮助考生更好地准备考试。 ... [详细]

蜡笔小新 2024-11-15 10:42:13
const
【数据结构】线段数/segment tree/interval tree

【线段树】　　本质是二叉树，每个节点表示一个区间[L,R]，设m(R-L+1)2(该处结果向下取整)左孩子区间为[L，m]，右孩子区间为[m ... [详细]

蜡笔小新 2024-11-14 23:11:47
io
Spark 弹性分布式数据集详解

本文详细介绍了 Spark 中的弹性分布式数据集（RDD）及其常见的操作方法，包括 union、intersection、cartesian、subtract、join、cogroup 等转换操作，以及 count、collect、reduce、take、foreach、first、saveAsTextFile 等行动操作。 ... [详细]

蜡笔小新 2024-11-14 15:44:57
io
JVM钩子函数的应用场景详解

本文详细介绍了JVM钩子函数的多种应用场景，包括正常关闭、异常关闭和强制关闭。通过具体示例和代码演示，帮助读者更好地理解和应用这一机制。适合对Java编程和JVM有一定基础的开发者阅读。 ... [详细]

蜡笔小新 2024-11-13 18:34:48
const
Android 自定义 RecycleView 左滑上下分层示例代码

为了满足项目需求，需要在多个场景中实现左滑删除功能，并且后续可能在列表项中增加其他功能。虽然网络上有很多左滑删除的示例，但大多数封装不够完善。因此，我们尝试自己封装一个更加灵活和通用的解决方案。 ... [详细]

蜡笔小新 2024-11-13 17:43:59

重报礼坊官肀网

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章