参考原文链接:linux内核部件分析(三)——记录生命周期的kref
另外关于kref的使用可参考:
Linux内核里的“智能指针”
Linux内核里的“智能指针” (续)
kref
是一个引用计数器,它被嵌套进其它的结构中,记录所嵌套结构的引用计数,并在计数为0时调用相应的清理函数。kref
的原理和实现都非常简单,但要想用好却不容易,或者说kref
被创建就是为了跟踪复杂情况下结构的引用和销毁。所以这里先介绍kref
的实现,再介绍其使用规则。
kref 的定义实现
kref
的头文件在include/linux/kref.h
,实现在lib/kref.c
。
kref
的定义非常简单,其结构体里只有一个原子变量。
Linux内核定义了下面三个函数接口来使用kref
:
kref_init
初始化kref
的计数值为1。
kref_get
递增kref
的计数值。
kref_put
递减kref
的计数值,如果计数值减为0,说明kref
所指向的结构生命周期结束,会执行release
释放函数。
kref 的使用
kref
设计得如此简单,是为了能灵活地用在各种结构的生命周期管理中。要用好它可不简单,好在Documentation/kref.txt中为我们总结了一些使用规则,下面简单翻译一下。
对于那些用在多种场合,被到处传递的结构,如果没有引用计数,bug几乎总是肯定的事。所以我们需要kref
,kref
允许我们在已有的结构中方便地添加引用计数。
你可以以如下方式添加kref
到你的数据结构中:
kref
可以出现在你结构中的任意位置。
在分配kref
后你必须初始化它,可以调用kref_init
,把kref
计数值初始为1。
初始化之后,kref
的使用应该遵循以下三条规则:
1) 如果你创建了一个结构指针的非暂时性副本,特别是当这个副本指针会被传递到其它执行线程时,你必须在传递副本指针之前执行kref_get:
2)当你使用完,不再需要结构的指针,必须执行kref_put。如果这是结构指针的最后一个引用,release函数将会被调用。如果代码绝不会在没有拥有引用计数的请求下去调用kref_get,在kref_put时就不需要加锁。
3)如果代码试图在还没拥有引用计数的情况下就调用kref_get,就必须串行化kref_put和kref_get的执行。因为很可能在kref_get执行之前或者执行中,kref_put就被调用并把整个结构释放掉了。
例如,你分配了一些数据并把它传递到其它线程去处理:
这样做,无论两个线程的执行顺序是怎样的都无所谓,kref_put
知道何时数据不再有引用计数,可以被销毁。kref_get()
调用不需要加锁,因为在my_data_handler
中调用kref_get
时已经拥有一个引用。同样地原因,kref_put
也不需要加锁。
要注意规则一中的要求,必须在传递指针之前调用kref_get
。决不能写下面的代码:
不要认为自己在使用上面的代码时知道自己在做什么。首先,你可能并不知道你在做什么。其次,你可能知道你在做什么(在部分加锁情况下上面的代码也是正确的),但一些修改或者复制你代码的人并不知道你在做什么。这是一种坏的使用方式。
当然在部分情况下也可以优化对get
和put
的使用。例如,你已经完成了对这个数据的处理,并要把它传递给其它线程,就不需要再做多余的get
和put
了。
只需要做enqueue操作即可,可以在其后加一条注释。
第三条规则是处理起来最麻烦的。例如,你有一列数据,每条数据都有kref
计数,你希望获取第一条数据。但你不能简单地把第一条数据从链表中取出并调用kref_get
。这违背了第三条,在调用kref_get
前你并没有一个引用。你需要增加一个mutex
(或者其它锁)。
如果你不想在整个释放过程中都加锁,kref_put
的返回值就有用了。例如你不想在加锁情况下调用kfree
,你可以如下使用kref_put
。
如果你在撤销结构的过程中需要调用其它的需要较长时间的函数,或者函数也可能要获取同样地互斥锁,这样做就很有用了。但要注意在release
函数中做完撤销工作会使代码看起来更整洁。