Linux设备驱动程序学习3并发和竞态.docx

资源描述

Linux设备驱动程序学习3并发和竞态.docx

《Linux设备驱动程序学习3并发和竞态.docx》由会员分享，可在线阅读，更多相关《Linux设备驱动程序学习3并发和竞态.docx（11页珍藏版）》请在冰豆网上搜索。

Linux设备驱动程序学习3并发和竞态.docx

Linux设备驱动程序学习3并发和竞态

Linux设备驱动程序学习（3）-并发和竞态

今天进入《Linux设备驱动程序（第3版）》第五章并发和竞态的学习。

对并发的管理是操作系统编程中核心的问题之一。

并发产生竞态，竞态导致共享数据的非法访问。

因为竞态是一种极端低可能性的事件，因此程序员往往会忽视竞态。

但是在计算机世界中，百万分之一的事件可能没几秒就会发生，而其结果是灾难性的。

一、并发及其管理

竞态通常是作为对资源的共享访问结果而产生的。

在设计自己的驱动程序时，第一个要记住的规则是：

只要可能，就应该避免资源的共享。

若没有并发访问，就不会有竞态。

这种思想的最明显的应用是避免使用全局变量。

但是，资源的共享是不可避免的，如硬件资源本质上就是共享、指针传递等等。

资源共享的硬性规则：

（1）在单个执行线程之外共享硬件或软件资源的任何时候，因为另外一个线程可能产生对该资源的不一致观察，因此必须显示地管理对该资源的访问。

--访问管理的常见技术成为“锁定”或者“互斥”：

确保一次只有一个执行线程可操作共享资源。

（2）当内核代码创建了一个可能和其他内核部分共享的对象时，该对象必须在还有其他组件引用自己时保持存在（并正确工作）。

对象尚不能正确工作时，不能将其对内核可用。

二、信号量和互斥体

一个信号量（semaphore:

旗语，信号灯）本质上是一个整数值，它和一对函数联合使用，这一对函数通常称为P和V。

希望进入临届区的进程将在相关信号量上调用P；如果信号量的值大于零，则该值会减小一，而进程可以继续。

相反，如果信号量的值为零（或更小），进程必须等待知道其他人释放该信号。

对信号量的解锁通过调用V完成；该函数增加信号量的值，并在必要时唤醒等待的进程。

当信号量用于互斥时（即避免多个进程同是在一个临界区运行），信号量的值应初始化为1。

这种信号量在任何给定时刻只能由单个进程或线程拥有。

在这种使用模式下，一个信号量有事也称为一个“互斥体（mutex）”,它是互斥（mutualexclusion）的简称。

Linux内核中几乎所有的信号量均用于互斥。

使用信号量，内核代码必须包含。

以下是信号量初始化的方法：

/*初始化函数*/

voidsema_init（structsemaphore*sem,intval）;

由于信号量通常被用于互斥模式。

所以以下是内核提供的一组辅助函数和宏：

/*方法一、声明+初始化宏*/

DECLARE_MUTEX（name）;

DECLARE_MUTEX_LOCKED（name）;

/*方法二、初始化函数*/

voidinit_MUTEX（structsemaphore*sem）;

voidinit_MUTEX_LOCKED（structsemaphore*sem）;

/*带有“_LOCKED”的是将信号量初始化为0，即锁定，允许任何线程访问时必须先解锁。

没带的为1。

P函数为：

voiddown（structsemaphore*sem）;/*不推荐使用，会建立不可杀进程*/

intdown_interruptible（structsemaphore*sem）;/*推荐使用，使用down_interruptible需要格外小心，若操作被中断，该函数会返回非零值，而调用这不会拥有该信号量。

对down_interruptible的正确使用需要始终检查返回值，并做出相应的响应。

intdown_trylock（structsemaphore*sem）;/*带有“_trylock”的永不休眠，若信号量在调用是不可获得，会返回非零值。

V函数为：

voidup（structsemaphore*sem）;/*任何拿到信号量的线程都必须通过一次（只有一次）对up的调用而释放该信号量。

在出错时，要特别小心；若在拥有一个信号量时发生错误，必须在将错误状态返回前释放信号量。

在scull中使用信号量

其实在之前的实验中已经用到了信号量的代码，在这里提一下应该注意的地方：

在初始化scull_dev的地方：

/*Initializeeachdevice.*/

for（i=0;i scull_nr_devs;i++）{

scull_devices.quantum=scull_quantum;

scull_devices.qset=scull_qset;

init_MUTEX（&scull_devices.sem）;/*注意顺序：

先初始化好互斥信号量，再使scull_devices可用。

scull_setup_cdev（&scull_devices,i）;

}

而且要确保在不拥有信号量的时候不会访问scull_dev结构体。

读取者/写入者信号量

只读任务可并行完成它们的工作，而不需要等待其他读取者退出临界区。

Linux内核提供了读取者/写入者信号量“rwsem”，使用是必须包括。

初始化：

voidinit_rwsem（structrw_semaphore*sem）;

只读接口：

voiddown_read（structrw_semaphore*sem）;

intdown_read_trylock（structrw_semaphore*sem）;

voidup_read（structrw_semaphore*sem）;

写入接口：

voiddown_write（structrw_semaphore*sem）;

intdown_write_trylock（structrw_semaphore*sem）;

voidup_write（structrw_semaphore*sem）;

voiddowngrade_write（structrw_semaphore*sem）;/*该函数用于把写者降级为读者，这有时是必要的。

因为写者是排他性的，因此在写者保持读写信号量期间，任何读者或写者都将无法访问该读写信号量保护的共享资源，对于那些当前条件下不需要写访问的写者，降级为读者将，使得等待访问的读者能够立刻访问，从而增加了并发性，提高了效率。

一个rwsem允许一个写者或无限多个读者来拥有该信号量.写者有优先权;当某个写者试图进入临界区,就不会允许读者进入直到写者完成了它的工作.如果有大量的写者竞争该信号量，则这个实现可能导致读者“饿死”，即可能会长期拒绝读者访问。

因此,rwsem最好用在很少请求写的时候,并且写者只占用短时间.

completion

completion是一种轻量级的机制，它允许一个线程告诉另一个线程某个工作已经完成。

代码必须包含。

使用的代码如下：

DECLARE_COMPLETION（my_completion）;/*创建completion（声明+初始化）*/

/////////////////////////////////////////////////////////

structcompletionmy_completion;/*动态声明completion结构体*/

staticinlinevoidinit_completion（&my_completion）;/*动态初始化completion*/

///////////////////////////////////////////////////////

voidwait_for_completion（structcompletion*c）;/*等待completion*/

voidcomplete（structcompletion*c）;/*唤醒一个等待completion的线程*/

voidcomplete_all（structcompletion*c）;/*唤醒所有等待completion的线程*/

/*如果未使用completion_all，completion可重复使用；否则必须使用以下函数重新初始化completion*/

INIT_COMPLETION（structcompletionc）;/*快速重新初始化completion*/

completion的典型应用是模块退出时的内核线程终止。

在这种远行中，某些驱动程序的内部工作有一个内核线程在while

（1）循环中完成。

当内核准备清楚该模块时，exit函数会告诉该线程退出并等待completion。

为此内核包含了用于这种线程的一个特殊函数：

voidcomplete_and_exit（structcompletion*c,longretval）;

三、自旋锁

其实上面介绍的几种信号量和互斥机制，其底层源码都是使用自旋锁,可以理解为自旋锁的再包装。

所以从这里就可以理解为什么自旋锁通常可以提供比信号量更高的性能。

自旋锁是一个互斥设备，他只能会两个值：

“锁定”和“解锁”。

它通常实现为某个整数之中的单个位。

“测试并设置”的操作必须以原子方式完成。

任何时候，只要内核代码拥有自旋锁，在相关CPU上的抢占就会被禁止。

适用于自旋锁的核心规则：

（1）任何拥有自旋锁的代码都必须使原子的，除服务中断外（某些情况下也不能放弃CPU,如中断服务也要获得自旋锁。

为了避免这种锁陷阱，需要在拥有自旋锁时禁止中断），不能放弃CPU（如休眠，休眠可发生在许多无法预期的地方）。

否则CPU将有可能永远自旋下去（死机）。

（2）拥有自旋锁的时间越短越好。

自旋锁原语所需包含的文件是,以下是自旋锁的内核API:

spinlock_tmy_lock=SPIN_LOCK_UNLOCKED;/*编译时初始化spinlock*/

voidspin_lock_init（spinlock_t*lock）;/*运行时初始化spinlock*/

/*所有spinlock等待本质上是不可中断的，一旦调用spin_lock，在获得锁之前一直处于自旋状态*/

voidspin_lock（spinlock_t*lock）;/*获得spinlock*/

voidspin_lock_irqsave（spinlock_t*lock,unsignedlongflags）;/*获得spinlock，禁止本地cpu中断，保存中断标志于flags*/

voidspin_lock_irq（spinlock_t*lock）;/*获得spinlock,禁止本地cpu中断*/

voidspin_lock_bh（spinlock_t*lock）/*获得spinlock,禁止软件中断，保持硬件中断打开*/

/*以下是对应的锁释放函数*/

voidspin_unlock（spinlock_t*lock）;

voidspin_unlock_irqrestore（spinlock_t*lock,unsignedlongflags）;

voidspin_unlock_irq（spinlock_t*lock）;

voidspin_unlock_bh（spinlock_t*lock）;

/*以下非阻塞自旋锁函数，成功获得，返回非零值；否则返回零*/

intspin_trylock（spinlock_t*lock）;

intspin_trylock_bh（spinlock_t*lock）;

/*新内核的包含了更多函数*/

读取者/写入者自旋锁:

rwlock_tmy_rwlock=RW_LOCK_UNLOCKED;/*编译时初始化*/

rwlock_tmy_rwlock;

rwlock_init（&my_rwlock）;/*运行时初始化*/

voidread_lock（rwlock_t*lock）;

voidread_lock_irqsave（rwlock_t*lock,unsignedlongflags）;

voidread_lock_irq（rwlock_t*lock）;

voidread_lock_bh（rwlock_t*lock）;

voidread_unlock（rwlock_t*lock）;

voidread_unlock_irqrestore（rwlock_t*lock,unsignedlongflags）;

voidread_unlock_irq（rwlock_t*lock）;

voidread_unlock_bh（rwlock_t*lock）;

/*新内核已经有了read_trylock*/

voidwrite_lock（rwlock_t*lock）;

voidwrite_lock_irqsave（rwlock_t*lock,unsignedlongflags）;

voidwrite_lock_irq（rwlock_t*lock）;

voidwrite_lock_bh（rwlock_t*lock）;

intwrite_trylock（rwlock_t*lock）;

voidwrite_unlock（rwlock_t*lock）;

voidwrite_unlock_irqrestore（rwlock_t*lock,unsignedlongflags）;

voidwrite_unlock_irq（rwlock_t*lock）;

voidwrite_unlock_bh（rwlock_t*lock）;

/*新内核的包含了更多函数*/

锁陷阱

锁定模式必须在一开始就安排好，否则其后的改进将会非常困难。

不明确规则：

如果某个获得锁的函数要调用其他同样试图获取这个锁的函数，代码就会锁死。

（不允许锁的拥有者第二次获得同个锁。

）为了锁的正确工作，不得不编写一些函数，这些函数假定调用这已经获得了相关的锁。

锁的顺序规则：

再必须获取多个锁时，应始终以相同顺序获取。

若必须获得一个局部锁和一个属于内核更中心位置的锁，应先获得局部锁。

若我们拥有信号量和自旋锁的组合，必须先获得信号量。

不得再拥有自旋锁时调用down。

（可导致休眠）

尽量避免需要多个锁的情况。

细颗粒度和粗颗粒度的对比：

应该在最初使用粗颗粒度的锁，除非有真正的原因相信竞争会导致问题。

四、锁之外的办法

（1）免锁算法

经常用于免锁的生产者/消费者任务的数据结构之一是循环缓冲区。

它在设备驱动程序中相当普遍，如以前移植的网卡驱动程序。

内核里有一个通用的循环缓冲区的实现在。

（2）原子变量

完整的锁机制对一个简单的整数来讲显得浪费。

内核提供了一种原子的整数类型，称为atomic_t，定义在。

原子变量操作是非常快的，因为它们在任何可能时编译成一条单个机器指令。

以下是其接口函数：

voidatomic_set（atomic_t*v,inti）;/*设置原子变量v为整数值i.*/

atomic_tv=ATOMIC_INIT（0）; /*编译时使用宏定义ATOMIC_INIT初始化原子值.*/

intatomic_read（atomic_t*v）;/*返回v的当前值.*/

voidatomic_add（inti,atomic_t*v）;/*由v指向的原子变量加i.返回值是void*/

voidatomic_sub（inti,atomic_t*v）;/*从*v减去i.*/

voidatomic_inc（atomic_t*v）;

voidatomic_dec（atomic_t*v）;/*递增或递减一个原子变量.*/

intatomic_inc_and_test（atomic_t*v）;

intatomic_dec_and_test（atomic_t*v）;

intatomic_sub_and_test（inti,atomic_t*v）;

/*进行一个特定的操作并且测试结果;如果,在操作后,原子值是0,那么返回值是真;否则,它是假.注意没有atomic_add_and_test.*/

intatomic_add_negative（inti,atomic_t*v）;

/*加整数变量i到v.如果结果是负值返回值是真,否则为假.*/

intatomic_add_return（inti,atomic_t*v）;

intatomic_sub_return（inti,atomic_t*v）;

intatomic_inc_return（atomic_t*v）;

intatomic_dec_return（atomic_t*v）;

/*像atomic_add和其类似函数,除了它们返回原子变量的新值给调用者.*/

atomic_t数据项必须通过这些函数存取。

如果你传递一个原子项给一个期望一个整数参数的函数，你会得到一个编译错误。

需要多个atomic_t变量的操作仍然需要某种其他种类的加锁。

（3）位操作

内核提供了一套函数来原子地修改或测试单个位。

原子位操作非常快,因为它们使用单个机器指令来进行操作,而在任何时候低层平台做的时候不用禁止中断.函数是体系依赖的并且在中声明.以下函数中的数据是体系依赖的.nr参数（描述要操作哪个位）在ARM体系中定义为unsignedint：

voidset_bit（nr,void*addr）;/*设置第nr位在addr指向的数据项中。

voidclear_bit（nr,void*addr）;/*清除指定位在addr处的无符号长型数据.*/

voidchange_bit（nr,void*addr）;/*翻转nr位.*/

test_bit（nr,void*addr）;/*这个函数是唯一一个不需要是原子的位操作;它简单地返回这个位的当前值.*/

/*以下原子操作如同前面列出的,除了它们还返回这个位以前的值.*/

inttest_and_set_bit（nr,void*addr）;

inttest_and_clear_bit（nr,void*addr）;

inttest_and_change_bit（nr,void*addr）;

以下是一个使用范例：

/*trytosetlock*/

while（test_and_set_bit（nr,addr）!

=0）

wait_for_a_while（）;

/*doyourwork*/

/*releaselock,andcheck.*/

if（test_and_clear_bit（nr,addr）==0）

something_went_wrong（）;/*alreadyreleased:

error*/

（4）seqlock

2.6内核包含了一对新机制打算来提供快速地，无锁地存取一个共享资源。

seqlock要保护的资源小，简单，并且常常被存取，并且很少写存取但是必须要快。

seqlock通常不能用在保护包含指针的数据结构。

seqlock定义在。

/*两种初始化方法*/

seqlock_tlock1=SEQLOCK_UNLOCKED;

seqlock_tlock2;

seqlock_init（&lock2）;

这个类型的锁常常用在保护某种简单计算,读存取通过在进入临界区入口获取一个（无符号的）整数序列来工作.在退出时,那个序列值与当前值比较;如果不匹配,读存取必须重试.读者代码形式:

unsignedintseq;

do{

seq=read_seqbegin（&the_lock）;

/*Dowhatyouneedtodo*/

}whileread_seqretry（&the_lock,seq）;

如果你的seqlock可能从一个中断处理里存取,你应当使用IRQ安全的版本来代替:

unsignedintread_seqbegin_irqsave（seqlock_t*lock,unsignedlongflags）;

intread_seqretry_irqrestore（seqlock_t*lock,unsignedintseq,unsignedlongflags）;

写者必须获取一个排他锁来进入由一个seqlock保护的临界区，写锁由一个自旋锁实现，调用:

voidwrite_seqlock（seqlock_t*lock）;

voidwrite_sequnlock（seqlock_t*lock）;

因为自旋锁用来控制写存取,所有通常的变体都可用:

voidwrite_seqlock_irqsave（seqlock_t*lock,unsignedlongflags）;

voidwrite_seqlock_irq（seqlock_t*lock）;

voidwrite_seqlock_bh（seqlock_t*lock）;

voidwrite_sequnlock_irqrestore（seqlock_t*lock,unsignedlongflags）;

voidwrite_sequnlock_irq（seqlock_t*lock）;

voidwrite_sequnlock_bh（seqlock_t*lock）;

还有一个write_tryseqlock在它能够获得锁时返回非零.

（5）读取-复制-更新

读取-拷贝-更新（RCU）是一个高级的互斥方法,在合适的情况下能够有高效率.它在驱动中的使用很少。

五、开发板实验

在我的SBC2440V4开发板上作completion的实验，因为别的实验都要在并发状态下才可以实验，所以本章的我只做了completion的实验。

我将《Linux设备驱动程序（第3版）》提供的源码做了修改，将原来的2.4内核的模块接口改成了2.6的接口，并编写了测试程序。

实验源码如下：

模块程序链接：

complete模块

模块测试程序链接：

测试程序

[Tekkaman2440@SBC2440V4]#cd/lib/modules/

[Tekkaman2440@SBC2440V4]#insmodcomplete.ko

[Tekkaman2440@SBC2440V4]#echo8>/proc/sys/kernel/printk

[Tekkaman2440@SBC2440V4]#cat/proc/devices

Characterdevices:

1mem

2pty

3ttyp

4/dev/vc/0

4tty

4ttyS

5/dev/tty

5/dev/console

5/dev/ptmx

7vcs

10misc

13input

14sound

81video4linux

8Arrayi2c

Array0mtd

116alsa

128ptm

展开阅读全文