linux多线程和多进程.docx
《linux多线程和多进程.docx》由会员分享,可在线阅读,更多相关《linux多线程和多进程.docx(30页珍藏版)》请在冰豆网上搜索。
linux多线程和多进程
linux下多进程、多线程编程
linux下进程
(一)理解Linux下进程的结构
Linux下一个进程在内存里有三部份的数据,就是“数据段”,“堆栈段”和“代码段”,其实学过汇编语言的人一定知道,一般的CPU像I386,都有上述三种段寄存器,以方便操作系统的运行。
“代码段”,顾名思义,就是存放了程序代码的数据,假如机器中有数个进程运行相同的一个程序,那么它们就可以使用同一个代码段。
堆栈段存放的就是子程序的返回地址、子程序的参数以及程序的局部变量。
而数据段则存放程序的全局变量,常数以及动态数据分配的数据空间(比如用malloc之类的函数取得的空间)。
这其中有许多细节问题,这里限于篇幅就不多介绍了。
系统如果同时运行数个相同的程序,它们之间就不能使用同一个堆栈段和数据段。
(二)如何使用fork
在Linux下产生新的进程的系统调用就是fork函数,这个函数名是英文中“分叉”的意思。
为什么取这个名字呢?
因为一个进程在运行中,如果使用了fork,就产生了另一个进程,于是进程就“分叉”了,所以这个名字取得很形象。
下面就看看如何具体使用fork,这段程序演示了使用fork的基本框架:
voidmain()
{
inti;
if(fork()==0)
{/*子进程程序*/
for(i=1;i");
fgets(command,256,stdin);
command[strlen(command)-1]=0;
if(fork()==0)
{/*子进程执行此命令*/
execlp(command,command);
/*如果exec函数返回,表明没有正常执行命令,打印错误信息*/
perror(command);
exit(errorno);
}
else
{/*父进程,等待子进程结束,并打印子进程的返回值*/
wait(&rtn);
printf("childprocessreturn%d\n",.rtn);
}
}
}
此程序从终端读入命令并执行之,执行完成后,父进程继续等待从终端读入命令。
熟悉DOS和WINDOWS系统调用的朋友一定知道DOS/WINDOWS也有exec类函数,其使用方法是类似的,但DOS/WINDOWS还有spawn类函数,因为DOS是单任务的系统,它只能将“父进程”驻留在机器内再执行“子进程”,这就是spawn类的函数。
WIN32已经是多任务的系统了,但还保留了spawn类函数,WIN32中实现spawn函数的方法同前述UNIX中的方法差不多,开设子进程后父进程等待子进程结束后才继续运行。
UNIX在其一开始就是多任务的系统,所以从核心角度上讲不需要spawn类函数。
另外,有一个更简单的执行其它程序的函数system,它是一个较高层的函数,实际上相当于在SHELL环境下执行一条命令,而exec类函数则是低层的系统调用。
(四)Linux的进程与Win32的进程/线程有何区别
熟悉WIN32编程的人一定知道,WIN32的进程管理方式与UNIX上有着很大区别,在UNIX里,只有进程的概念,但在WIN32里却还有一个“线程”的概念,那么UNIX和WIN32在这里究竟有着什么区别呢?
UNIX里的fork是七十年代UNIX早期的开发者经过长期在理论和实践上的艰苦探索后取得的成果,一方面,它使操作系统在进程管理上付出了最小的代价,另一方面,又为程序员提供了一个简洁明了的多进程方法。
WIN32里的进程/线程是继承自OS/2的。
在WIN32里,“进程”是指一个程序,而“线程”是一个“进程”里的一个执行“线索”。
从核心上讲,WIN32的多进程与UNIX并无多大的区别,在WIN32里的线程才相当于UNIX的进程,是一个实际正在执行的代码。
但是,WIN32里同一个进程里各个线程之间是共享数据段的。
这才是与UNIX的进程最大的不同。
下面这段程序显示了WIN32下一个进程如何启动一个线程:
(请注意,这是个终端方式程序,没有图形界面)
intg;
DWORDWINAPIChildProcess(LPVOIDlpParameter){
inti;
for(i=1;i
pthread解读
Posix线程编程指南
(1)
内容:
一、线程创建
二、线程取消
线程创建与取消
这是一个关于Posix线程编程的专栏。
作者在阐明概念的基础上,将向您详细讲述Posix线程库API。
本文是第一篇将向您讲述线程的创建与取消。
一、线程创建
1.1线程与进程
相对进程而言,线程是一个更加接近于执行体的概念,它可以与同进程中的其他线程共享数据,但拥有自己的栈空间,拥有独立的执行序列。
在串行程序基础上引入线程和进程是为了提高程序的并发度,从而提高程序运行效率和响应时间。
线程和进程在使用上各有优缺点:
线程执行开销小,但不利于资源的管理和保护;而进程正相反。
同时,线程适合于在SMP机器上运行,而进程则可以跨机器迁移。
1.2创建线程
POSIX通过pthread_create()函数创建线程,API定义如下:
intpthread_create(pthread_t*thread,pthread_attr_t*attr,void*(*start_routine)(void*),void*arg)
与fork()调用创建一个进程的方法不同,pthread_create()创建的线程并不具备与主线程(即调用pthread_create()的线程)同样的执行序列,而是使其运行start_routine(arg)函数。
thread返回创建的线程ID,而attr是创建线程时设置的线程属性(见下)。
pthread_create()的返回值表示线程创建是否成功。
尽管arg是void*类型的变量,但它同样可以作为任意类型的参数传给start_routine()函数;同时,start_routine()可以返回一个void*类型的返回值,而这个返回值也可以是其他类型,并由pthread_join()获取。
1.3线程创建属性
pthread_create()中的attr参数是一个结构指针,结构中的元素分别对应着新线程的运行属性,主要包括以下几项:
__detachstate,表示新线程是否与进程中其他线程脱离同步,如果置位则新线程不能用pthread_join()来同步,且在退出时自行释放所占用的资源。
缺省为PTHREAD_CREATE_JOINABLE状态。
这个属性也可以在线程创建并运行以后用pthread_detach()来设置,而一旦设置为PTHREAD_CREATE_DETACH状态(不论是创建时设置还是运行时设置)则不能再恢复到PTHREAD_CREATE_JOINABLE状态。
__schedpolicy,表示新线程的调度策略,主要包括SCHED_OTHER(正常、非实时)、SCHED_RR(实时、轮转法)和SCHED_FIFO(实时、先入先出)三种,缺省为SCHED_OTHER,后两种调度策略仅对超级用户有效。
运行时可以用过pthread_setschedparam()来改变。
__schedparam,一个structsched_param结构,目前仅有一个sched_priority整型变量表示线程的运行优先级。
这个参数仅当调度策略为实时(即SCHED_RR或SCHED_FIFO)时才有效,并可以在运行时通过pthread_setschedparam()函数来改变,缺省为0。
__inheritsched,有两种值可供选择:
PTHREAD_EXPLICIT_SCHED和PTHREAD_INHERIT_SCHED,前者表示新线程使用显式指定调度策略和调度参数(即attr中的值),而后者表示继承调用者线程的值。
缺省为PTHREAD_EXPLICIT_SCHED。
__scope,表示线程间竞争CPU的范围,也就是说线程优先级的有效范围。
POSIX的标准中定义了两个值:
PTHREAD_SCOPE_SYSTEM和PTHREAD_SCOPE_PROCESS,前者表示与系统中所有线程一起竞争CPU时间,后者表示仅与同进程中的线程竞争CPU。
目前LinuxThreads仅实现了PTHREAD_SCOPE_SYSTEM一值。
pthread_attr_t结构中还有一些值,但不使用pthread_create()来设置。
为了设置这些属性,POSIX定义了一系列属性设置函数,包括pthread_attr_init()、pthread_attr_destroy()和与各个属性相关的pthread_attr_get---/pthread_at
tr_set---函数。
1.4线程创建的Linux实现
我们知道,Linux的线程实现是在核外进行的,核内提供的是创建进程的接口do_fork()。
内核提供了两个系统调用__clone()和fork(),最终都用不同的参数调用do_fork()核内API。
当然,要想实现线程,没有核心对多进程(其实是轻量级进程)共享数据段的支持是不行的,因此,do_fork()提供了很多参数,包括CLONE_VM(共享内存空间)、CLONE_FS(共享文件系统信息)、CLONE_FILES(共享文件描述符表)、CLONE_SIGHAND(共享信号句柄表)和CLONE_PID(共享进程ID,仅对核内进程,即0号进程有效)。
当使用fork系统调用时,内核调用do_fork()不使用任何共享属性,进程拥有独立的运行环境,而使用pthread_create()来创建线程时,则最终设置了所有这些属性来调用__clone(),而这些参数又全部传给核内的do_fork(),从而创建的"进程"拥有共享的运行环境,只有栈是独立的,由__clone()传入。
Linux线程在核内是以轻量级进程的形式存在的,拥有独立的进程表项,而所有的创建、同步、删除等操作都在核外pthread库中进行。
pthread库使用一个管理线程(__pthread_manager(),每个进程独立且唯一)来管理线程的创建和终止,为线程分配线程ID,发送线程相关的信号(比如Cancel),而主线程(pthread_create())的调用者则通过管道将请求信息传给管理线程。
二、线程取消
2.1线程取消的定义
一般情况下,线程在其主体函数退出的时候会自动终止,但同时也可以因为接收到另一个线程发来的终止(取消)请求而强制终止。
2.2线程取消的语义
线程取消的方法是向目标线程发Cancel信号,但如何处理Cancel信号则由目标线程自己决定,或者忽略、或者立即终止、或者继续运行至Cancelation-point(取消点),由不同的Cancelation状态决定。
线程接收到CANCEL信号的缺省处理(即pthread_create()创建线程的缺省状态)是继续运行至取消点,也就是说设置一个CANCELED状态,线程继续运行,只有运行至Cancelation-point的时候才会退出。
2.3取消点
根据POSIX标准,pthread_join()、pthread_testcancel()、pthread_cond_wait()、pthread_cond_timedwait()、sem_wait()、sigwait()等函数以及read()、write()等会引起阻塞的系统调用都是Cancelation-point,而其他pthread函数都不会引起Cancelation动作。
但是pthread_cancel的手册页声称,由于LinuxThread库与C库结合得不好,因而目前C库函数都不是Cancelation-point;但CANCEL信号会使线程从阻塞的系统调用中退出,并置EINTR错误码,因此可以在需要作为Cancelation-point的系统调用前后调用pthread_testcancel(),从而达到POSIX标准所要求的目标,即如下代码段:
pthread_testcancel();
retcode=read(fd,buffer,length);
pthread_testcancel();
2.4程序设计方面的考虑
如果线程处于无限循环中,且循环体内没有执行至取消点的必然路径,则线程无法由外部其他线程的取消请求而终止。
因此在这样的循环体的必经路径上应该加入pthread_testcancel()调用。
2.5与线程取消相关的pthread函数
intpthread_cancel(pthread_tthread)
发送终止信号给thread线程,如果成功则返回0,否则为非0值。
发送成功并不意味着thread会终止。
intpthread_setcancelstate(intstate,int*oldstate)
设置本线程对Cancel信号的反应,state有两种值:
PTHREAD_CANCEL_ENABLE(缺省)和PTHREAD_CANCEL_DISABLE,分别表示收到信号后设为CANCLED状态和忽略CANCEL信号继续运行;old_state如果不为NULL则存入原来的Cancel状态以便恢复。
intpthread_setcanceltype(inttype,int*oldtype)
设置本线程取消动作的执行时机,type由两种取值:
PTHREAD_CANCEL_DEFFERED和PTHREAD_CANCEL_ASYCHRONOUS,仅当Cancel状态为Enable时有效,分别表示收到信号后继续运行至下一个取消点再退出和立即执行取消动作(退出);oldtype如果不为NULL则存入运来的取消动作类型值。
voidpthread_testcancel(void)
检查本线程是否处于Canceld状态,如果是,则进行取消动作,否则直接返回。
posix线程编程指南
(2)
内容:
一.概念及作用
二.创建和注销
三.访问
四.使用范例
关于作者
相关内容:
(1)线程创建与取消
线程私有数据
这是一个关于Posix线程编程的专栏。
作者在阐明概念的基础上,将向您详细讲述Posix线程库API。
本文是第二篇将向您讲述线程的私有数据。
一.概念及作用
在单线程程序中,我们经常要用到"全局变量"以实现多个函数间共享数据。
在多线程环境下,由于数据空间是共享的,因此全局变量也为所有线程所共有。
但有时应用程序设计中有必要提供线程私有的全局变量,仅在某个线程中有效,但却可以跨多个函数访问,比如程序可能需要每个线程维护一个链表,而使用相同的函数操作,最简单的办法就是使用同名而不同变量地址的线程相关数据结构。
这样的数据结构可以由Posix线程库维护,称为线程私有数据(Thread-specificData,或TSD)。
二.创建和注销
Posix定义了两个API分别用来创建和注销TSD:
intpthread_key_create(pthread_key_t*key,void(*destr_function)(void*))
该函数从TSD池中分配一项,将其值赋给key供以后访问使用。
如果destr_function不为空,在线程退出(pthread_exit())时将以key所关联的数据为参数调用destr_function(),以释放分配的缓冲区。
不论哪个线程调用pthread_key_create(),所创建的key都是所有线程可访问的,但各个线程可根据自己的需要往key中填入不同的值,这就相当于提供了一个同名而不同值的全局变量。
在LinuxThreads的实现中,TSD池用一个结构数组表示:
staticstructpthread_key_structpthread_keys[PTHREAD_KEYS_MAX]={{0,NULL}};
创建一个TSD就相当于将结构数组中的某一项设置为"in_use",并将其索引返回给*key,然后设置destructor函数为destr_function。
注销一个TSD采用如下API:
intpthread_key_delete(pthread_key_tkey)
这个函数并不检查当前是否有线程正使用该TSD,也不会调用清理函数(destr_function),而只是将TSD释放以供下一次调用pthread_key_create()使用。
在LinuxThreads中,它还会将与之相关的线程数据项设为NULL(见"访问")。
三.访问
TSD的读写都通过专门的PosixThread函数进行,其API定义如下:
intpthread_setspecific(pthread_key_tkey,constvoid*pointer)
void*pthread_getspecific(pthread_key_tkey)
写入(pthread_setspecific())时,将pointer的值(不是所指的内容)与key相关联,而相应的读出函数则将与key相关联的数据读出来。
数据类型都设为void
*,因此可以指向任何类型的数据。
在LinuxThreads中,使用了一个位于线程描述结构(_pthread_descr_struct)中的二维void*指针数组来存放与key关联的数据,数组大小由以下几个宏来说明:
#definePTHREAD_KEY_2NDLEVEL_SIZE32
#definePTHREAD_KEY_1STLEVEL_SIZE\
((PTHREAD_KEYS_MAX+PTHREAD_KEY_2NDLEVEL_SIZE-1)
/PTHREAD_KEY_2NDLEVEL_SIZE)
其中在/usr/include/bits/local_lim.h中定义了PTHREAD_KEYS_MAX为1024,因此一维数组大小为32。
而具体存放的位置由key值经过以下计算得到:
idx1st=key/PTHREAD_KEY_2NDLEVEL_SIZE
idx2nd=key%PTHREAD_KEY_2NDLEVEL_SIZE
也就是说,数据存放与一个32×32的稀疏矩阵中。
同样,访问的时候也由key值经过类似计算得到数据所在位置索引,再取出其中内容返回。
四.使用范例
以下这个例子没有什么实际意义,只是说明如何使用,以及能够使用这一机制达到存储线程私有数据的目的。
#include
#include
pthread_key_tkey;
voidechomsg(intt)
{
printf("destructorexcutedinthread%d,param=%d\n",pthread_self(),t);
}
void*child1(void*arg)
{
inttid=pthread_self();
printf("thread%denter\n",tid);
pthread_setspecific(key,(void*)tid);
sleep
(2);
printf("thread%dreturns%d\n",tid,pthread_getspecific(key));
sleep(5);
}
void*child2(void*arg)
{
inttid=pthread_self();
printf("thread%denter\n",tid);
pthread_setspecific(key,(void*)tid);
sleep
(1);
printf("thread%dreturns%d\n",tid,pthread_getspecific(key));
sleep(5);
}
intmain(void)
{
inttid1,tid2;
printf("hello\n");
pthread_key_create(&key,echomsg);
pthread_create(&tid1,NULL,child1,NULL);
pthread_create(&tid2,NULL,child2,NULL);
sleep(10);
pthread_key_delete(key);
printf("mainthreadexit\n");
return0;
}
给例程创建两个线程分别设置同一个线程私有数据为自己的线程ID,为了检验其私有性,程序错开了两个线程私有数据的写入和读出的时间,从程序运行结果可以看
出,两个线程对TSD的修改互不干扰。
同时,当线程退出时,清理函数会自动执行,参数为tid。
Posix线程编程指南(3)
内容:
一.互斥锁
二.条件变量
三.信号灯
四.异步信号
五.其他同步方式
相关内容:
(1)线程创建与取消
(2)线程私有数据
线程同步
这是一个关于Posix线程编程的专栏。
作者在阐明概念的基础上,将向您详细讲述Posix线程库API。
本文是第三篇将向您讲述线程同步。
一.互斥锁
尽管在PosixThread中同样可以使用IPC的信号量机制来实现互斥锁mutex功能,但显然semphore的功能过于强大了,在Posix
Thread中定义了另外一套专门用于线程同步的mutex函数。
1.创建和销毁
有两种方法创建互斥锁,静态方式和动态方式。
POSIX定义了一个宏PTHREAD_MUTEX_INITIALIZER来静态初始化互斥锁,方法如下:
pthread_mutex_tmutex=PTHREAD_MUTEX_INITIALIZER;
在LinuxThreads实现中,pthread_mutex_t是一个结构,而PTHREAD_MUTEX_INITIALIZER则是一个结构常量。
动态方式是采用pthread_mutex_init()函数来初始化互斥锁,API定义如下:
intpthread_mutex_init(pthread_mutex_t*mutex,constpthread_mutexattr_t*mutexattr)
其中mutexattr用于指定互斥锁属性(见下),如果为NULL则使用缺省属性。
pthread_mutex_destroy()用于注销一个互斥锁,API定义如下:
intpthread_mutex_destroy(pthread_mutex_t*mutex)
销毁一个互斥锁即意味着释放它所占用的资源,且要求锁当前处于开放状态。
由于在Linux中,互斥锁并不占用任何资源,因此LinuxThreads中的pthread_mutex_des
troy()除了检查锁状态以外(锁定状态则返回EBUSY)没有其他动作。
2.互斥锁属性
互斥锁的属性在创建锁的时候指定,在LinuxThreads实现中仅有一个锁类型属性,不同的锁类型在试图对一个已经被锁定的互斥锁加锁时表现不同。
当前(glibc2.2
.3,linuxthreads0.9)有四个值可供选择:
PTHREAD_MUTEX_TIMED_NP,这是缺省值,也就是普通锁。
当一个线程加锁以后,其余请求锁的线程将形成一个等待队列,并在解锁后按优先级获得锁。
这种锁策略保
证了资源分配的公平性。
PTHREAD_MUTEX_RECURSIVE_NP,嵌套锁,允许同一个线程对同一个锁成功获得多次,并通过多次unlock解锁。
如果