Fork函数理解.docx

上传人:b****8 文档编号:9199262 上传时间:2023-02-03 格式:DOCX 页数:8 大小:74.77KB
下载 相关 举报
Fork函数理解.docx_第1页
第1页 / 共8页
Fork函数理解.docx_第2页
第2页 / 共8页
Fork函数理解.docx_第3页
第3页 / 共8页
Fork函数理解.docx_第4页
第4页 / 共8页
Fork函数理解.docx_第5页
第5页 / 共8页
点击查看更多>>
下载资源
资源描述

Fork函数理解.docx

《Fork函数理解.docx》由会员分享,可在线阅读,更多相关《Fork函数理解.docx(8页珍藏版)》请在冰豆网上搜索。

Fork函数理解.docx

Fork函数理解

Fork函数理解

对于刚刚接触Unix/Linux操作系统,在Linux下编写多进程的人来说,fork是最难理解的概念之一:

它执行一次却返回两个值。

  首先我们来看下fork函数的原型:

  #include

  #include

  pid_tfork(void);

  返回值:

  负数:

如果出错,则fork()返回-1,此时没有创建新的进程。

最初的进程仍然运行。

  零:

在子进程中,fork()返回0

  正数:

在负进程中,fork()返回正的子进程的PID

  其次我们来看下如何利用fork创建子进程。

  创建子进程的样板代码如下所示:

  pid_tchild;

  if((child=fork())<0)

  /*错误处理*/

  elseif(child==0)

  /*这是新进程*/

  else

  /*这是最初的父进程*/

  fock函数调用一次却返回两次;向父进程返回子进程的ID,向子进程中返回0,

  这是因为父进程可能存在很多过子进程,所以必须通过这个返回的子进程ID来跟踪子进程,

  而子进程只有一个父进程,他的ID可以通过getppid取得。

  下面我们来对比一下两个例子:

  第一个:

  #include

  #include

  intmain()

  {

  pid_tpid;

  intcount=0;

  pid=fork();

  printf("Thisisfirsttime,pid=%d\n",pid);

  printf("ThisissecONdtime,pid=%d\n",pid);

  count++;

  printf("count=%d\n",count);

  if(pid>0)

  {

  printf("Thisistheparentprocess,thechildhasthepid:

%d\n",pid);

  }

  elseif(!

pid)

  {

  printf("ThisisthechildProcess.\n")

  }

  else

  {

  printf("forkfailed.\n");

  }

  printf("Thisisthirdtime,pid=%d\n",pid);

  printf("Thisisfouthtime,pid=%d\n",pid);

  return0;

  }

  运行结果如下:

  问题:

  这个结果很奇怪了,为什么printf的语句执行两次,而那句“count++;”的语句却只执行了一次

  接着看:

  #include

  #include

  intmain(void)

  {

  pid_tpid;

  intcount=0;

  pid=fork();

  printf("Now,thepidreturnedbycallingfork()is%d\n",pid);

  if(pid>0)

  {

  printf("ThisistheparentprocESS,thechildhasthepid:

%d\n",pid);

  printf("Intheparentprocess,count=%d\n",count);

  }

  elseif(!

pid)

  {

  printf("Thisisthechildprocess.\n");

  printf("Doyourownthingshere.\n");

  count++;

  printf("Inthechildprocess,count=%d\n",count);

  }

  else

  {

  printf("forkfailed.\n");

  }

  return0;

  }

  运行结果如下:

  现在来解释上面提出的问题。

  看这个程序的时候,头脑中必须首先了解一个概念:

在语句pid=fork()之前,只有一个进程在执行这段代码,但在这条语句之后,就变成两个进程在执行了,这两个进程的代码部分完全相同,将要执行的下一条语句都是if(pid>0)……。

  两个进程中,原先就存在的那个被称作“父进程”,新出现的那个被称作“子进程”。

父子进程的区别除了进程标志符(processID)不同外,变量pid的值也不相同,pid存放的是fork的返回值。

fork调用的一个奇妙之处就是它仅仅被调用一次,却能够返回两次,它可能有三种不同的返回值:

  1.在父进程中,fork返回新创建子进程的进程ID;

  2.在子进程中,fork返回0;

  3.如果出现错误,fork返回一个负值;

  fork出错可能有两种原因:

(1)当前的进程数已经达到了系统规定的上限,这时errno的值被设置为EAGAIN。

(2)系统内存不足,这时errno的值被设置为ENOMEM。

  接下来我们来看看APUE2中对fork的说明:

  Thenewprocesscreatedbyforkiscalledthechildprocess.Thisfunctioniscalledoncebutreturnstwice.Theonlydifferenceinthereturnsisthatthereturnvalueinthechildis0,whereasthereturnvalueintheparentistheprocessIDofthenewchild.Thereasonthechild'sprocessIDisreturnedtotheparentisthataprocesscanhavemorethanonechild,andthereisnofunctionthatallowsaprocesstoo^aintheprocessIDsofitschildren.Thereasonforkreturns0tothechildisthataprocesscanhaveonlyasingleparent,andthechildcanalwayscallgetppidtoo^aintheprocessIDofitsparent.(ProcessID0isreservedforusebythekernel,soit'snotpossiblefor0tobetheprocessIDofachild.)

  被fork创建的新进程叫做自进程。

fork函数被调用一次,却两次返回。

返回值唯一的区别是在子进程中返回0,而在父进程中返回子进程的pid。

在父进程中要返回子进程的pid的原因是父进程可能有不止一个子进程,而一个进程又没有任何函数可以得到他的子进程的pid。

  Boththechildandtheparentcontinueexecutingwiththeinstructionthatfollowsthecalltofork.Thechildisacopyoftheparent.Forexample,thechildgetsacopyoftheparent'sdataspace,heap,andstack.Notethatthisisacopyforthechild;theparentandthechilddonotsharetheseportionsofmemory.Theparentandthechildsharethetextsegment(Section7.6).

  子进程和父进程都执行在fork函数调用之后的代码,子进程是父进程的一个拷贝。

例如,父进程的数据空间、堆栈空间都会给子进程一个拷贝,而不是共享这些内存。

  Currentimplementationsdon'tperform.acompletecopyoftheparent'sdata,stack,andheap,sinceaforkisoftenfollowedbyanexec.Instead,atechniquecalledcopy-on-write(COW)isused.Theseregionsaresharedbytheparentandthechildandhavetheirprotectionchangedbythekerneltoread-only.Ifeitherprocesstriestomodifytheseregions,thekernelthenmakesacopyofthatpieceofmemoryonly,typicallya"page"inavirtualmemorysystem.Section9.2ofBach[1986]andSections5.6and5.7ofMcKusicketal.[1996]providemoredetailonthisfeature.

  我们来给出详细的注释

  #include

  #include

  intmain(void)

  {

  pid_tpid;

  intcount=0;

  /*此处,执行fork调用,创建了一个新的进程,这个进程共享父进程的数据和堆栈空间等,这之后的代码指令为子进程创建了一个拷贝。

fock调用是一个复制进程,fock不象线程需提供一个函数做为入口,fock调用后,新进程的入口就在fock的下一条语句。

*/

  pid=fork();

  /*此处的pid的值,可以说明fork调用后,目前执行的是父进程还是子进程*/

  printf("Now,thepidreturnedbycallingfork()is%d\n",pid);

  if(pid>0)

  {

  /*当fork在子进程中返回后,fork调用又向父进程中返回子进程的pid,如是该段代码被执行,但是注意的事,count仍然为0,因为父进程中的count始终没有被重新赋值,这里就可以看出子进程的数据和堆栈空间和父进程是独立的,而不是共享数据*/

  printf("Thisistheparentprocess,thechildhasthepid:

%d\n",pid);

  printf("Intheparentprocess,count=%d\n",count);

  }

  elseif(!

pid)

  {/*在子进程中对count进行自加1的操作,但是并没有影响到父进程中的count值,父进程中的count值仍然为0*/

  printf("Thisisthechildprocess.\n");

  printf("Doyourownthingshere.\n");

  count++;

  printf("Inthechildprocess,count=%d\n",count);

  }

  else

  {

  printf("forkfailed.\n");

  }

  return0;

  }

  也就是说,在Linux下一个进程在内存里有三部分的数据,就是"代码段"、"堆栈段"和"数据段"。

"代码段",顾名思义,就是存放了程序代码的数据,假如机器中有数个进程运行相同的一个程序,那么它们就可以使用相同的代码段。

"堆栈段"存放的就是子程序的返回地址、子程序的参数以及程序的局部变量。

而数据段则存放程序的全局变量,常数以及动态数据分配的数据空间(比如用malloc之类的函数取得的空间)。

系统如果同时运行数个相同的程序,它们之间就不能使用同一个堆栈段和数据段。

  仔细分析后,我们就可以知道:

  一个程序一旦调用fork函数,系统就为一个新的进程准备了前述三个段,首先,系统让新的进程与旧的进程使用同一个代码段,因为它们的程序还是相同的,对于数据段和堆栈段,系统则复制一份给新的进程,这样,父进程的所有数据都可以留给子进程,但是,子进程一旦开始运行,虽然它继承了父进程的一切数据,但实际上数据却已经分开,相互之间不再有影响了,也就是说,它们之间不再共享任何数据了。

  fork()不仅创建出与父进程代码相同的子进程,而且父进程在fork执行点的所有上下文场景也被自动复制到子进程中,包括:

  ——全局和局部变量

  ——打开的文件句柄

  ——共享内存、消息等同步对象

  而如果两个进程要共享什么数据的话,就要使用另一套函数(shmget,shmat,shmdt等)来操作。

现在,已经是两个进程了,对于父进程,fork函数返回了子程序的进程号,而对于子程序,fork函数则返回零,这样,对于程序,只要判断fork函数的返回值,就知道自己是处于父进程还是子进程中。

  “本文由华清远见http:

//www.embedu.org/index.htm提供”

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 初中教育 > 其它课程

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1