Linux 行程

進程是所有操作系統的核心概念,同樣在linux上也不例外。

###主要內容:

進程和線程
進程的生命週期
進程的創建
進程的終止

1. 進程和線程

進程和線程是程序運行時狀態,是動態變化的,進程和線程的管理操作(比如,創建,銷燬等)都是有內核來實現的。

Linux中的進程於Windows相比是很輕量級的,而且不嚴格區分進程和線程,線程不過是一種特殊的進程。

所以下面只討論進程,只有當線程與進程存在不一樣的地方時才提一下線程。

進程提供2種虛擬機制:虛擬處理器和虛擬內存

每個進程有獨立的虛擬處理器和虛擬內存,

每個線程有獨立的虛擬處理器,同一個進程內的線程有可能會共享虛擬內存。

內核中進程的信息主要保存在task_struct中(include/linux/sched.h)

進程標識PID和線程標識TID對於同一個進程或線程來說都是相等的。

Linux中可以用ps命令查看所有進程的信息:

ps -eo pid,tid,ppid,comm

2. 進程的生命週期

進程的各個狀態之間的轉化構成了進程的整個生命週期。

3. 進程的創建

Linux中創建進程與其他系統有個主要區別,Linux中創建進程分2步:fork()和exec()。

fork: 通過拷貝當前進程創建一個子進程

exec: 讀取可執行文件,將其載入到內存中運行

創建的流程:

  • 調用dup_task_struct()為新進程分配內核棧,task_struct等,其中的內容與父進程相同。
  • check新進程(進程數目是否超出上限等)
  • 清理新進程的信息(比如PID置0等),使之與父進程區別開。
  • 新進程狀態置為 TASK_UNINTERRUPTIBLE
  • 更新task_struct的flags成員。
  • 調用alloc_pid()為新進程分配一個有效的PID
  • 根據clone()的參數標誌,拷貝或共享相應的信息
  • 做一些掃尾工作並返回新進程指針

創建進程的fork()函數實際上最終是調用clone()函數。

創建線程和進程的步驟一樣,只是最終傳給clone()函數的參數不同。

比如,通過一個普通的fork來創建進程,相當於:clone(SIGCHLD, 0)

創建一個和父進程共享地址空間,文件系統資源,文件描述符和信號處理程序的進程,即一個線程:clone(CLONE_VM | CLONE_FS | CLONE_FILES | CLONE_SIGHAND, 0)

在內核中創建的內核線程與普通的進程之間還有個主要區別在於:內核線程沒有獨立的地址空間,它們只能在內核空間運行。

這與之前提到的Linux內核是個單內核有關。

4. 進程的終止

和創建進程一樣,終結一個進程同樣有很多步驟:

子進程上的操作(do_exit)

  • 設置task_struct中的標識成員設置為PF_EXITING
  • 調用del_timer_sync()刪除內核定時器, 確保沒有定時器在排隊和運行
  • 調用exit_mm()釋放進程佔用的mm_struct
  • 調用sem__exit(),使進程離開等待IPC信號的隊列
  • 調用exit_files()和exit_fs(),釋放進程佔用的文件描述符和文件系統資源
  • 把task_struct的exit_code設置為進程的返回值
  • 調用exit_notify()向父進程發送信號,並把自己的狀態設為EXIT_ZOMBIE
  • 切換到新進程繼續執行

子進程進入EXIT_ZOMBIE之後,雖然永遠不會被調度,關聯的資源也釋放掉了,但是它本身- 佔用的內存還沒有釋放, 比如創建時分配的內核棧,task_struct結構等。這些由父進程來釋放。

父進程上的操作(release_task)

父進程受到子進程發送的exit_notify()信號後,將該子進程的進程描述符和所有進程獨享的資源全部刪除。

從上面的步驟可以看出,必須要確保每個子進程都有父進程,如果父進程在子進程結束之前就已經結束了會怎麼樣呢?

子進程在調用exit_notify()時已經考慮到了這點。

如果子進程的父進程已經退出了,那麼子進程在退出時,exit_notify()函數會先調用forget_original_parent(),然後再調用find_new_reaper()來尋找新的父進程。

find_new_reaper()函數先在當前線程組中找一個線程作為父親,如果找不到,就讓init做父進程。(init進程是在linux啟動時就一直存在的)


书籍推荐