技術文章:C語言協程的代碼細節

“協程”(coroutine),就是把Linux epoll異步IO機制通過長跳轉(long jmp)封裝起來,形成一個在用戶看來“連續的”流程。

所有操作系統的異步IO,都分為啟動函數回調函數

Linux為例,啟動函數負責往epoll框架里添加讀寫事件。

事件觸發之後,再通過回調函數去進行下半部的處理。

整個事件處理過程,與Linux內核里的中斷處理差不多。

一個完整的IO流程需要回調好幾次,而且讀代碼時到處查找回調函數哪裡設置的

甚至,有的程序員中途修改回調函數的指針[捂臉]

C的函數指針比C++的虛函數“靈活”的地方是,C++的虛函數表在編譯時固定了,但C的函數指針可以在運行時修改(它就是個普通變量)。

然後,就真有人半截里修改它,讓代碼的可讀性急劇下降。

再然後,就出現了coroutine,看上去至少是同步的了。

程序流程在一個函數里跳轉,就是普通的goto語句

程序流程在2個函數的半截里跳轉,就是長跳轉(long jmp)。

協程的原理如下:

1,當某個文件描述符需要IO等待的時候,通過長跳轉回到epoll的主框架函數,讓其他的IO可以運行。

2,當這個文件描述符的IO再次就緒之後,再通過長跳轉從主框架函數跳回來,接着上次的位置繼續運行:

這個位置,是函數上一次放棄運行的位置,它是函數內的某個點。

在函數的半截里放棄CPU之後還能回來,就需要保存函數的運行上下文:信息、寄存器信息。

保存到哪裡?

只能保存到上,因為棧和寄存器都會隨着代碼的運行而不斷地覆蓋,只有堆是受用戶控制的。

用戶測試代碼

上圖是“用戶代碼”,雖然兩個函數__async_connect()和__async_write()的內部是異步執行的,但它們都在一個函數_async_test()里,整個流程看上去是同步的。

__async_connect()函數,上半部

__async_connect()分為上半部和下半部,以__asm_co_task_yield()為分隔點。

上半部調用異步的connect(),下半部調用getsockopt()讀取結果。

為了避免阻塞線程,需要在異步connect()之後讓出CPU,讓主框架函數可以做別的

這個讓出CPU的函數__asm_co_task_yield(),是“協程庫”的關鍵。

它讓出了CPU之後,在事件觸發之後再次恢復運行:這時函數__asm_co_task_yield()才會返回,然後接着運行下圖的代碼。

__async_connect()函數,下半部

當異步connect()成功時,getsockopt()獲取的錯誤碼err是0。

__async_write()函數

__async_write()函數的流程與__async_connect()類似,也是在文件描述符變得不可寫時放棄CPU,等待下次可寫時再恢復運行。

epoll主框架函數

epoll的主框架函數是一個while循環:使用epoll_wait()系統調用去監控事件的觸發。

它會同時處理IO事件定時器

定時器的精度受限於epoll_wait()的等待時間

epoll主框架函數

__scf_co_task_run(),可以讓“協程任務”首次運行,或者再次恢復運行。

_scf_co_task_run()函數

這個函數只是調用了__asm_co_task_run(),具體的長跳轉彙編里實現。

因為長跳轉涉及到細緻的內存控制,只能用彙編實現。

運行結果:

要在本機上用命令nc -vv -l 2000當服務端。

打印的日誌,是長跳轉時的棧信息的變化

兩個彙編函數的大概功能,如下面的3張圖。

細節就不說了,這種代碼,時間久了連作者都快看不懂了[捂臉]