我們知道為了 CPU 之間減少“干擾”,每個(gè) CPU 上都有一個(gè)任務(wù)隊(duì)列。運(yùn)行的過程種可能會(huì)出現(xiàn)有的 CPU 很忙,有的 CPU 很閑,如下圖所示:為了避免這個(gè)問題的出現(xiàn),Linux 內(nèi)核實(shí)現(xiàn)了 CPU 可運(yùn)行進(jìn)程隊(duì)列之間的負(fù)載均衡。因?yàn)樨?fù)載均衡是在多個(gè)核上的均衡,所以在講解負(fù)載均衡之前,我們先看下多核的架構(gòu)。將 task 從負(fù)載較重的 CPU 上轉(zhuǎn)移到負(fù)載相對(duì)較輕的 CPU 上執(zhí)行,這個(gè)過程就是負(fù)載均衡的過程。
多核架構(gòu)
這里以 Arm64 的 NUMA(Non Uniform Memory Access) 架構(gòu)為例,看下多核架構(gòu)的組成。從圖中可以看出,這是非一致性內(nèi)存訪問。每個(gè) CPU 訪問 local memory,速度更快,延遲更小。因?yàn)?Interconnect 模塊的存在,整體的內(nèi)存會(huì)構(gòu)成一個(gè)內(nèi)存池,所以 CPU 也能訪問 remote memory,但是相對(duì) local memory 來說速度更慢,延遲更大。我們知道一個(gè)多核心的 SOC 片上系統(tǒng),內(nèi)部結(jié)構(gòu)是很復(fù)雜的。內(nèi)核采用 CPU 拓?fù)?/strong>結(jié)構(gòu)來描述一個(gè) SOC 的架構(gòu),使用調(diào)度域和調(diào)度組來描述 CPU 之間的層次關(guān)系。
CPU 拓?fù)?/span>
每一個(gè) CPU 都會(huì)維護(hù)這么一個(gè)結(jié)構(gòu)體實(shí)例,用來描述 CPU 拓?fù)洹?/p>struct?cpu_topology?{ ?int?thread_id; ?int?core_id; ?int?cluster_id; ?cpumask_t?thread_sibling; ?cpumask_t?core_sibling; };
thread_id: 從 mpidr_el1 寄存器中獲取
core_id:從 mpidr_el1 寄存器中獲取
cluster_id:從mpidr_el1寄存器中獲取
thread_sibling:當(dāng)前 CPU 的兄弟 thread。
core_sibling:當(dāng)前 CPU 的兄弟Core,即在同一個(gè) Cluster 中的 CPU。