<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
	<channel>
		<title>Linux on chengzhycn&#39;s blog</title>
		<link>https://blog.jinzhi.site/tags/linux/</link>
		<description>Recent content in Linux on chengzhycn&#39;s blog</description>
		<generator>Hugo</generator>
		<language>en-us</language>
		
		
		
		
			<lastBuildDate>Thu, 13 Oct 2022 14:30:28 +0800</lastBuildDate>
		
			<atom:link href="https://blog.jinzhi.site/tags/linux/index.xml" rel="self" type="application/rss+xml" />
			<item>
				<title>Linux 收包和发包流程</title>
				<link>https://blog.jinzhi.site/posts/2022-10/linux-%E6%94%B6%E5%8C%85%E5%92%8C%E5%8F%91%E5%8C%85%E6%B5%81%E7%A8%8B/</link>
				<pubDate>Thu, 13 Oct 2022 14:30:28 +0800</pubDate>
				<guid>https://blog.jinzhi.site/posts/2022-10/linux-%E6%94%B6%E5%8C%85%E5%92%8C%E5%8F%91%E5%8C%85%E6%B5%81%E7%A8%8B/</guid>
				<description>&lt;h2 id=&#34;流程图&#34;&gt;流程图&lt;/h2&gt;&#xA;&lt;p&gt;From 《Understanding Linux Network Internals》&lt;/p&gt;&#xA;&lt;p&gt;&lt;img src=&#34;https://blog.jinzhi.site/images/notes/linux-%E6%94%B6%E5%8C%85%E5%92%8C%E5%8F%91%E5%8C%85%E6%B5%81%E7%A8%8B/image-20220128172744059.png&#34; alt=&#34;image-20220128172744059&#34;&gt;&lt;/p&gt;&#xA;&lt;p&gt;&lt;img src=&#34;https://blog.jinzhi.site/images/notes/linux-%E6%94%B6%E5%8C%85%E5%92%8C%E5%8F%91%E5%8C%85%E6%B5%81%E7%A8%8B/image-20220129171450456.png&#34; alt=&#34;image-20220129171450456&#34;&gt;&lt;/p&gt;&#xA;&lt;h2 id=&#34;收包流程&#34;&gt;收包流程&lt;/h2&gt;&#xA;&lt;p&gt;TL; DR&lt;/p&gt;&#xA;&lt;p&gt;&lt;img src=&#34;https://blog.jinzhi.site/images/notes/linux-%E6%94%B6%E5%8C%85%E5%92%8C%E5%8F%91%E5%8C%85%E6%B5%81%E7%A8%8B/Linux_Packet_Receive_Flow.png&#34; alt=&#34;image-20220129171450456&#34;&gt;&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;strong&gt;收包&lt;code&gt;NET_RX_SOFTRQ&lt;/code&gt;的软中断处理函数是&lt;code&gt;net_rx_action&lt;/code&gt;&lt;/strong&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;&lt;code&gt;net_rx_action&lt;/code&gt;中会调用网卡驱动注册的poll回调函数处理&lt;/strong&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;poll回调函数将数据帧从网卡ring buffer中取出，构造skb：&lt;/strong&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;strong&gt;运行xdpdrv上的bpf program，得到action result&lt;/strong&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;如果是XDP_PASS，构造skb，并初始化skb中一些metadata字段&lt;/strong&gt;&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;调用内核的GRO和RPS处理流程&lt;/strong&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;进入&lt;code&gt;__netif_receive_skb_core&lt;/code&gt;，处理skb：&lt;/strong&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;strong&gt;运行xdpgeneric上的bpf program，得到action result&lt;/strong&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;如果是XDP_PASS，遍历&lt;code&gt;ptype_all&lt;/code&gt;和&lt;code&gt;dev-&amp;gt;ptype_all&lt;/code&gt;，进行抓包处理&lt;/strong&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;tc ingress 处理&lt;code&gt;sch_handle_ingress&lt;/code&gt;&lt;/strong&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;查找&lt;code&gt;ptype_base&lt;/code&gt;和&lt;code&gt;dev-&amp;gt;ptype_specific&lt;/code&gt;，交由对应的三层协议栈回调函数处理&lt;/strong&gt;&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h3 id=&#34;napi&#34;&gt;NAPI&lt;/h3&gt;&#xA;&lt;p&gt;**NAPI的思想是从完全的中断收包模型，改用中断和polling混合。**如果内核在处理旧的数据帧时，收到了新的数据帧，网卡设备没有必要再触发一个中断。内核继续处理设备input queue里的数据（该设备的interrupt禁止了），在队列为空时重新使能中断。&lt;/p&gt;&#xA;&lt;p&gt;从内核的角度，NAPI有如下的优势：&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;降低CPU的负载（更少的中断）&lt;/li&gt;&#xA;&lt;li&gt;更多的设备处理公平性&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;以ixgbe网卡为例，描述下NAPI处理流程。&lt;/p&gt;&#xA;&lt;h4 id=&#34;注册&#34;&gt;注册&lt;/h4&gt;&#xA;&lt;p&gt;ixgbe驱动在初始化中断向量时会调用&lt;code&gt;netif_napi_add&lt;/code&gt;初始化NAPI，==&lt;strong&gt;将&lt;code&gt;ixgbe_poll&lt;/code&gt;函数注册到napi结构体，并将napi加入到设备的napi_list内&lt;/strong&gt;==：&lt;/p&gt;&#xA;&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-c&#34; data-lang=&#34;c&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;cm&#34;&gt;/**&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;cm&#34;&gt; * ixgbe_alloc_q_vector - Allocate memory for a single interrupt vector&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;cm&#34;&gt; * @adapter: board private structure to initialize&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;cm&#34;&gt; * @v_count: q_vectors allocated on adapter, used for ring interleaving&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;cm&#34;&gt; * @v_idx: index of vector in adapter struct&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;cm&#34;&gt; * @txr_count: total number of Tx rings to allocate&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;cm&#34;&gt; * @txr_idx: index of first Tx ring to allocate&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;cm&#34;&gt; * @xdp_count: total number of XDP rings to allocate&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;cm&#34;&gt; * @xdp_idx: index of first XDP ring to allocate&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;cm&#34;&gt; * @rxr_count: total number of Rx rings to allocate&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;cm&#34;&gt; * @rxr_idx: index of first Rx ring to allocate&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;cm&#34;&gt; *&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;cm&#34;&gt; * We allocate one q_vector.  If allocation fails we return -ENOMEM.&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;cm&#34;&gt; **/&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;k&#34;&gt;static&lt;/span&gt; &lt;span class=&#34;kt&#34;&gt;int&lt;/span&gt; &lt;span class=&#34;nf&#34;&gt;ixgbe_alloc_q_vector&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;(&lt;/span&gt;&lt;span class=&#34;k&#34;&gt;struct&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;ixgbe_adapter&lt;/span&gt; &lt;span class=&#34;o&#34;&gt;*&lt;/span&gt;&lt;span class=&#34;n&#34;&gt;adapter&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;,&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;                &lt;span class=&#34;kt&#34;&gt;int&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;v_count&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;,&lt;/span&gt; &lt;span class=&#34;kt&#34;&gt;int&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;v_idx&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;,&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;                &lt;span class=&#34;kt&#34;&gt;int&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;txr_count&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;,&lt;/span&gt; &lt;span class=&#34;kt&#34;&gt;int&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;txr_idx&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;,&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;                &lt;span class=&#34;kt&#34;&gt;int&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;xdp_count&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;,&lt;/span&gt; &lt;span class=&#34;kt&#34;&gt;int&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;xdp_idx&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;,&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;                &lt;span class=&#34;kt&#34;&gt;int&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;rxr_count&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;,&lt;/span&gt; &lt;span class=&#34;kt&#34;&gt;int&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;rxr_idx&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;)&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;p&#34;&gt;{&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&#x9;&lt;span class=&#34;cm&#34;&gt;/* ... */&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;    &lt;span class=&#34;cm&#34;&gt;/* initialize NAPI */&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;    &lt;span class=&#34;nf&#34;&gt;netif_napi_add&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;(&lt;/span&gt;&lt;span class=&#34;n&#34;&gt;adapter&lt;/span&gt;&lt;span class=&#34;o&#34;&gt;-&amp;gt;&lt;/span&gt;&lt;span class=&#34;n&#34;&gt;netdev&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;,&lt;/span&gt; &lt;span class=&#34;o&#34;&gt;&amp;amp;&lt;/span&gt;&lt;span class=&#34;n&#34;&gt;q_vector&lt;/span&gt;&lt;span class=&#34;o&#34;&gt;-&amp;gt;&lt;/span&gt;&lt;span class=&#34;n&#34;&gt;napi&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;,&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;               &lt;span class=&#34;n&#34;&gt;ixgbe_poll&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;,&lt;/span&gt; &lt;span class=&#34;mi&#34;&gt;64&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;);&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;p&#34;&gt;}&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;h4 id=&#34;中断处理函数&#34;&gt;中断处理函数&lt;/h4&gt;&#xA;&lt;p&gt;ixgbe驱动收到中断后，会调用&lt;code&gt;ixgbe_msix_clean_rings&lt;/code&gt;&lt;/p&gt;</description>
			</item>
			<item>
				<title>Linux 进程调度</title>
				<link>https://blog.jinzhi.site/posts/2022-01/linux-%E8%BF%9B%E7%A8%8B%E8%B0%83%E5%BA%A6/</link>
				<pubDate>Tue, 11 Jan 2022 14:30:28 +0800</pubDate>
				<guid>https://blog.jinzhi.site/posts/2022-01/linux-%E8%BF%9B%E7%A8%8B%E8%B0%83%E5%BA%A6/</guid>
				<description>&lt;p&gt;总体来说，调度主要解决两类问题：&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;什么时候调度&lt;/li&gt;&#xA;&lt;li&gt;调度的目标是谁&#xA;而一个优秀的调度系统，可以从如下几个指标判断：&lt;/li&gt;&#xA;&lt;li&gt;fast process response time&lt;/li&gt;&#xA;&lt;li&gt;good throughput for background jobs&lt;/li&gt;&#xA;&lt;li&gt;avoidance of process starvation&lt;/li&gt;&#xA;&lt;li&gt;reconciliation of the needs of low- and high- priority processes&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;Linux调度基于分时（Time-Sharing）：多个进程共享同一个CPU，CPU运行时切分成多个时间片。分时技术依赖于timer interrupt，对进程来说是透明的。&lt;/p&gt;&#xA;&lt;p&gt;Linux进程是&lt;strong&gt;可抢占&lt;/strong&gt;的。当进程切换到&lt;code&gt;TASK_RUNNING&lt;/code&gt;状态，内核检查其动态优先级是否比当前运行的进程的优先级高。如果更高，当前执行的进程中断掉，调度器切入，选择另外一个进程运行（通常是刚刚切换成runnable的进程）。当进程的时间片消耗完毕时，进程也是可被抢占的。当前进程&lt;code&gt;struct thread_info&lt;/code&gt;中的&lt;code&gt;TIF_NEED_RESCHED&lt;/code&gt;被设置，timer interrupt handler终止后，scheduler切入。&lt;/p&gt;&#xA;&lt;p&gt;一个被抢占的进程并不是被暂停，它还维持在&lt;code&gt;TASK_RUNNING&lt;/code&gt;状态，只不过不再使用CPU。&lt;/p&gt;&#xA;&lt;h2 id=&#34;调度算法&#34;&gt;调度算法&lt;/h2&gt;&#xA;&lt;p&gt;Linux 2.6版本之前的调度算法很简单，进程切换时，内核扫描runnable进程列表，计算它们的优先级，选择“最优”的进程运行。这种算法的问题是切换时的时间开销会随着进程数目的增多呈线性增长。&lt;/p&gt;&#xA;&lt;p&gt;调度策略：&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;code&gt;SCHED_FIFO&lt;/code&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;code&gt;SCHED_RR&lt;/code&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;code&gt;SCHED_NORMAL&lt;/code&gt;&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h3 id=&#34;o1-scheduler&#34;&gt;O(1) Scheduler&lt;/h3&gt;&#xA;&lt;p&gt;基于Linux-2.6.12版本。&lt;/p&gt;&#xA;&lt;h4 id=&#34;优先级&#34;&gt;优先级&lt;/h4&gt;&#xA;&lt;p&gt;Linux 2.6.12 内核里，优先级表示分为用户态和内核态。用户态优先级就是我们常用的nice值。取值范围[-20, 19]。内核态优先级被称作静态优先级（static priority），取值范围是[0, 139]。其中，[0, 99]是Real-Time Process，[100, 139]对应用户态nice值。&lt;/p&gt;&#xA;&lt;p&gt;在静态优先级外，真正发挥作用的是&lt;strong&gt;动态优先级（dynamic priority）&lt;/strong&gt;。动态优先级实际上是静态优先级加上了一个运行时补偿（bonus）：&#xA;$$&#xA;dynamic_priority = max(100, min((static_priority - 5 + bonus), 139)), bonus \in [0, 10]&#xA;$$&lt;/p&gt;</description>
			</item>
			<item>
				<title>Linux 进程</title>
				<link>https://blog.jinzhi.site/posts/2021-11/linux-%E8%BF%9B%E7%A8%8B/</link>
				<pubDate>Tue, 30 Nov 2021 08:30:28 +0800</pubDate>
				<guid>https://blog.jinzhi.site/posts/2021-11/linux-%E8%BF%9B%E7%A8%8B/</guid>
				<description>&lt;h2 id=&#34;进程和轻量级进程&#34;&gt;进程和轻量级进程&lt;/h2&gt;&#xA;&lt;p&gt;&lt;img src=&#34;https://blog.jinzhi.site/images/notes/linux-%E8%BF%9B%E7%A8%8B/image-20211112165309944.png&#34; alt=&#34;image-20211112165309944&#34;&gt;&lt;/p&gt;&#xA;&lt;p&gt;在Linux内核中，进程/线程对应的数据结构是&lt;code&gt;task_struct&lt;/code&gt;，定义在&lt;code&gt;include/linux/sched.h&lt;/code&gt;中。&lt;/p&gt;&#xA;&lt;p&gt;线程在Linux中的实现是 &lt;strong&gt;&lt;a href=&#34;https://en.wikipedia.org/wiki/Native_POSIX_Thread_Library&#34;&gt;Naive POSIX Thread Library&lt;/a&gt;&lt;/strong&gt; 。在内核眼中，Linux的线程实际上也是一个进程（&lt;code&gt;task_struct&lt;/code&gt;），区别是线程的“进程”共享了地址空间、文件描述符等，称作==&lt;strong&gt;轻量级进程&lt;/strong&gt;==。因此，Linux的线程也是独立的调度单元，是可以分别在不同的CPU上同时运行的。原生的Linux 线程（2.6版本内核之前）因为只实现在了用户态，所以，即使是一个多线程程序，对于内核来说只能看到一个进程，这些线程就只能在一个CPU上运行，对于多核多线程来说是很致命的。&lt;/p&gt;&#xA;&lt;p&gt;从实现的角度，Linux的线程（LWP）是通过pthread库创建/使用的。而进程和线程的创建都调用了&lt;code&gt;clone()&lt;/code&gt;系统调用（&lt;code&gt;kernel/fork.c&lt;/code&gt; ）。区别是两者使用了不同的flags。&lt;/p&gt;&#xA;&lt;h2 id=&#34;进程管理&#34;&gt;进程管理&lt;/h2&gt;&#xA;&lt;h3 id=&#34;进程状态&#34;&gt;进程状态&lt;/h3&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;strong&gt;TASK_RUNNING&lt;/strong&gt;: The process is either executing on a CPU or waiting to be executed&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;TASK_INTERRUPTIBLE&lt;/strong&gt;: The process is suspended (sleeping) until some condition becomes true.&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;TASK_UNINTERRUPTIBLE&lt;/strong&gt;: Like TASK_INTERRUPTIBLE, except that delivering a signal to the sleeping process leaves its state unchanged.&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h3 id=&#34;pid&#34;&gt;PID&lt;/h3&gt;&#xA;&lt;p&gt;PID用来区分不同的进程结构体。Linux中最大PID数目可以在&lt;code&gt;/proc/sys/kernel/pid_max&lt;/code&gt;中查看。&lt;/p&gt;&#xA;&lt;p&gt;每个进程/轻量级进程都分配有一个唯一的PID。但是对于同一进程中的线程来说，我们拿到的是进程ID确是相同的，这是怎么实现的呢？&lt;/p&gt;&#xA;&lt;p&gt;Linux为了兼容POSIX标准，利用了线程组（thread group）这一概念。所有的线程都会把线程组里面第一个线程的PID存在tgid字段内。==getpid()系统调用返回的实际上是tgid的值。==&lt;/p&gt;&#xA;&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-c&#34; data-lang=&#34;c&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;cm&#34;&gt;/**&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;cm&#34;&gt; * sys_getpid - return the thread group id of the current process&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;cm&#34;&gt; *&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;cm&#34;&gt; * Note, despite the name, this returns the tgid not the pid.  The tgid and&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;cm&#34;&gt; * the pid are identical unless CLONE_THREAD was specified on clone() in&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;cm&#34;&gt; * which case the tgid is the same in all threads of the same group.&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;cm&#34;&gt; *&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;cm&#34;&gt; * This is SMP safe as current-&amp;gt;tgid does not change.&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;cm&#34;&gt; */&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;nf&#34;&gt;SYSCALL_DEFINE0&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;(&lt;/span&gt;&lt;span class=&#34;n&#34;&gt;getpid&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;)&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;p&#34;&gt;{&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;    &lt;span class=&#34;k&#34;&gt;return&lt;/span&gt; &lt;span class=&#34;nf&#34;&gt;task_tgid_vnr&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;(&lt;/span&gt;&lt;span class=&#34;n&#34;&gt;current&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;);&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;p&#34;&gt;}&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;h4 id=&#34;bitmap管理pid&#34;&gt;bitmap管理PID&lt;/h4&gt;&#xA;&lt;h4 id=&#34;idr管理pid&#34;&gt;IDR管理PID&lt;/h4&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;PID: replace pid bitmap implementation with IDR API &lt;a href=&#34;https://git.kernel.org/linus/95846ecf9dac5089aed4b144d912225f8ef86ae4&#34;&gt;commit&lt;/a&gt;, &lt;a href=&#34;https://git.kernel.org/linus/e8cfbc245e24887e3c30235f71e9e9405e0cfc39&#34;&gt;commit&lt;/a&gt;&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h2 id=&#34;进程切换&#34;&gt;进程切换&lt;/h2&gt;&#xA;&lt;p&gt;==&lt;strong&gt;TLDR&lt;/strong&gt;：进程在调用&lt;code&gt;schedule()&lt;/code&gt;方法时，将当前进程运行的寄存器信息保存在&lt;code&gt;task_struct-&amp;gt;thread_info&lt;/code&gt;内，同时从进程B中的&lt;code&gt;task_struct-&amp;gt;thread_info&lt;/code&gt;中加载B运行时的寄存器信息。==&lt;/p&gt;</description>
			</item>
	</channel>
</rss>
