当前位置: 首页 > news >正文

Linux线程与进程:探秘共享地址空间的并发实现与内

Linux系列


文章目录

  • Linux系列
  • 前言
  • 一、线程的概念
  • 二、线程与地址空间
    • 2.1 线程资源的分配
    • 2.2 虚拟地址到物理地址的转换
  • 三 、线程VS进程
  • 总结


前言

在Linux操作系统中,线程作为CPU调度的基本单位,起着至关重要的作用。深入理解线程控制机制,是学习Linux系统不可或缺的重要环节。

本篇文章我主要介绍,线程的概念、线程与进程的关系及线程在Linux下的实现。


一、线程的概念

线程(Thread)是操作系统能够进行运算调度的最小单位,是进程中的一个独立执行流。线程在进程的上下文中运行,共享进程的资源(如:内存、文件、内核数据结构等),但拥有自己的独立的执行栈。线程的存在使得程序可以更高效的并发执行。

Linux系统中,并未为线程单独构建管理结构,而是通过模拟进程的方式实施线程管理,复用进程的数据结构与管理算法。因此,Linux不存在真正意义上的线程,从操作系统层面来看,所有执行实体本质上均为轻量级进程。

下图表示的线程与进程的关系:

  1. 进程是资源分配的单位:图中红色框内的「进程地址空间」(包含用户空间的正文代码、数据段、共享区、栈等,以及内核空间)是进程的资源集合。进程拥有独立的地址空间,是系统分配资源(如内存、文件描述符)的基本单位。

  2. 线程是调度的基本单位:图中多个 task_struct(任务控制块)都表示一个线程,均指向同一进程地址空间,它们属于同一个进程的不同线程。每个 task_struct 代表一个线程,线程是 CPU 调度的基本单位,由 CPU 分配时间片执行。

  3. 资源共享关系:同一进程内的线程共享进程地址空间的资源(如用户空间的共享区、数据段、正文代码等),但每个线程有独立的栈空间(图中未详细区分每个线程的栈)和 task_struct(记录线程状态、寄存器信息等)。

  4. 内核视角与用户视角:在 Linux 中,线程本质是「轻量级进程」,内核通过 task_struct 管理线程,与管理进程的方式类似。但从用户视角看,多个线程属于同一进程,协作完成任务,共享进程资源,提升执行效率。

总结:进程是资源载体,线程是执行实体。在创建线程时不需要重新加载数据(代码、页表等),进程内的线程共用同一份地址空间,最开始创建的task_struct我们称为主线程,其他线程称为新线程。
在这里插入图片描述
我们之前介绍过的进程,都是只有一个执行流的特殊情况

二、线程与地址空间

2.1 线程资源的分配

在学习进程时我们了解到,CPU 访问进程资源需借助 task_struct 结构,通过进程地址空间获取虚拟内存地址,再经页表转换得到物理内存,进而实现对进程数据的访问。由此可见,进程地址空间是进程的资源载体。而线程并不单独分配地址空间资源,其本质是对所属进程地址空间特定范围的使用与操作,通过共享进程地址空间来实现资源利用。

2.2 虚拟地址到物理地址的转换

以32为计算机为例

磁盘文件文件加载到内存时,一般以4KB为单位(介绍文件管理时讲过)

在这里插入图片描述
在32位及其下,虚拟内存使用32位表示,当CPU进行虚拟内存到物理内存的转化时,会将这32位划分为:32=10+10+12,分别进行映射:
在这里插入图片描述

当 CPU 将虚拟地址转换为物理地址时,首先依据虚拟地址的前 10 位确定页目录表中的下标,利用该下标获取二级页表的基地址。接着,通过虚拟地址中间的 10 位确定二级页表中的下标,二级页表项中包含权限位,CPU 借助这些权限位判断是否存在越界访问或触发缺页中断。若访问合法,从二级页表项中获取物理内存页框的起始地址,最后结合虚拟地址的末 12 位,精准定位到实际物理内存地址。
在这里插入图片描述

三 、线程VS进程

Cache(高速缓存):
Cache 是介于 CPU 与主存(DRAM)之间的高速缓冲存储器,通常由 SRAM(静态存储器)构成,虽容量较小但访问速度极快。其核心功能是基于局部性原理,临时存储 CPU 近期可能频繁访问的数据,从而大幅提升数据访问效率。当 CPU 需读取数据时,会优先在 Cache 中查找:若命中目标数据,则直接从 Cache 读取,避免了对低速主存的访问;若未命中,则需从主存加载数据,并将其存入 Cache 以备后续使用。

从进程与线程的调度特性看:

  • 线程切换的缓存友好性:同一进程内的线程共享代码段、数据段和堆内存。当线程切换时,由于新线程所需访问的代码和数据仍属于原进程的地址空间范围,其数据可能依然驻留在 Cache 中,因此无需重新加载基础资源,有效降低了 Cache 失效的概率。
  • 进程切换的缓存冷启动:进程拥有独立的地址空间,当发生进程切换时,新进程的地址空间与原进程无重叠,导致 Cache 中缓存的旧进程数据无法被新进程复用。此时,CPU 需重新从主存加载新进程的代码和数据到 Cache,这一过程被称为「缓存冷启动」,会引入较高的访问延迟。

这种差异使得线程切换在性能上通常优于进程切换,尤其在需要频繁调度的场景中,线程的缓存利用率优势更为显著。

在创建进程时,操作系统需要为其分配独立的资源载体:

  • 构建专属的 task_struct 结构体(记录进程状态、优先级等核心信息);
  • 分配独立的页表与进程地址空间(包含代码段、数据段等内存区域);
  • 从磁盘加载进程的代码和数据到内存,并初始化进程上下文(如程序计数器、通用寄存器值等)。

而在进程中创建新线程时,由于线程共享所属进程的地址空间、页表及已加载的代码数据,操作系统仅需:

  • 为新线程创建独立的 task_struct 结构体;
  • 初始化线程独有的上下文数据(如线程栈空间、寄存器现场等轻量级资源)。

这种「资源共享 + 轻量上下文创建」的机制,使得线程创建的开销远低于进程,成为操作系统实现高效并发的关键技术路径。

总的来说线程相较于进程来说更加轻量化:

  • 切换更加轻量化
  • 创建和释放更加轻量化

总结

有些性质我会放在下篇介绍,本篇主要介绍概念
线程的优点

  • 创建一个新线程的代价要比创建一个新进程小得多
  • 与进程之间的切换相比,线程之间的切换需要操作系统做的工作要少很多线程占用的资源要比进程少很多
  • 能充分利用多处理器的可并行数量在等待慢速I/O操作结束的同时,程序可执行其他的计算任务
  • 计算密集型应用,为了能在多处理器系统上运行,将计算分解到多个线程中实现
  • I/O密集型应用,为了提高性能,将I/O操作重叠。线程可以同时等待不同的I/O操作

线程的缺点
性能损失

  • 一个很少被外部事件阻塞的计算密集型线程往往无法与其它线程共享同一个处理器。如果计算密集型线程的数量比可用的处理器多,那么可能会有较大的性能损失,这里的性能损失指的是增加了额外的同步和调度开销,而可用的资源不变。
    健壮性降低
  • 编写多线程需要更全面更深入的考虑,在一个多线程程序里,因时间分配上的细微偏差或者因共享了不该共享的变量而造成不良影响的可能性是很大的,换句话说线程之间是缺乏保护的。
    缺乏访问控制
  • 进程是访问控制的基本粒度,在一个线程中调用某些OS函数会对整个进程造成影响。
    编程难度提高
  • 编写与调试一个多线程程序比单线程程序困难得多
    线程异常
  • 单个线程如果出现除零,野指针问题导致线程崩溃,

相关文章:

Linux线程与进程:探秘共享地址空间的并发实现与内

Linux系列 文章目录 Linux系列前言一、线程的概念二、线程与地址空间2.1 线程资源的分配2.2 虚拟地址到物理地址的转换 三 、线程VS进程总结 前言 在Linux操作系统中,线程作为CPU调度的基本单位,起着至关重要的作用。深入理解线程控制机制,是…...

数据结构手撕--【堆】

目录 ​编辑 定义结构体: 初始化: 插入数据: 删除: 取堆顶元素: 堆销毁: 判断堆是否为空: TopK问题: 堆其实是完全二叉树 物理结构:二叉树的层序遍历&#xff08…...

MySQL基本命令--系统+用户+表

前言:在当今数据驱动的时代,关系型数据库依然是构建信息系统的中坚力量,而MySQL作为开源领域中最广泛使用的数据库管理系统之一,以其高性能、稳定性和易用性赢得了开发者和企业的青睐。无论是在小型博客系统中承担数据存储职责&am…...

4.23-4.26学习总结 HTML—CSS常见标签和样式

页部导航栏: flex样式: 表单标签: (25行是设置点击按钮) 表单项标签: 搜索表单区域: 底部版权区域: 总结:...

使用Django框架表单

使用Django框架表单 文章目录 使用Django框架表单[toc]1.使用Form类构建表单2.表单字段与Widget控件 1.使用Form类构建表单 【创建项目和应用】 PS C:\Users\ls> cd E:\Python\ PS E:\Python> django-admin.exe startproject FormSite PS E:\Python> cd .\FormSite\…...

OpenCV第6课 图像处理之几何变换(缩放)

1.简述 图像几何变换又称为图像空间变换,它将一幅图像中的坐标位置映射到另一幅图像中的新坐标位置。几何变换并不改变图像的像素值,只是在图像平面上进行像素的重新安排。 根据OpenCV函数的不同,本节课将映射关系划分为缩放、翻转、仿射变换、透视等。 2.缩放 2.1 函数…...

Python AI图像生成方案指南

1. 简介 AI图像生成是当前最热门的AI应用领域之一,Python提供了多种工具和库来实现这一功能。本指南将介绍几种主流的AI图像生成方案及其Python实现方法。 2. 主流AI图像生成技术 2.1 生成对抗网络(GANs) 原理:由生成器和判别器组成的对抗系统 特点&am…...

【C++】stack、queue和priority_queue的模拟实现

文章目录 前言一. stack1.1 stack的介绍1.2 stack的使用1.3 stack的模拟实现 二. queue2.1 queue的介绍2.2 queue的使用2.3 queue的模拟实现 三. deque3.1 deque的原理介绍3.2 deque的缺陷3.3 为什么选择deque作为stack和queue的底层默认容器 四. priority_queue(优…...

Jmeter数据库url开关设置+常用Beanshell

1、数据库url开关设置 (79 90) jdbc:mysql://test.lemonban.com:3306/future?allowMultiQueries-true&characterEncodingUTF-8 多条查询开关:allowMultiQueriestrue 字符集配置:characterEncodingUTF-8 2、用BeanShell提取Map中的方…...

NtripShare 2025第一季度主要技术进展

GNSS方面 1、开源GNSS接收机配置软件基础版本。 2、商业版本GNSS接收机配置软件,增加PPP、文件保存、前端解算(静态、RTK-Static),前端坐标转换。 3、GNSS接收机配置软件全面适配米尔T133i硬件方案。 视觉检测方面 1、做出第…...

Linux系统编程之内存映射

概述 内存映射是操作系统提供的一种机制,使得文件或设备的内容可以直接映射到进程的虚拟地址空间中。这意味着,我们可以像访问数组一样读写文件内容,而不需要显式地调用I/O函数进行数据传输。内存映射适用于多种应用场景,包括但不…...

一文详解Adobe Photoshop 2025安装教程

Adobe Photoshop下载安装和使用教程 Adobe Photoshop,简称“PS”,是由Adobe Systems开发和发行的图像处理软件。Photoshop主要处理以像素所构成的数字图像。使用其众多的编修与绘图工具,可以有效地进行图片编辑和创造工作&#xff0c…...

ShenNiusModularity项目源码学习(23:ShenNius.Admin.Mvc项目分析-8)

用户列表页面用于检索、新建、编辑、删除系统用户,同时设置用户角色。该页面对应的文件Index.cshtml位于ShenNius.Admin.Mvc项目的Areas\Sys\Views\User内,同目录下还有Modify.cshtml(新建、编辑用户)、SetRole.cshtml&#xff08…...

vue中 vue.config.js反向代理

新建一个node 服务 1 npm init -y //创建一个package.json 2.npm i express 3. 新建一个app.js 4.键入代码 const express require("express") const app express()app.get("/user",(req,res)>{res.send({"name":"good"…...

AIGC赋能智慧医疗:从影像诊断到个性化治疗的革命性突破

一、医疗AIGC技术架构 1.1 医疗场景技术挑战 医疗环节 行业痛点 AIGC解决方案 影像诊断 人工阅片效率低 多模态病灶分割与分级系统 病历管理 结构化程度低 语音转文本智能编码 药物研发 周期长成本高 分子生成与虚拟筛选 个性化治疗 方案标准化不足 基因组学临床数据融合模型 1…...

Yarn 安装与使用教程

Yarn 安装与使用教程 Yarn 是一个由 Facebook 开发的 JavaScript 包管理工具,它比传统的 npm 更加高效、可靠,并且在性能上有所提升。Yarn 主要解决了 npm 安装速度慢、并发性差、缓存机制不完善等问题,它提供了更快的安装速度、更稳定的依赖…...

机器学习之二:指导式学习

正如人们有各种各样的学习方法一样,机器学习也有多种学习方法。若按学习时所用的方法进行分类,则机器学习可分为机械式学习、指导式学习、示例学习、类比学习、解释学习等。这是温斯顿在1977年提出的一种分类方法。 有关机器学习的基本概念,…...

【学习笔记】检索增强生成(RAG)技术

检索增强生成(RAG)技术:原理、实现与发展趋势 1. RAG技术概述 检索增强生成(Retrieval-Augmented Generation,RAG)是一种将信息检索与生成模型相结合的技术,旨在增强大型语言模型的知识能力和…...

计算机视觉——对比YOLOv12、YOLOv11、和基于Darknet的YOLOv7的微调对比

概述 目标检测领域取得了巨大进步,其中 YOLOv12、YOLOv11 和基于 Darknet 的 YOLOv7 在实时检测方面表现出色。尽管这些模型在通用目标检测数据集上表现卓越,但在 HRSC2016-MS(高分辨率舰船数据集) 上对 YOLOv12 进行微调时&…...

Pygame跨平台打包:将游戏发布到Windows、Mac和Linux

Pygame跨平台打包:将游戏发布到Windows、Mac和Linux 引言 在游戏开发的世界中,Pygame 是一个非常受欢迎的库,它使得使用 Python 编写 2D 游戏变得简单而有趣。然而,当你完成了一个游戏并希望将其发布给更多的玩家时,如何将你的游戏打包成可以在不同操作系统上运行的可执…...

关于图论的知识

如果一个无向图有 $n\times (n-1)\div 2$ 条边,称为**完全图** 如果一个完全图任意两个点都可以互相到达,称为**连通图** 一个包含 $dfs$ 与 $bfs$ 的图的遍历程序 程序可做到的: 1、每一行输出一个 **搜索树** 2、$dfs$ 与 $bfs$ 并存 c…...

365打卡第R3周: RNN-心脏病预测

🍨 本文为🔗365天深度学习训练营中的学习记录博客 🍖 原作者:K同学啊 🏡 我的环境: 语言环境:Python3.10 编译器:Jupyter Lab 深度学习环境:torch2.5.1 torchvision0…...

如何解决IDE项目启动报错 error:0308010C:digital envelope routines::unsupported 问题

如何解决IDE项目启动报错 error:0308010C:digital envelope routines::unsupported 问题 在现代软件开发过程中,开发人员通常使用集成开发环境(IDE)如IntelliJ IDEA、Visual Studio Code(VSCode)等进行Node.js项目开发…...

嵌入式学习笔记 - HAL_xxx_MspInit(xxx);函数

使用cubeMX生成的HAL库函数中,所有外设的初始化函数HAL_xxx_Init(&xxxHandle)中都存在有此调用函数,此调用函数其实是对各外设模块比如UART,I2C等的底层硬件初始化,包括UART时钟,以及UART用到的GPIO的工作模式以及…...

Dify框架面试内容整理-Dify框架

什么是Dify框架? Dify框架是一个开源的AI应用开发平台,专注于帮助开发者和非技术人员快速构建、部署和管理基于大语言模型(如GPT系列、国产开源模型)的应用。 Dify框架的特点:...

计算机网络的五层结构(物理层、数据链路层、网络层、传输层、应用层)到底是什么?

文章目录 五层结构1. 物理层(Physical Layer)2. 数据链路层(Data Link Layer)3. 网络层(Network Layer)4. 传输层(Transport Layer)5. 应用层(Application Layer&#xf…...

【计算机视觉】CV实战项目 -深度解析PaddleSegSharp:基于PaddleSeg的.NET图像分割解决方案

深度解析PaddleSegSharp:基于PaddleSeg的.NET图像分割解决方案 技术背景与项目概述核心功能与特点实战部署指南环境要求硬件要求软件依赖 项目结构快速开始1. 获取项目2. 准备模型文件3. 运行示例 高级使用技巧模型切换背景替换性能优化 常见问题与解决方案技术原理…...

面试新收获-大模型学习

大模型原理 Transformer 架构与自注意力机制 Transformer 是当前大多数大模型采用的核心架构,由编码器-解码器组成,摒弃了传统 RNN 的顺序处理方式。Transformer 中关键在于多头自注意力机制(Multi-Head Self-Attention)&#xf…...

《Keras 3部署全攻略:从新手到实战高手》

《Keras 3部署全攻略:从新手到实战高手》 一、引言:开启 Keras 3 部署之旅 在深度学习的广阔领域中,Keras 一直以其简洁易用、高度模块化的特性,深受开发者的喜爱,被誉为深度学习的 “福音”。而如今,Keras 3 的强势登场,更是为这个领域注入了全新的活力。它像是一位集…...

如何修改npm的全局安装路径?

修改 npm 的全局安装路径可以通过以下步骤完成,确保全局包(使用 -g 安装的模块)和缓存文件存储到自定义路径。以下是详细步骤: 1. 创建自定义路径的目录 在目标路径下创建两个文件夹,分别用于存储全局模块和缓存文件…...

计算机网络 | Chapter1 计算机网络和因特网

💓个人主页:mooridy-CSDN博客 💓文章专栏:《计算机网络:自定向下方法》 大纲式阅读笔记_mooridy的博客-CSDN博客 🌹关注我,和我一起学习更多计算机网络的知识 🔝🔝 目录 …...

前端面试 HTML篇

src和href的区别 src和href都是用来加载外部资源,区别如下 src:当浏览器解析到该元素时,会暂停其他资源的加载和处理,直到该资源加载完成。 它会将资源内容嵌入到当前标签所在的位置,将其指向的资源下载应用到文档内…...

Prometheus、Zabbix 和 Nagios 这三个工具的对100个节点的部署设计的信息流

Prometheus 1. 基本组件及角色 Prometheus主要由Prometheus Server、Exporter、Alertmanager和Grafana(可选)等组件构成。 Prometheus Server:负责数据的收集、存储和查询,以及规则的评估。Exporter:部署在被监控节点上,负责收集节点的各种指标数据。Alertmanager:负责…...

Tableau 基础表制作

目录 1.数据连接 2. 数据可视化 3. 基础表制作 3.1 对比分析:比大小 1. 柱状图 2. 条形图 3. 热力图 4. 气泡图 5. 词云 3.2 变化分析:看趋势 1. 折线图 2. 面积图 3.3 构成分析:看占比 1. 饼图 2. 树地图 3. 堆积图 3.4 关…...

openAICEO山姆奥特曼未来预测雄文之三个观察

《三个观察》 山姆奥特曼 这篇文章主要讲的是关于AGI(人工通用智能)的未来发展及其对社会的影响,用大白话总结如下: 核心观点: AGI是什么? AGI是一种能像人类一样解决各种复杂问题的智能系统,比…...

springboot入门-service层构造器注入原理

在 Spring Boot 中,通过构造器注入的方式将 Repository(JPA)或 Mapper(MyBatis)注入到 Service 层的原理及示例如下: 1. 构造器注入的原理 依赖注入(DI)机制: Spring 容…...

JavaScript 笔记 --- part6 --- JS进阶 (part1)

JS 进阶(part1) 作用域 局部作用域 定义: 局部作用域指的是在函数内部定义的变量,只能在函数内部访问,外部不能访问。 特点: 局部作用域变量只能在函数内部或代码块中访问,外部不能访问。 分类: 函数作用域: 指的是在函数内部定义的变量&…...

使用matplotlib绘制Raincloud图/云雨图/柱状图/小提琴图

需求: 使用Python的matplotlib绘制数据分布、数据箱型图、数据散点图 参考: https://blog.csdn.net/weixin_39559994/article/details/128197965?fromshareblogdetail&sharetypeblogdetail&sharerId128197965&sharereferPC&sharesource…...

BT152-ASEMI机器人率器件专用BT152

编辑:LL BT152-ASEMI机器人率器件专用BT152 型号:BT152 品牌:ASEMI 封装:TO-220F 批号:最新 引脚数量:3 封装尺寸:如图 特性:单向可控硅 工作结温:-40℃~150℃ …...

【Redis——通用命令】

文章目录 Redis为什么快?生产环境的概念Redis中最核心的两个命令get:通过key拿valueset:将key和value存入数据库 其他通用命令keysexist判定key是否存在delexpire:为指定的key设置一个过期时间TTL(Time To Live&#x…...

qt之开发大恒usb3.0相机一

1.在大恒相机给的sample里没有看见qt开发的demo. 第一步先运行c sdk中中的demo,看了下代码,大恒使用的UI框架是MFC.然后 vs2022编译。运行结果 第一步,先用qt进行坐下页面布局,如下图(保存图片的地方做了些更改&#…...

系列位置效应——AI与思维模型【80】

一、定义 系列位置效应思维模型是指在一系列事物或信息的呈现过程中,人们对于处于系列开头和结尾部分的项目的记忆效果优于中间部分项目的现象。具体而言,开头部分的记忆优势被称为首因效应,结尾部分的记忆优势被称为近因效应。这种效应反映…...

解决conda虚拟环境安装包却依旧安装到base环境下

最近跑项目装包装到几度崩溃,包一直没有安装到正确位置,为此写下这篇文章记录一下,也希望能帮到有需要的人。(此文章开发环境为anaconda和window) 方法一 先conda deactivate,看到(base)消失…...

设计看似完美却测不过? Intra-Pair Skew 是「讯号完整性(Signal Integrity)」里最隐形的杀手

各位不知道有没有遇过,一对很长的差分走线,看起来很正常,但是测试结果偶尔会fail偶尔会pass,不像是软件问题,也不像是制程问题。 看了一下Layout,发现阻抗匹配控制的非常好,TDR测试也显示阻抗好…...

使用MyBatis注解方式的完整示例,涵盖CRUD、动态SQL、分页、事务管理等场景,并附详细注释和对比表格

以下是使用MyBatis注解方式的完整示例,涵盖CRUD、动态SQL、分页、事务管理等场景,并附详细注释和对比表格: 项目结构 mybatis-annotation-demo/ ├── src/ │ ├── main/ │ │ ├── java/ │ │ │ └── com.example/…...

【头脑风暴】加权平均

一些加权平均而不是算术平均的思路,启发来源:ACLS,WACLS。 简单平均假设所有样本的误差和噪声特性相同,但在实际电路中,不同阶段、不同时间点的样本价值(对最终精度的贡献)是不同的。​​加权平均的核心思想…...

DAM-3B,英伟达推出的多模态大语言模型

DAM-3B是什么 DAM-3B(Describe Anything 3B)是英伟达推出的一款多模态大语言模型,专门用于为图像和视频中的特定区域生成详细描述。用户可以通过点、边界框、涂鸦或掩码等方式来标识目标区域,从而得到精准且符合上下文的文本描述…...

2025年暨南大学 ACM校赛分析与题解

文章目录 C.最长公共前缀D.排列H.回文串 法不定法,在于因时因势AC不了就是还得加练! C.最长公共前缀 字典树模版题目,不了解字典树的同学,可以看我的另一篇博客 算法 之 字典树 class Node: # 和模版题目相似,但是多…...

图像处理——边缘检测

1 概述 边缘检测是图像处理和计算机视觉中的一项基本技术,用于识别图像中亮度变化剧烈的像素点,这些像素点通常对应于物体的边界。它通过检测图像中亮度或颜色变化显著的区域,提取出物体的轮廓,常用于计算机视觉、图像处理和模式识…...

认识哈希以及哈希表的模拟实现

文章目录 1.什么是哈希2.哈希函数2.1 除留余数法/除法散列法2.2 乘法散列法2.3 全域散列法 3.哈希冲突4.解决哈希冲突的方法4.1 开放定址法4.1.1 用除留余数法和线性探测模拟实现简单的哈希表 4.2 链地址法4.2.1 用除留余数法和链地址法模拟实现简单的哈希表 1.什么是哈希 概念…...