Linux 信号
一、生活中的信号
1.1、生活中的信号从产生到结束过程
例:
①、外卖电话响了(信号产生)-> 我接了电话并告诉外卖员说先放到楼下的架子上(识别到这个信号,并记住,保存到我的脑海里面) -> 我在打游戏我继续推高地 (时间窗口,我要做更重要的事) -> 游戏结束了,我下楼取外卖(信号的处理);
②、200米冲刺比赛发令员举起信号枪说:“预备!”(信号产生)->我做起的预备跑的动作动作(我识别到预备的信号并立即对其进行处理)-> 发令员喊:“跑!”并开枪(信号产生)->我一瞬间飞奔了出去(识别到枪声信号,并立即对其进行处理);
二、进程中的信号
2.1、进程必须识别并能够处理信号--- 即便信号没有产生,也要具备处理信号的能力 --- 信号的处理能力属于内置进程的一部分;
2.2、当进程真的收到一个具体的信号时,进程可能立即对其进行处理(听到枪声立马飞奔),进程也可能不会立即处理这个信号,在合适的时候再处理(在打游戏,等我打完再去取外卖);
2.3、一个进程当信号产生到信号开始被处理,一定会有一个时间窗口,进程具有临时保存哪些信号已发生了的能力;
三、前台进程与后台进程
3.1、什么是前台进程?什么是后台进程?
在linux中,一次登陆,一个终端一般会配上一个bash,每一个登陆只允许一个进程是前台进程,可以运行多个进程是后台进程,谁是前台谁是后台取决于谁来获取键盘输入,能获取的就是前台进程;
3.2 、 linux中正在运行的程序从键盘输入 ctrl+c为什么能够杀掉进程?
#include <iostream>
#include <unistd.h>
using namespace std;
int main()
{while(true)
{cout<<"i am a process!!!"<<endl;sleep(1);
}return 0;
}
运行一会后键盘输入ctrl+c:
在bash命令行运行程序的后面加上&后再按ctrl + c:
我们发现ctrl+c杀不掉这个进程!!
原因:ctrl+c本质是被进程解释为收到了信号,这是一个2号信号,这个信号的默认动作是终止自己;从键盘输入ctrl+c是发送给前台进程的,当进程运行前在后面+&后这个进程会变成后台进程,所以ctrl+c,这个后台进程收不到信号,只能用kill -9来杀掉:
四、键盘的数据是如何输入给内核的?ctrl+c又是如何变成信号的?OS怎么知道键盘上有数据了?
①首先键盘录入数据,准备就绪后向cpu发送硬件中断信号;
②cup通过cup针角进行充放电,这个过程寄存器记录下数据;
③cup让OS去中断向量表里查找到对应的方法;
④OS找到读取方法后从键盘中把数据拷贝到内核缓冲区;
⑤再从内核缓冲区把数据拷贝到用户缓冲区,用户获取到键盘数据;
⑥OS在把数据拷贝到内核缓冲区前对键盘里的数据进行解析,如果录入的是像ctrl + c这样的组合键,不会往缓冲区里拷贝转而是向对应的进程发送信号,ctrl+c对应的是2号信号,把2号信号发送给对应的进程,终止掉程序;
五、信号的产生及处理
5.1、信号的处理方法
信号处理的三种方法:①默认动作(例如人看到红灯信号的默认动作是站着不动等待);②忽略(例如人看到红灯后忽略,后果自己承担);③自定义动作(例如人看到红灯信号后在原地跳舞);
5.2、信号的捕获及自定义处理
介绍一个接口:
#include <signal.h>
typedef void(*sighandler_t)(int);
sighandler_t signal( int signum, sighandler_t handler);
//1. 这个接口的作用是获取信号,并且修改信号的处理方式
//2. sighandler_t 这是一个函数指针类型,函数的返回值为void,函数参数类型为int
//3. sigbum为接收到的信号数字,handeler : 你需要传入一个已经定义好的方法
注意:①:只要设置一次,往后都有效;②如果进程没有接收到信号,自定义的处理方法不会被调用,只有产生信号才会被调用;
试一试:
前面我们说ctrl+c发送的是2号信号,我们编写一个程序并调用这个接口去获取这个信号,看它是不是2号,获取后把信号数打印出来:
#include <iostream>
#include <unistd.h>
#include <signal.h>
using namespace std;
typedef void(*sighandler)(int);//定义函数指针类型
void Handler(int signum)//自定义信号的处理方法
{cout<<signum<<endl;
}
int main()
{signal(2,Handler);//捕获2号信号,并调用自定义处理方法while(true)
{cout<<"i am a process!!!"<<endl;sleep(1);
}return 0;
}
编译运行程序后按ctrl +c :
我按了两次ctrl+c 可看到每次后面都跟着数字2,说明chrl+c的信号数字确是是2!而且我们发现按完ctrl+c后,程序没有终止而是继续执行,原因很简单因为我们把对信号的处理方法改变了,改成向屏幕打印数字2而不是终止程序,这样就实现了对信号的自定义处理!
5.3、不是所有信号都会被捕获
设想:如果我们把所有信号都捕获了并且把它处理方法定义为循环打印,那么岂不是这个程序一直在运行无法被杀死掉?
操作系统是不会允许这样的事情发生的,我们来测试一下究竟哪些信号不会被捕获:
代码改一下:
#include <iostream>
#include <unistd.h>
#include <signal.h>
using namespace std;
typedef void(*sighandler)(int);//定义函数指针类型
void Handler(int signum)//自定义信号的处理方法
{cout<<signum<<endl;
}
int main()
{for(int i=1;i<32;i++){signal(i,Handler);//捕获1~31号信号,并调用自定义处理方法}//signal(2,Handler);//捕获2号信号,并调用自定义处理方法while(true)
{cout<<"i am a process!!!"<<endl;sleep(1);
}return 0;
}
编译运行后我们用kill命令向这个进程发送1~31号信号,看看是不是全都被捕获:
...............
最终测试发现:1~31号信号,只有9、19号信号是不会被进程捕获的!用kill -l 命令查看信号列表,我们看到9跟19号信号对应的是 :杀掉进程、停止进程!!1~31号信号(只演示普通信号)终除了这两个之外其他都被捕获!!
上面程序运行我们发现,信号的产生和我们自己的代码的运行是异步的,这种进程间事件异步通知的方式是软中断;
5.4、信号的产生
I 以上我们知道了信号产生的两种方法:
1、通过从键盘中录入“ctrl + c”等组合键,被操作系统解析为信号,并发送给对应的进程;
2、通过命令( kill -信号数字 进程pid),产生信号发送给进程;
II 第三种信号产生的方法:
3、系统调用:
介绍一个接口:
#include <sys/systypes.h>
#include <signal.h>
int kill( pid_t pid, int sig);
//1. 这是一个向进程发送信号的接口
//2. pid : 进程的id sig : 信号数字
//3. int 返回值如果失败返回-1;
利用这个接口模拟实现一下kill 命令:
//mykill.cc
#include <iostream>
#include <sys/types.h>
#include <signal.h>
#include <stdio.h>
#include <string>
using namespace std;
int main(int argc,char*argv[])
{//mykill signum pidif(argc!=3){printf("please enter@ %s signum pid\n",argv[0]);}pid_t pid=stoi(argv[2]);int signum=stoi(argv[1]);int n=kill(pid,signum);return 0;
}
①:我们执行myprocess程序,循环向屏幕打印:
②编译好自己实现的mykill,运行用 9 号信号杀死掉26713这个程序:
成功杀掉进程!!
5.5、介绍两个接口
#include<signal.h>
int raise(int sig) ;
//1.这是一个给自己发送信号的接口
//2. sig -> 信号数字
#include <stdlib.h>
void abort(void);
//1. 这是一个终止自己的接口
我们调用这两个接口并调用捕获信号的接口,看看这两货到底发送了什么信号:
第一个接口形参是多少就发送几号的信号给自己;
然后我把它改成这样:
再编译运行后结果一样,所以raise()函数也可以写成kill(getpid(), signum);
测试第二个接口:
捕获不到信号,直接终止了程序!
查看信号列表发现是6号信号:
好了,今天分享到这里,如果对你有所帮助记得点赞收藏+关注哦!!谢谢!!!
咱下期见!!!
相关文章:
Linux 信号
一、生活中的信号 1.1、生活中的信号从产生到结束过程 例: ①、外卖电话响了(信号产生)-> 我接了电话并告诉外卖员说先放到楼下的架子上(识别到这个信号,并记住,保存到我的脑海里面) ->…...
AI 生成内容的版权困境:法律、技术与伦理的三重挑战
最近研学过程中发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击链接跳转到网站人工智能及编程语言学习教程。读者们可以通过里面的文章详细了解一下人工智能及其编程等教程和学习方法。下面开始对正文内容的…...
【愚公系列】《Manus极简入门》013-电影推荐专家:“银幕导航家”
🌟【技术大咖愚公搬代码:全栈专家的成长之路,你关注的宝藏博主在这里!】🌟 📣开发者圈持续输出高质量干货的"愚公精神"践行者——全网百万开发者都在追更的顶级技术博主! …...
MCP智能体意图识别与工具路由:让AI自主决策调用链路
目录 🚀 MCP智能体意图识别与工具路由:让AI自主决策调用链路 🌟 什么是意图识别与工具路由? 🛠️ 1. 设计意图识别模块 1.1 简易关键字规则版(基础版) 1.2 使用大模型辅助意图识别ÿ…...
【Redis】List类型
文章目录 List的特点介绍lpush,lpushx,rpush,rpushx命令lrange命令lpop和rpoplindex命令linsert命令llen命令lrem 命令ltrim命令lset命令阻塞版本的命令blpop和brpop 命令小结list的内部编码List的应用场景 List的特点介绍 列表相当于一个数…...
Trae 安装第三方插件支持本地部署的大语言模型
Trae 安装第三方插件支持本地部署的大语言模型 0. 引言1. 安装插件 0. 引言 字节发布的 Trae IDE 一直不支持本地部署的的大语言模型。 Qwen3 刚刚发布,想在 Trae 中使用本地部署的 Qwen3,我们可以在 Trae 中安装其他插件。 1. 安装插件 我们可以安装…...
【免费】2010-2019年上市公司排污费数据
2010-2019年上市公司排污费数据 1、时间:2010-2019年 2、来源:上市公司披露报告 3、指标:代码、日期、名称、本期支出 4、范围:417家上市公司 5、相关研究:胡珺,宋献中,王红建.非正式制度、家乡认同与企业环境治理…...
第Y3周:yolov5s.yaml文件解读
🍨 本文为🔗365天深度学习训练营 中的学习记录博客🍖 原作者:K同学啊 本次任务:将yolov5s网络模型中的第4层的C3x2修改为C3x1,第6层的C3x3修改为C3x2。 首先输出原来的网络结构: from n pa…...
python 桌面程序开发简述及示例
Python桌面程序开发简述及示例 Python凭借其简洁的语法和丰富的库支持,非常适合开发跨平台的桌面应用程序。本文将介绍Python桌面开发的主要方法,并提供实际代码示例。 一、Python桌面开发主要方法 1.1 Tkinter(标准库) Python内置的GUI库,适合开发简单桌面应用 1.2 …...
【前端知识】Vue3状态组件Pinia详细介绍
Vue3状态组件Pinia详细介绍 关联知识 Pinia 组件介绍、核心原理及使用方式 Pinia 组件介绍 Pinia 是 Vue.js 的官方状态管理库,专为 Vue 3 设计,提供简洁的 API 和强大的 TypeScript 支持。其核心组件包括: • Store:状态存储容器…...
YOLO旋转目标检测之ONNX模型推理
YOLO旋转检测相较于目标检测而言,其只是最后的输出层网络发生了改变,一个最明显的区别便是:目标检测的检测框是xywh,而旋转检测则为xywha,其中,这个a代表angle,即旋转角度,其余的基本…...
C++八股--three day --设计模式之单例和工厂
对于C编程中的思想,最常见的就是考察设计模式了 那么我们在面试中常考的设计模式包含以下几种:单例模式, 接下来我们按顺序介绍 1.单例模式: 一个类只能创建一个实例:常应用于日志模块,数据库模块 …...
GAMES202-高质量实时渲染(Assignment 2)
目录 作业介绍环境光贴图预计算传输项的预计算Diffuse unshadowedDiffuse shadowedDiffuse Inter-reflection(bonus) 实时球谐光照计算 GitHub主页:https://github.com/sdpyy1 作业实现:https://github.com/sdpyy1/CppLearn/tree/main/games202 作业介绍 物体在不同…...
一、Shell 脚本基础
一、Shell 简介 1.Shell 的定义与作用 Shell,通常被称为命令行解释器 (Command Line Interpreter),是用户 👤 与 Linux/Unix 操作系统内核进行交互 ↔️ 的“桥梁” 🌉。它扮演着翻译官 🗣️ 的角色: 接…...
redis持久化-RDB
redis持久化-RDB 文档 redis单机安装redis常用的五种数据类型redis数据类型-位图bitmapredis数据类型-基数统计HyperLogLogredis数据类型-地理空间GEOredis数据类型-流Streamredis数据类型-位域bitfield 官方文档 官网操作命令指南页面:https://redis.io/docs/l…...
经典算法 石子合并问题
石子合并问题 问题描述 在一个园形操场的四周摆放N堆石子,现要将石子有次序地合并成一堆.规定每次只能选相邻的2堆合并成新的一堆,并将新的一堆的石子数,记为该次合并的得分。试设计出一个算法,计算出将N堆石子合并成1堆最大得分和最小得分。 输入描述…...
2025A卷华为OD机试真题-数组二叉树(C++/Java/Python)-100分
2025华为OD机试题库-(2025A卷+E卷+D卷)-(JAVA、Python、C++) 目录 题目描述 输入描述 输出描述 示例 1 示例 2 解题思路 代码 c++ java python 题目描述 二叉树也可以用数组来存储,给定一个数组,树的根节点的值储存在下标1,对于储存在下标n的节点,他的左子节点…...
NHANES指标推荐:TyG指数
文章题目:Association between the Triglyceride-glucose index and fragility fractures among US adults: insights from NHANES DOI:10.1186/s13098-025-01669-w 中文标题:美国成年人甘油三酯-葡萄糖指数与脆性骨折之间的关联:…...
文件操作--文件下载读取漏洞
本文主要内容 文件下载 产生 任意语言代码下载功能函数 检测 白盒 代码审计 黑盒 漏扫工具、公开漏洞、手工看参数值及功能点(资源下载) 利用 常见文件 后台首页日志等可见文件 敏感文件 数据库配置文件、各种接口文件、密匙…...
4.0/Q2,Charls最新文章解读
文章题目:The nonlinear association of ratio of total cholesterol to high density lipoprotein with cognition ability: evidence from a community cohort in China DOI:10.3389/fnut.2025.1525348 中文标题:总胆固醇与高密度脂蛋白比值…...
Linux-常用监控工具
以下是对 Linux 系统中常用监控工具(netstat、ss、dmesg)的系统性介绍,涵盖其核心功能、典型用法及实际应用场景,帮助您分析系统状态和内核参数调整后的效果: 1. netstat -s:网络协议栈统计监控 功能 net…...
【HarmonyOS Next】地图使用详解(三)标点定位问题
背景 在使用geoLocationManager的getCurrentLocation方法获得的用户定位经纬度的坐标系为 WGS84 ,但是mapkit使用的是GCJ02坐标系。因此,我们在使用获取用户经纬度然后直接生成标记时,会出现坐标偏移问题。如下: 解决方案 使用…...
Linux运维中常用的磁盘监控方式
在Linux运维中,磁盘监控是一项关键任务,因为它能帮助我们预防磁盘空间不足或性能问题导致的服务中断或数据丢失。让我们来看看有哪些常用的磁盘监控方法吧! 1. 查看磁盘使用情况(df命令) df命令用于显示文件系统的…...
前端面经-VUE3篇--vue3基础知识(二)计算属性(computed)、监听属性(Watch)
一、计算属性(computed) 计算属性(Computed Properties)是 Vue 中一种特殊的响应式数据,它能基于已有的响应式数据动态计算出新的数据。 计算属性有以下特性: 自动缓存:只有当它依赖的响应式数据发生变化时ÿ…...
双向链表详解
一、双向链表介绍 二、实现双向链表 1.定义双向链表的结构 2.双向链表的初始化 3.双向链表的尾插 4.双向链表的头插 5.双向链表的打印 6.双向链表的尾删 7.双向链表的头删 8.查找指定位置的数据 9.在指定位置之后插入数据 10.删除指定位置的数据 11.链表的销毁 三、…...
基于SpringBoot+Vue实现的电影推荐平台功能一
一、前言介绍: 1.1 项目摘要 2023年全球流媒体用户突破15亿,用户面临海量内容选择困难,传统推荐方式存在信息过载、推荐精准度低等问题。传统推荐系统存在响应延迟高(平均>2s)。随着互联网的快速发展,…...
预订接口优化:使用本地消息表保证订单生成、库存扣减的一致性
🎯 本文介绍了一种优化预订接口的方法,通过引入本地消息表解决分布式事务中的最终一致性问题。原先的实现是在一个事务中同时扣减库存和创建订单,容易因网络不稳定导致数据不一致。改进后的方法将业务操作和消息发送封装在本地事务中…...
深度学习与 PyTorch 基础
笔记 1 深度学习简介 1.1 深度学习概念 深度学习是机器学习的一类算法, 以人工神经网络为结构, 可以实现自动提取特征 深度学习核心思想是人工神经网络为结构, 自动提取特征 1.2 深度学习特点 自动提取特征 解释性差 大量数据和高性能计算能力 非线性转换(引入非线性因…...
libevent库详解:高性能异步IO的利器
目录 一、libevent 简介 主要特点: 二、事件模型原理 1. event_base 2. event 3. evconnlistener(TCP监听器) 4. bufferevent 简化流程如下: 三、libevent 使用示例 1. 创建事件主循环 2. 创建监听器(TCP&a…...
第一章:A Primer on Memory Consistency and Cache Coherence - 2nd Edition
引言: 许多现代计算机系统,包括同构和异构架构的系统,都在硬件层面支持共享内存。在共享内存系统中,每个处理器核心都可以对单一的共享地址空间进行读写操作。对于共享内存计算机而言,内存一致性模型定义了其内存系统在…...
NVIDIA Omniverse在数字孪生中的算力消耗模型构建方法
引言:虚拟实验室的算力经济学 在高校虚拟实验室建设中,数字孪生系统的实时物理仿真精度与算力成本之间存在显著矛盾。以H800 GPU集群为例,单个8卡节点每秒可处理2.3亿个物理粒子交互,但若未建立精准的算力消耗模型,资…...
C++ 动态内存管理详讲
1. 四个全局函数的定义与作用 这四个函数只负责空间的开辟和释放,不会调构造和析构 (1) ::operator new cpp void* operator new(size_t size); // 全局版本 功能:分配 size 字节的未初始化内存。 底层实现:调用 malloc(size)。 调用场…...
纹理对象创建
纹理对象通俗点就是贴图,像游戏的皮肤什么就是纹理。常间的结构就是激活纹理单元(0-15有16个),将纹理对象挂在纹理单元上,纹理采样器需要采哪个样品就与哪个单元挂钩就行了,加载纹理对象需要用到stb_image库…...
如何利用dify 生成Fine‑tune 需要的Alpaca 格式数据
如果你选择llamafactory 格式进行微调,它只是格式是Alpaca格式,dify 的agent dsl 如下,你可以导入本地的dify 或者导入cloud 版本的;测试版本是0.1.5 app:description: 上传文件,基于文件内容,使用 Silico…...
软件第三方测试:关键部分、意义、流程及方法全解析?
软件第三方测试是保障软件质量的关键部分,它由专业的机构来开展,这个机构不隶属于开发方和使用方,能以客观公正的视角找出软件问题。 测试意义 软件第三方测试意义重大,它依靠专业技术,依照严格流程,对软…...
贪心算法解决会议安排问题
文章目录 前言 一、什么是贪心算法? 贪心算法的基本概念:贪心算法并不从整体最优上加以考虑,所做的选择只是在某种意义上的局部最优选择。 二、会议安排题目 1.题目理解 2.思路剖析 总结 前言 本文将主要介绍贪心算法需要注意的地方以…...
高露洁牙膏是哪个国家的品牌?高露洁牙膏哪一款最好?
高露洁是来自于美国一个比较有知名度的品牌,在1806年的时候创立。总部是在美国纽约公园大道,在1873年时,高露洁就已经开始销售罐装牙膏。 在1896年时期推出可折叠管牙膏,在口腔护理产品发展的过程中拥有着不容忽视的地位。在1992…...
lin接口在线计算数据帧的校验位
在线校验计算链接:https://linchecksumcalculator.machsystems.cz/ 插入图片:...
Linux-07-Shell
一、Shell概述: Shell是一个命令行解释器,它接受应用程序/用户命令,然后调用操作系统内核 二、Shell中的变量: 1.系统预定义的变量: $HOME,$PWD,$SHELL,$USER等 2.用户自定义的变量: (1).基本语法: 定义变量:变量名变量值,注意前后不能…...
【云盘】使用阿里云盘托管项目大文件
【云盘】使用阿里云盘托管项目大文件 由于经常需要切换服务器运行项目实验,不同服务器在项目实验过程中会产生不同的数据、模型等较大文件,不能像代码那样能够使用git托管,因此考虑使用阿里云盘作为”第三方平台“托管这些大文件。 一、使用…...
《缓存策略:移动应用网络请求的“效能密钥” 》
用户体验无疑是重中之重,而网络请求性能,恰似一座桥梁,连接着用户与应用丰富的内容和功能。当网络不佳或者请求频繁时,缓慢的响应速度常常让用户兴致索然,甚至可能导致用户流失。此时,缓存策略就如同一位幕…...
深入解析C++11委托构造函数:消除冗余初始化的利器
一、传统构造函数的痛点 在C11之前,当多个构造函数需要执行相同的初始化逻辑时,开发者往往面临两难选择: class DataProcessor {std::string dataPath;bool verbose;int bufferSize; public:// 基础版本DataProcessor(const std::string&am…...
文章七《深度学习调优与超参数优化》
🚀 文章7:深度学习调优与超参数优化——你的AI模型需要一场"整容手术" 一、模型调优核心策略:像调整游戏装备一样优化模型 1. 学习率调整:掌控训练的"油门踏板" 比喻:把模型训练想象成赛车游戏&…...
python入门(1)变量与输入输出
一、变量 使用规则 变量名值例子 a13变量名规则 变量名可以用大小写字母、数字、下划线。 数字、下划线不可开头 例子 name name1 1name name_first _first 二、输入输出 输出print print(*objects,sep"",end"\n") objects:多个要输出的值 sep:每个…...
藏文情感分析器入门学习实践
🎯 项目目标: 输入一段藏文短句。自动分析这句话的情感倾向:积极(正面)/消极(负面)/中立。 🔍 技术原理简介 情感分析是什么? 情感分析(Sentiment Analysi…...
爱胜品ICSP YPS-1133DN Plus黑白激光打印机报“自动进纸盒进纸失败”处理方法之一
故障现象如下图提示: 用户的爱胜品ICSP YPS-1133DN Plus黑白激光打印机在工作过程中提示自动进纸盒进纸失败并且红色故障灯闪烁; 给出常见故障一般处理建议如下: 当您的爱胜品ICSP YPS-1133DN Plus 黑白激光打印机出现“自动进纸盒进纸失败”…...
数据库索引重建与优化操作在数据库性能维护与数据更新频繁场景下的应用
数据库索引重建与优化操作在数据库性能维护与数据更新频繁场景下的应用 数据库索引的作用与重要性 索引的定义与作用 数据库索引是一种特殊的数据结构,用于加快数据库表的数据检索速度。它类似于书籍的目录,能够快速定位到需要的数据页,而不必…...
前端应用开发技术历程的简要概览
前端应用开发技术详解 一、萌芽期(1990s - 2004) 技术特征 HTML 3.2 / HTML 4.01 是主流版本。 样式用 CSS1/CSS2,但大部分样式写在 <style> 标签甚至行内。 动态效果主要通过 JavaScript 控制 DOM,兼容性极差。 代表事…...
SPOJ 11576 TRIP2 - A Famous King’s Trip 【Tarjan+欧拉回路】
自我吐槽 (哭 题目传送门 SPOJ 洛谷 题目大意 让你在简单无向图上删去2条边,使该图联通并存在欧拉回路 输出字典序最小的一对边 思路 考虑到存在欧拉回路的充要条件,即 i n x ≡ 0 ( m o d 2 ) ∀ i ( 1 ≤ i ≤ n ) in_x\equiv 0 (\m…...
DeepSeek R1:强化学习范式的推理强化模型
定位与目标 DeepSeek R1 的推出并非 DeepSeek V3 的简单迭代,而是一次在训练范式上的大胆探索。与传统大模型主要依靠监督微调(SFT)后进行强化学习不同,R1 将重点放在推理能力和行为对齐上,尝试通过大规模强化学习直接激发模型的推理潜力。其目标是利用强化学习的反馈机制,…...