当前位置: 首页 > news >正文

【论文阅读】RAG-Reward: Optimizing RAG with Reward Modeling and RLHF

研究背景

  1. 研究问题:这篇文章要解决的问题是如何优化检索增强生成(RAG)系统,特别是通过奖励建模和人类反馈强化学习(RLHF)来提高大型语言模型(LLMs)在RAG任务中的效果。
  2. 研究难点:该问题的研究难点包括:如何定义评估生成质量的指标,如何构建高质量的偏好数据集,以及如何有效地利用LLMs进行自动标注。
  3. 相关工作:该问题的研究相关工作有:HH-RLHF、PRM800K、RAG-Truth等,这些工作分别评估语言的帮助性、无害性、逐步正确性以及检测RAG系统中的幻觉现象。

研究方法

这篇论文提出了RAG-Reward,一种用于优化RAG的数据集和方法。具体来说,

  1. 数据集构建:首先,从QA、data2Text和Summary三个领域选择了现有的RAG数据集,包括WebGLM、Yelp和XSum。然后,使用12个开源和专有LLMs(如GPT-4和Llama-3系列)生成多样化的响应。对于每个数据集中的每个提示,随机选择两个LLMs的响应进行比较。

  1. 自动标注:使用GPT-4o作为评判者,根据四个关键指标(幻觉、全面性、冗长性和归因)对生成的响应进行比较。这些指标由人类专家精心选择和定义。通过多数投票法构建偏好对,最终收集了35K的高质量训练样本。

  2. 奖励建模采用Bradley-Terry奖励模型来学习偏好信号。具体来说,使用Llama-3.1-8B-Instruct作为基础模型进行训练,学习率为2e-6,全局批量大小为64,最大长度为4096,训练1个epoch。

  3. 强化学习使用RAFT算法进行偏好对齐。RAFT利用reward model从N个候选响应中选择得分最高的响应,并在该响应集上微调策略模型。实验中设置N=16,初始策略模型为Llama-3.2-3B-Instruct和Mistral-7B-Instruct-v0.1,微调学习率为5e-6,训练1个epoch。

实验设计

  1. 数据收集:从WebGLM、Yelp和XSum数据集中收集了11000、12000和12000个训练样本,分别用于问答、数据到文本和总结任务(这35K用于训练reward model)。每个数据集还包含500个测试样本。
  2. 实验设计:使用35K偏好对进行奖励建模,并创建一个3K样本的开发集用于RLHF训练期间的采样和学习。使用1.5K样本的保留测试集评估策略和奖励模型的性能。
  3. 样本选择:对于每个问题和其对应的参考,随机选择两个LLMs的生成响应形成偏好对。
  4. 参数配置:奖励模型使用Llama-3.1-8B-Instruct进行训练,学习率为2e-6,全局批量大小为64,最大长度为4096,训练1个epoch。RAFT算法中,初始策略模型为Llama-3.2-3B-Instruct和Mistral-7B-Instruct-v0.1,微调学习率为5e-6,训练1个epoch。

结果与分析

  1. 奖励模型性能:奖励模型在三个任务上的准确率分别为WebGLM 84.8%、Yelp 88.2%、XSum 78.4%,平均准确率为83.8%。这表明奖励模型能够有效地对齐生成质量。

        2. 偏好对齐:使用RAFT算法进行偏好对齐后,策略模型在三个任务上的胜率分别为  WebGLM 66.8%、Yelp 54.4%、XSum 68.2%,平均胜率为63.1%。这表明对齐训练显著提高了策略模型的性能。

        3. 自我评估:随机选择1000个样本进行重新评估,结果显示GPT-4o的自我评估一致性率超过90%,表明标注数据集的高质量和稳定性。

        4. 人类评估:随机选择100个样本进行人类评估,结果显示人类评估与GPT-4o标注数据集的一致性率为71%,表明AI辅助标注在多个RAG任务中的潜力。

总体结论

这篇论文介绍了RAG-Reward,一个高质量偏好数据集,旨在优化检索增强生成(RAG)系统。通过自动AI标注管道和GPT-4o评估,构建了涵盖多个领域的多样化基准数据集。实验结果表明,RAG-Reward在奖励建模和强化学习中表现出色,验证了其有效性和数据集质量。

优点与创新

  1. 引入RAG场景的奖励建模方法:论文提出了一种针对RAG场景的奖励建模方法,并发布了一个高质量的35K偏好标注数据集,以支持未来的研究。
  2. 综合评估指标:定义了一套综合评估RAG质量的指标,并指导数据集构建过程。
  3. 广泛的实验验证:进行了广泛的实验来评估奖励模型,训练策略模型,并展示了该方法在提高RAG性能方面的有效性。
  4. 自动化的LLM注释管道:开发了一种新颖的自动化LLM注释管道,生成高质量的偏好数据集RAG-Reward。
  5. 多领域数据集:数据集跨越多个领域,包括问答、数据到文本和摘要,形成了一个大规模且多样化的基准。
  6. 高一致性率:通过自我评估和人类评估,验证了GPT-4o生成的标签具有高度一致性,确保了数据集的质量。

不足与反思

  1. 现有奖励模型的局限性:许多现有的奖励模型在评估聊天、安全和推理任务时表现出色,但在RAG场景中的整体准确性低于80%,显示出显著差距。
  2. 领域特定训练数据的必要性:当前主要在推理任务上训练的奖励模型可能无法有效泛化到评估RAG特定的生成内容,表明领域特定的训练数据对于缩小这一差距和提高RAG性能评估至关重要。

关键问题及回答

问题1:RAG-Reward数据集的构建过程中,如何选择和生成多样化的响应?

在RAG-Reward数据集的构建过程中,研究团队采用了多种策略来确保生成的响应具有多样性和高质量。具体步骤如下:

  1. 数据集选择:选择了三个现有的RAG数据集,包括WebGLM(问答)、Yelp(数据到文本)和XSum(总结)。
  2. 模型选择:使用了12个开源和专有的LLMs,包括GPT-4和Llama-3系列,以确保生成的响应具有多样性。
  3. 响应生成:对于每个数据集中的每个提示,随机选择两个LLMs生成响应。这样可以确保每个提示都有两种不同的生成结果,从而增加数据的多样性。
  4. 评判标准:使用GPT-4o作为评判者,根据四个关键指标(幻觉、全面性、冗长性和归因)对生成的响应进行比较,构建偏好对。

通过这些策略,RAG-Reward数据集成功地收集了35K高质量的训练样本,确保了数据集的多样性和可靠性。

问题2:RAG-Reward数据集的标注方法是如何确保标注的一致性和质量的?

RAG-Reward数据集的标注方法通过以下步骤确保标注的一致性和质量:

  1. 使用GPT-4o进行标注:研究团队使用GPT-4o作为主要标注工具,通过提示GPT-4o比较两个生成的响应,并根据四个关键指标(幻觉、全面性、冗长性和归因)选择偏好响应
  2. 多轮标注:为了确保标注的一致性,研究团队设计了多轮标注流程。具体来说,对于每个数据集中的每个提示和对应的偏好对,GPT-4o会被要求重新评估其之前的判断,确保其选择的响应在所有指标上都是一致的。
  3. 自我评估:研究团队还进行了自我评估,随机选择1000个样本进行重新评估,测量GPT-4o在不同任务上的标注一致性。结果显示,整体一致性率超过90%,表明GPT-4o能够提供稳定且一致的标注结果。
  4. 人工评估:为了进一步验证标注质量,研究团队还进行了人工评估。随机选择100个样本,由标注员根据相同的标准进行评估。结果显示,人工评估与GPT-4o标注的一致性率为71%,展示了AI辅助标注在多个RAG任务中的潜力。

通过这些方法,RAG-Reward数据集确保了标注的高质量和一致性,为后续的奖励建模和强化学习提供了可靠的基础。

问题3:RAG-Reward数据集在奖励建模和偏好对齐实验中的表现如何?

RAG-Reward数据集在奖励建模和偏好对齐实验中表现出色,具体结果如下:

  1. 奖励模型性能:奖励模型在三个任务上的准确率分别为WebGLM 84.8%、Yelp 88.2%、XSum 78.4%,平均准确率为83.8%。这表明奖励模型能够有效地对齐预期标准,区分选定的响应和被拒绝的响应。
  2. 偏好对齐效果:经过一次RAFT迭代后,策略模型在三个任务上的胜率分别为WebGLM 66.8%、Yelp 54.4%、XSum 68.2%,平均胜率为63.1%。此外,GPT-4o也倾向于选择后训练策略模型生成的响应,平均胜率为66.2%。这些结果表明,RAFT算法能够有效地利用奖励模型进行偏好对齐,显著提升策略模型的性能。

总体而言,RAG-Reward数据集在奖励建模和偏好对齐实验中表现出色,验证了其在提高RAG系统性能方面的潜力。研究结果为未来的RAG系统评估和生成提供了新的思路和工具。

问题4: Reward模型和Policy模型分别是如何进行测评的? 

奖励模型(Reward Model)的评估:

  1. 训练:奖励模型通过偏好数据集进行训练,该数据集由多个候选响应对组成,每个对包含一个被选中的响应和一个被拒绝的响应。奖励模型的目标是学习一个能够区分这些响应的奖励函数。

  2. 评估

  • 准确性(Accuracy):在测试阶段,奖励模型为每对候选响应分配分数,并计算其准确性。准确性: prefer response score > reject response score, scores由reward模型给出。
  • 跨任务一致性:奖励模型在多个任务上进行评估,以确保其在不同场景下的泛化能力。

策略模型(Policy Model)的评估:

  1. 基线模型:首先,使用未经微调的策略模型生成响应。

  2. 微调:使用奖励模型和强化学习算法(如RAFT)对策略模型进行微调。微调的目标是提高策略模型生成高质量响应的能力。

  3. 评估

  • 胜率(Win Rate):在测试集上,裁判对SFT后和SFT前模型的回答进行选择。胜率定义为SFT后策略模型生成的响应被选中的比例。裁判:reward模型、GPT-4o、人类裁判。
  • 一致性:通过比较人类评估者和奖励模型的评估结果来评估一致性,以确保奖励模型的评估结果与人类偏好一致。

相关文章:

【论文阅读】RAG-Reward: Optimizing RAG with Reward Modeling and RLHF

研究背景 研究问题:这篇文章要解决的问题是如何优化检索增强生成(RAG)系统,特别是通过奖励建模和人类反馈强化学习(RLHF)来提高大型语言模型(LLMs)在RAG任务中的效果。研究难点&…...

新一代搜索引擎,是 ES 的15倍?

Manticore Search介绍 Manticore Search 是一个使用 C 开发的高性能搜索引擎,创建于 2017 年,其前身是 Sphinx Search 。Manticore Search 充分利用了 Sphinx,显着改进了它的功能,修复了数百个错误,几乎完全重写了代码…...

鸿蒙物流项目之实现广告页

目录: 1、广告页布局2、倒计时的实现 1、广告页布局 鸿蒙官方有提供实现广告页的方法,这里我们不使用,使用自定义广告页。 2、倒计时的实现 在页面加载时实现倒计时功能,在页面倒计时为0时跳转其他页面后销毁页面后同时也要销毁定…...

自制虚拟机(C/C++)(二、分析引导扇区,虚拟机读二进制文件img软盘)

先修复上一次的bug&#xff0c;添加新指令&#xff0c;并增加图形界面 #include <graphics.h> #include <conio.h> #include <windows.h> #include <commdlg.h> #include <iostream> #include <fstream> #include <sstream> #inclu…...

S4 HANA给科目分配允许记账的税码

本文主要介绍在S4 HANA OP中给科目分配允许记账的税码相关设置。具体请参照如下内容&#xff1a; 1. 给科目分配允许记账的税码 以上配置定义了总账科目可以使用什么税码进行记账。通常在科目主数据中会明确总账科目的“Tax Category”来请明确总账科目可以使用什么类型的税码…...

【LeetCode 刷题】回溯算法-组合问题

此博客为《代码随想录》二叉树章节的学习笔记&#xff0c;主要内容为回溯算法组合问题相关的题目解析。 文章目录 77. 组合216.组合总和III17.电话号码的字母组合39. 组合总和40. 组合总和 II 77. 组合 题目链接 class Solution:def combinationSum3(self, k: int, n: int) …...

Automatic Prefix Caching

APC技术&#xff0c;遇到新prompt和老prompt前缀完全相等的&#xff0c;则复用老prompt的KV cache&#xff0c;避免重新计算。 VLLM代码实例&#xff1a; # set enable_prefix_cachingTrue to enable APC llm LLM(modellmsys/longchat-13b-16k,enable_prefix_cachingTrue ) 应…...

DDD - 领域事件_解耦微服务的关键

文章目录 Pre领域事件的核心概念领域事件的作用领域事件的识别领域事件的技术实现领域事件的运行机制案例领域事件驱动的优势 Pre DDD - 微服务设计与领域驱动设计实战(中)_ 解决微服务拆分难题 EDA - Spring Boot构建基于事件驱动的消息系统 领域事件的核心概念 领域事件&a…...

吴晓波 历代经济变革得失@简明“中国经济史” - 读书笔记

目录 《历代经济变革得失》读书笔记一、核心观点二、主要内容&#xff08;一&#xff09;导论&#xff08;二&#xff09;春秋战国时期&#xff08;三&#xff09;汉代&#xff08;四&#xff09;北宋&#xff08;五&#xff09;明清时期&#xff08;六&#xff09;近现代&…...

Ubuntu下的Doxygen+VScode实现C/C++接口文档自动生成

Ubuntu下的DoxygenVScode实现C/C接口文档自动生成 Chapter1 Ubuntu下的DoxygenVScode实现C/C接口文档自动生成1、 Doxygen简介1. 安装Doxygen1&#xff09;方法一&#xff1a;2&#xff09;方法二&#xff1a;2. doxygen注释自动生成插件3. doxygen注释基本语法4. doxygen的生成…...

论文阅读:Realistic Noise Synthesis with Diffusion Models

这篇文章是 2025 AAAI 的一篇工作&#xff0c;主要介绍的是用扩散模型实现对真实噪声的仿真模拟 Abstract 深度去噪模型需要大量来自现实世界的训练数据&#xff0c;而获取这些数据颇具挑战性。当前的噪声合成技术难以准确模拟复杂的噪声分布。我们提出一种新颖的逼真噪声合成…...

【Linux系统】计算机世界的基石:冯诺依曼架构与操作系统设计

文章目录 一.冯诺依曼体系结构1.1 为什么体系结构中要存在内存&#xff1f;1.2 冯诺依曼瓶颈 二.操作系统2.1 设计目的2.2 系统调用与库函数 一.冯诺依曼体系结构 冯诺依曼体系结构&#xff08;Von Neumann Architecture&#xff09;是计算机的基本设计理念之一&#xff0c;由…...

p1044 栈

两种递推细节不同 1,将1和n在序列末尾的情况单独放出来处理&#xff0c;因为dp[0]0&#xff1b; 2,将所有情况统一处理&#xff0c;这种情况就要要求dp[1]1; 这里的n在解题中可以看做是元素数量 思路是&#xff0c;根据出栈最后一个元素,统计它前面的元素数量的输出序列数和…...

x86-64数据传输指令

关于汇编语言一些基础概念的更详细的介绍&#xff0c;可移步MIPS指令集&#xff08;一&#xff09;基本操作_mips指令 sw-CSDN博客 该指令集中一个字2字节。 该架构有16个64位寄存器&#xff0c;名字都以%r开头&#xff0c;每个寄存器的最低位字节&#xff0c;低1~2位字节&…...

C++11新特性之lambda表达式

1.介绍 C11引入了lambda表达式。lambda表达式提供一种简洁的方式来定义匿名函数对象&#xff0c;使得在需要临时定义一个函数时非常方便。 2.lambda表达式用法 lambda表达式的基本用法为&#xff1a; [捕获列表]&#xff08;参数列表&#xff09;->返回类型 { 函数体 …...

51单片机密码锁代码

基于液晶屏外设写的. main.c #include <REGX52.H> #include "LCD1602.h" #include "MatrixKey.h" #include "Sleep.h" long password1234; long resNum0; int status0,res0,k1500; long birth2005; void main(){LCD_Init();LCD_ShowStr…...

如何使用C#的using语句释放资源?什么是IDisposable接口?与垃圾回收有什么关系?

在 C# 中,using语句用于自动释放实现了IDisposable接口的对象所占用的非托管资源,如文件句柄、数据库连接、图形句柄等。其使用方式如下: 基础用法 声明并初始化资源对象:在using关键字后的括号内声明并初始化一个实现了IDisposable接口的对象。使用资源:在using语句块内…...

【Unity3D】实现横版2D游戏——单向平台(简易版)

目录 问题 项目Demo直接使用免费资源&#xff1a;Hero Knight - Pixel Art &#xff08;Asset Store搜索&#xff09; 打开Demo场景&#xff0c;进行如下修改&#xff0c;注意Tag是自定义标签SingleDirCollider using System.Collections; using System.Collections.Generic;…...

BW AO/工作簿权限配置

场景&#xff1a; 按事业部配置工作簿权限&#xff1b; 1、创建用户 事务码&#xff1a;SU01&#xff0c;用户主数据的维护&#xff0c;可以创建、修改、删除、锁定、解锁、修改密码等 用户设置详情页 2、创建权限角色 用户的权限菜单是通过权限角色分配来实现的 2.1、自定…...

TensorFlow 示例摄氏度到华氏度的转换(一)

TensorFlow 实现神经网络模型来进行摄氏度到华氏度的转换&#xff0c;可以将其作为一个回归问题来处理。我们可以通过神经网络来拟合这个简单的转换公式。 1. 数据准备与预处理 2. 构建模型 3. 编译模型 4. 训练模型 5. 评估模型 6. 模型应用与预测 7. 保存与加载模型 …...

一文讲解JVM中的G1垃圾收集器

接上一篇博文&#xff0c;这篇博文讲下JVM中的G1垃圾收集器 G1在JDK1.7时引入&#xff0c;在JDK9时取代了CMS成为默认的垃圾收集器&#xff1b; G1把Java堆划分为多个大小相等的独立区域Region&#xff0c;每个区域都可以扮演新生代&#xff08;Eden和Survivor&#xff09;或老…...

图书管理系统 Axios 源码__获取图书列表

目录 核心功能 源码介绍 1. 获取图书列表 技术要点 适用人群 本项目是一个基于 HTML Bootstrap JavaScript Axios 开发的图书管理系统&#xff0c;可用于 添加、编辑、删除和管理图书信息&#xff0c;适合前端开发者学习 前端交互设计、Axios 数据请求 以及 Bootstrap 样…...

mac和linux传输文件

1、使用scp命令传输 # 上传 wenqiangwq ~ % scp -pr -P 22 nginx.yaml root192.168.1.15:/tmp/ root192.168.1.15s password: nginx.yaml 100% 1736 332.4KB/s 00:00# 下载 wenqiangwq ~ % scp -pr -P 22 root192.168.1.15:/tmp/ngin…...

[CVPR 2024] AnyDoor: Zero-shot Object-level Image Customization

github.com/ali-vilab/AnyDoor.写在前面&#xff1a; 【论文速读】按照#论文十问#提炼出论文核心知识点&#xff0c;方便相关科研工作者快速掌握论文内容。过程中并不对论文相关内容进行翻译。博主认为翻译难免会损坏论文的原本含义&#xff0c;也鼓励诸位入门级科研人员阅读文…...

(动态规划路径基础 最小路径和)leetcode 64

视频教程 1.初始化dp数组&#xff0c;初始化边界 2、从[1行到n-1行][1列到m-1列]依次赋值 #include<vector> #include<algorithm> #include <iostream>using namespace std; int main() {vector<vector<int>> grid { {1,3,1},{1,5,1},{4,2,1}…...

跨组织环境下 MQTT 桥接架构的评估

论文标题 中文标题&#xff1a; 跨组织环境下 MQTT 桥接架构的评估 英文标题&#xff1a; Evaluation of MQTT Bridge Architectures in a Cross-Organizational Context 作者信息 Keila Lima, Tosin Daniel Oyetoyan, Rogardt Heldal, Wilhelm Hasselbring Western Norway …...

2025年1月22日(网络编程 udp)

系统信息&#xff1a; ubuntu 16.04LTS Raspberry Pi Zero 2W 系统版本&#xff1a; 2024-10-22-raspios-bullseye-armhf Python 版本&#xff1a;Python 3.9.2 已安装 pip3 支持拍摄 1080p 30 (1092*1080), 720p 60 (1280*720), 60/90 (640*480) 已安装 vim 已安装 git 学习…...

基于 STM32 的智能电梯控制系统

1. 引言 随着城市化进程的加速&#xff0c;高层建筑日益增多&#xff0c;电梯作为垂直交通工具的重要性愈发凸显。传统电梯控制系统在运行效率、安全性和智能化程度上已难以满足现代需求。智能电梯控制系统能够实时监测电梯的运行状态、乘客需求&#xff0c;并根据这些信息优化…...

使用 Docker(Podman) 部署 MongoDB 数据库及使用详解

在现代开发环境中&#xff0c;容器化技术&#xff08;如 Docker 和 Podman&#xff09;已成为部署和管理应用程序的标准方式。本文将详细介绍如何使用 Podman/Docker 部署 MongoDB 数据库&#xff0c;并确保其他应用程序容器能够通过 Docker 网络成功连接到 MongoDB。我们将逐步…...

npm 和 pip 安装中常见问题总结

安装路径的疑惑&#xff1a;NPM 和 PIP 的安装机制 NPM 安装路径规则&#xff1a; 依赖安装在项目目录下&#xff1a; 当你运行 npm install --save-dev jest&#xff0c;它会在当前目录&#xff08;例如 F:\&#xff09;下创建一个 node_modules 文件夹&#xff0c;把 jest 安…...

golang面试题

目录 go版本新增功能 Go 1.11 Go 1.18 Go 1.5 go关键字 &#xff1a; 1. 用于声明的关键字 2. 控制流关键字 3. 包相关关键字 4. 并发相关关键字 5. 异常处理关键字 6. 接口和类型断言关键字 go数据类型&#xff1a; 复合数据类型 引用数据类型 接口类型 GC垃…...

基于UKF-IMM无迹卡尔曼滤波与交互式多模型的轨迹跟踪算法matlab仿真,对比EKF-IMM和UKF

目录 1.程序功能描述 2.测试软件版本以及运行结果展示 3.核心程序 4.本算法原理 5.完整程序 1.程序功能描述 基于UKF-IMM无迹卡尔曼滤波与交互式多模型的轨迹跟踪算法matlab仿真,对比EKF-IMM和UKF。 2.测试软件版本以及运行结果展示 MATLAB2022A版本运行 3.核心程序 .…...

Install Python

目录 1.Install Python 1.安装Python 3 2.在Windows上安装Python 3.在Mac上安装Python 4.在Linux上安装Python 5.运行Python 2.Python解释器 1.CPython 2.IPython 3.PyPy 4.Jython 5.IronPython 6.小结 1.Install Python 因为Python是跨平台的&#xff0c;它可以…...

云计算部署模式全面解析

目录 引言公有云私有云混合云三种部署模式的对比选择建议未来趋势结语 1. 引言 随着云计算技术的快速发展,企业在选择云部署模式时面临着多种选择。本文将深入探讨云计算的三种主要部署模式:公有云、私有云和混合云,帮助读者全面了解它们的特点、优势及适用场景。 © iv…...

tomcat核心组件及原理概述

目录 1. tomcat概述 1.1 概念 1.2 官网地址 2. 基本使用 2.1下载 3. 整体架构 3.1 核心组件 3.2 从web.xml配置和模块对应角度 3.3 如何处理请求 4. 配置JVM参数 5. 附录 1. tomcat概述 1.1 概念 什么是tomcat Tomcat是一个开源、免费、轻量级的Web服务器。 Tomca…...

GIS教程:全国数码商城系统

文章目录 注册高德地图API普通网页中测试地图加载地图添加标记地图配置点标记 Marker添加弹框创建vue项目并添加高德地图创建项目加载高德地图项目首页布局封装axios和配置代理服务器获取城市热门信息获取城市区县信息获取区县商城信息获取指定城市区县的经纬度坐标将地图缩放到…...

Level DB --- table.format

table.format是Level DB中table序列化、反序列化重要的辅助类。它用来定义序列化、反序列化的核心结构体和操作实现。 BlockHandle table.format中的BlockHandle类主要用来记录当前block在总的序列化中的offset位置&#xff0c;以及当前block的size&#xff0c;这里面的Block…...

《编写可读代码的艺术》读书笔记

1. 写在前面 借着春节放假的几天&#xff0c; 读了下《编写可读代码的艺术》这本书&#xff0c; 这本书不是很长&#xff0c;主要关注代码的一些编写细节&#xff0c;比如方法命名&#xff0c;函数命名&#xff0c;语句组织&#xff0c;任务分解等&#xff0c; 旨在让写的代码…...

(9)下:学习与验证 linux 里的 epoll 对象里的 EPOLLIN、 EPOLLHUP 与 EPOLLRDHUP 的不同。小例子的实验

&#xff08;4&#xff09;本实验代码的蓝本&#xff0c;是伊圣雨老师里的课本里的代码&#xff0c;略加改动而来的。 以下是 服务器端的代码&#xff1a; 每当收到客户端的报文时&#xff0c;就测试一下对应的 epoll 事件里的事件标志&#xff0c;不读取报文内容&#xff0c;…...

MySQL基础-多表查询

多表查询-多表关系 多表查询-概述 例如执行下行sql语句就会出现笛卡尔积&#xff1a; select *from emp,dept; --消除笛卡尔积 select * from emp,dept where emp.dept_id dept.id; 多表查询-查询分类 多表查询-连接查询-内连接 --内连接演示 --1.查询每一个员工的姓名,及关…...

RK3568 opencv播放视频

文章目录 一、opencv相关视频播放类1. `cv::VideoCapture` 类主要构造方法:主要方法:2. 视频播放基本流程代码示例:3. 获取和设置视频属性4. 结合 FFmpeg 使用5. OpenCV 视频播放的局限性6. 结合 Qt 实现更高级的视频播放总结二、QT中的代码实现一、opencv相关视频播放类 在…...

C++中的类型转换

文章目录 一、概述二、隐式类型转换&#xff08;Implicit Conversion&#xff09;三、显式类型转换&#xff08;Explicit Conversion&#xff09;四、C 风格类型转换 一、概述 C 提供了多种类型转换&#xff08;Type Conversion&#xff09;方式&#xff0c;以便在不同类型的数…...

day7手机拍照装备

对焦对不上&#xff1a;1、光太暗&#xff1b;2、离太近&#xff1b;3、颜色太单一没有区分点 滤镜可以后期P 渐变灰滤镜&#xff1a;均衡色彩&#xff0c;暗的地方亮一些&#xff0c;亮的地方暗一些 中灰滤镜&#xff1a;减少光差 手机支架&#xff1a;最基本70cm即可 手…...

Joplin 插件在Vscode中无法显示图片

1.问题 在vscode里面装好joplin插件之后&#xff0c;无法显示图片内容。 粘贴的图片可以再vscode中显示&#xff0c;无法再joplin客户端显示 2.解决方法 这种情况是因为和vscode自带的MD编辑器的预览模式有冲突&#xff0c;或者没用通过专用方式上传图片。 方法一&#xff…...

ReentrantReadWriteLock源码分析

文章目录 概述一、状态位设计二、读锁三、锁降级机制四、写锁总结 概述 ReentrantReadWriteLock&#xff08;读写锁&#xff09;是对于ReentranLock&#xff08;可重入锁&#xff09;的一种改进&#xff0c;在可重入锁的基础上&#xff0c;进行了读写分离。适用于读多写少的场景…...

ChatGPT-4o和ChatGPT-4o mini的差异点

在人工智能领域&#xff0c;OpenAI再次引领创新潮流&#xff0c;近日正式发布了其最新模型——ChatGPT-4o及其经济实惠的小型版本ChatGPT-4o Mini。这两款模型虽同属于ChatGPT系列&#xff0c;但在性能、应用场景及成本上展现出显著的差异。本文将通过图文并茂的方式&#xff0…...

小程序设计和开发:什么是竞品分析,如何进行竞品分析

一、竞品分析的定义 竞品分析是指对竞争对手的产品进行深入研究和比较&#xff0c;以了解市场动态、发现自身产品的优势和不足&#xff0c;并为产品的设计、开发和营销策略提供参考依据。在小程序设计和开发中&#xff0c;竞品分析可以帮助开发者了解同类型小程序的功能、用户体…...

计算机网络之计算机网络的分类

计算机网络可以根据不同的角度进行分类&#xff0c;以下是几种常见的分类方式&#xff1a; 1. 按照规模和范围&#xff1a; 局域网&#xff08;LAN&#xff0c;Local Area Network&#xff09;&#xff1a;覆盖较小范围&#xff08;例如一个建筑物或校园&#xff09;&#xf…...

什么是门控循环单元?

一、概念 门控循环单元&#xff08;Gated Recurrent Unit&#xff0c;GRU&#xff09;是一种改进的循环神经网络&#xff08;RNN&#xff09;&#xff0c;由Cho等人在2014年提出。GRU是LSTM的简化版本&#xff0c;通过减少门的数量和简化结构&#xff0c;保留了LSTM的长时间依赖…...

ESP32-c3实现获取土壤湿度(ADC模拟量)

1硬件实物图 2引脚定义 3使用说明 4实例代码 // 定义土壤湿度传感器连接的模拟输入引脚 const int soilMoisturePin 2; // 假设连接到GPIO2void setup() {// 初始化串口通信Serial.begin(115200); }void loop() {// 读取土壤湿度传感器的模拟值int sensorValue analogRead…...