当前位置: 首页 > news >正文

【AI论文】作为评判者的感知代理:评估大型语言模型中的高阶社会认知

摘要:评估大型语言模型(LLM)对人类的理解程度,而不仅仅是文本,仍然是一个开放的挑战。 为了弥合这一差距,我们引入了Sentient Agent作为评判者(SAGE),这是一个自动评估框架,用于衡量LLM的高阶社会认知。 SAGE实例化了一个感知代理,该代理在交互过程中模拟了类似人类的情绪变化和内心想法,从而在多轮对话中为测试模型提供了更真实的评估。 在每个转折点,代理都会推理(i)它的情绪如何变化,(ii)它的感受如何,以及(iii)它应该如何回复,从而产生一个数字情绪轨迹和可解释的内心想法。 在100个支持对话场景的实验中,最终的情感得分与巴雷特-伦纳德关系量表(BLRI)的评分和话语层面的同理心指标密切相关,验证了心理保真度。 我们还建立了一个公共感知排行榜,涵盖了18个商业和开源模型,揭示了前沿系统(GPT-4o-Latest,Gemini2.5-Pro)与早期基线之间的巨大差距(高达4倍),这些差距在传统的排行榜(如Arena)中没有反映出来。 因此,SAGE提供了一个有原则、可扩展和可解释的工具,用于跟踪真正善解人意、社交能力强的语言代理的进展。Huggingface链接:Paper page,论文链接:2505.02847

研究背景和目的

研究背景

随着人工智能技术的飞速发展,大型语言模型(LLMs)在自然语言处理领域取得了显著的成就。这些模型不仅能够生成连贯、语法正确的文本,还在许多复杂任务中展现出了强大的能力,如文本摘要、机器翻译、问答系统等。然而,尽管LLMs在文本生成和语言理解方面表现出色,但它们在理解和模拟人类社会认知方面的能力仍然有限。

社会认知是指个体理解他人情感、意图、信念以及社会规范的能力。在人机交互中,社会认知能力尤为重要,因为它直接影响到用户体验和模型的实用性。例如,在情感支持对话、心理咨询、教育辅导等场景中,用户期望模型能够展现出同理心、理解他们的情感状态,并提供恰当的回应。然而,现有的LLMs评估方法主要集中于任务导向的实用性、流畅性和事实性,往往忽视了模型在社交互动中的关系质量和情感理解能力。

为了更全面地评估LLMs的社会认知能力,研究人员开始探索新的评估方法。近年来,“LLM作为法官”(LLM-as-a-Judge)的评估范式逐渐兴起,该范式利用LLM本身作为评估工具,通过静态提示或有限轮次的对话来评估生成文本的质量。然而,这些方法存在局限性,因为它们无法适应对话的动态发展,也无法跟踪用户情感状态的变化。因此,需要一种能够模拟人类情感变化和内心想法,并在多轮对话中提供更真实评估的框架。

研究目的

本研究旨在提出一种名为“感知代理作为法官”(Sentient Agent as a Judge, SAGE)的自动化评估框架,用于衡量LLMs在高阶社会认知方面的能力。SAGE框架通过实例化一个感知代理(Sentient Agent),该代理在交互过程中模拟人类的情感变化和内心想法,从而在多轮对话中为被评估的LLM提供更真实的评估。具体研究目的包括:

  1. 开发自动化评估框架:构建一个能够模拟人类情感变化和内心想法的感知代理,用于在多轮对话中评估LLMs的社会认知能力。
  2. 验证评估有效性:通过实验验证SAGE框架的有效性,确保其评估结果与人类的情感理解和同理心指标密切相关。
  3. 建立感知排行榜:基于SAGE框架,建立一个公开的感知排行榜,覆盖多种商业和开源LLMs,以揭示不同模型在社会认知能力方面的差距。
  4. 推动语言代理发展:通过提供一种有原则、可扩展和可解释的评估工具,促进真正善解人意、社交能力强的语言代理的发展。

研究方法

感知代理设计

SAGE框架的核心是感知代理的设计。感知代理通过模拟人类的情感变化和内心想法,在多轮对话中为被评估的LLM提供评估。具体设计包括:

  1. 因素组合:每个感知代理由四个核心因素组成:角色(persona)、对话背景(dialogue background)、整体对话目标(dialogue goal)和隐藏意图(hidden intention)。这些因素共同捕捉了影响人类对话行为的意识和潜意识元素。
  2. 情感推理:在交互过程中,感知代理通过多跳推理来模拟情感变化。它回答一系列原则性问题,如“对方在表达什么?”“对方的回复是否符合我的对话目标和隐藏意图?”“基于角色、上下文和分析,我应该如何解读对方的回复?我的具体情感反应是什么?”“基于角色、上下文和分析,我的情感如何变化?”。
  3. 回应推理:在模拟情感变化后,感知代理通过另一系列多跳推理来推导出最合理的回应行动。它考虑情感内心想法、当前情感、隐藏意图等因素,决定回应的态度、目标、语气和风格,并生成回应内容。
动态评估环境构建

为了全面评估LLMs的社会认知能力,SAGE框架构建了动态评估环境。具体方法包括:

  1. 多样化角色生成:使用多种种子池生成多样化的角色,包括特征关键词、朋友聊天时可能说的话和角色年龄等。基于这些种子信息,要求基础LLM生成角色档案。
  2. 多样化对话场景生成:定义对话场景由背景事件、角色发起对话的主要目标和隐藏意图三个关键因素组成。使用主题种子池和隐藏意图种子池生成详细的背景描述,并预定义角色在不同回应下的潜在情感反应规则。
  3. 特定任务制定:在情感支持对话场景中,实例化感知代理作为法官框架,以评估代理在情感支持对话中的能力。
实验设置与评估指标

为了验证SAGE框架的有效性,本研究进行了广泛的实验。具体设置和评估指标包括:

  1. 被评估LLMs选择:选择了来自四个主要家族的八个代表性LLMs进行评估,包括OpenAI的GPT-4o和o1,DeepSeek的DeepSeek-V3和DeepSeek-R1等。
  2. 支持性对话场景构建:构建了100个支持性对话场景,涵盖8个不同的话题,以全面评估LLMs的高阶社会认知能力。
  3. 评估指标:使用感知情感得分作为主要评估指标,该得分由感知代理在对话结束时的最终情感得分表示。此外,还分析了情感得分与巴雷特-伦纳德关系量表(BLRI)评分和话语层面同理心指标之间的相关性。

研究结果

评估有效性验证

实验结果表明,感知情感得分与巴雷特-伦纳德关系量表(BLRI)评分和话语层面同理心指标之间存在显著相关性。具体来说,在支持性对话场景中,最终感知情感得分与BLRI评分之间的皮尔逊相关系数为0.82,与话语层面同理心指标之间的相关系数为0.79。这表明SAGE框架能够有效地捕捉LLMs在情感理解和同理心方面的表现。

感知排行榜结果

基于SAGE框架,本研究建立了一个公开的感知排行榜,覆盖了18个商业和开源LLMs。排行榜结果显示,前沿系统(如GPT-4o-Latest和Gemini2.5-Pro)在社会认知能力方面显著优于早期基线模型。具体来说,GPT-4o-Latest在感知排行榜上名列前茅,其感知情感得分高达79.9,而一些早期基线模型的得分则低于40。这一结果揭示了不同LLMs在社会认知能力方面的显著差距,并强调了SAGE框架在评估LLMs高阶社会认知能力方面的有效性。

社交认知坐标分析

为了进一步区分被评估LLMs的交互风格,本研究提出了社交认知坐标概念。该坐标将LLMs的交互焦点从同理心导向(上)到解决方案导向(下),交互风格从结构化(左)到创造性(右)进行划分。通过分析LLMs在支持性对话中的表现,将它们映射到社交认知坐标空间中。结果显示,一些前沿LLMs(如GPT-4o-Latest和Gemini2.5-Pro)主要占据结构化、同理心导向的象限,表明它们在情感支持和同理心方面表现出色。而一些其他LLMs则表现出结构化、解决方案导向或创造性、解决方案导向的风格。

研究局限

尽管SAGE框架在评估LLMs高阶社会认知能力方面取得了显著成果,但仍存在一些局限性:

  1. 角色与场景局限性:目前感知代理的角色和对话场景主要基于英语文化背景构建,可能无法充分反映其他文化背景下的社交互动特点。未来研究可以探索如何构建跨文化的感知代理和对话场景,以提高评估的普适性。
  2. 评估指标单一性:本研究主要使用感知情感得分作为评估指标,尽管该指标与人类的情感理解和同理心指标密切相关,但仍可能无法全面反映LLMs的社会认知能力。未来研究可以考虑引入更多评估指标,如对话流畅性、信息准确性等,以提供更全面的评估。
  3. 计算资源需求:SAGE框架需要运行多个感知代理与被评估的LLM进行多轮对话,这可能导致较高的计算资源需求。未来研究可以探索如何优化感知代理的设计和实现方式,以降低计算资源需求并提高评估效率。

未来研究方向

基于SAGE框架的研究成果和局限性分析,未来研究可以关注以下几个方向:

  1. 跨文化评估:探索如何构建跨文化的感知代理和对话场景,以提高SAGE框架在不同文化背景下的普适性和评估准确性。这有助于更全面地评估LLMs在全球范围内的社会认知能力。
  2. 多模态评估:结合文本、语音、面部表情等多模态信息,构建更全面的评估框架。多模态信息可以提供更丰富的上下文线索,有助于更准确地评估LLMs在社交互动中的表现。
  3. 动态优化评估:研究如何根据被评估LLM的实时表现动态调整感知代理的策略和评估指标,以提供更个性化的评估。这有助于更精确地捕捉LLMs在不同场景下的社会认知能力变化。
  4. 可解释性研究:深入探索SAGE框架中感知代理的决策过程和评估结果的可解释性。通过提供更透明的评估过程和结果解释,有助于增强用户对评估结果的信任度和接受度。
  5. 实际应用探索:将SAGE框架应用于实际场景中,如情感支持机器人、在线教育辅导系统等,以验证其在提升用户体验和模型实用性方面的效果。通过实际应用探索,可以进一步推动SAGE框架的发展和完善。

综上所述,本研究提出的SAGE框架为评估LLMs的高阶社会认知能力提供了一种新的自动化评估方法。通过模拟人类的情感变化和内心想法,并在多轮对话中提供更真实的评估,SAGE框架有助于揭示不同LLMs在社会认知能力方面的差距,并推动真正善解人意、社交能力强的语言代理的发展。未来研究可以进一步探索SAGE框架的跨文化评估、多模态评估、动态优化评估、可解释性研究和实际应用等方面,以不断完善和发展该框架。

相关文章:

【AI论文】作为评判者的感知代理:评估大型语言模型中的高阶社会认知

摘要:评估大型语言模型(LLM)对人类的理解程度,而不仅仅是文本,仍然是一个开放的挑战。 为了弥合这一差距,我们引入了Sentient Agent作为评判者(SAGE),这是一个自动评估框…...

Kubernetes生产实战(二十七):精准追踪Pod数据存储位置

在生产环境中,快速定位Pod数据的物理存储位置是运维人员的基本功。本文将揭秘Kubernetes存储系统的核心原理,并提供一套经过实战检验的定位方法体系。 一、存储架构全景图 K8S存储架构 Pod --> Volume Mount --> PVC --> PV --> Storage P…...

极新携手火山引擎,共探AI时代生态共建的破局点与增长引擎

在生成式AI与行业大模型的双重驱动下,人工智能正以前所未有的速度重构互联网产业生态。从内容创作、用户交互到商业决策,AI技术渗透至产品研发、运营的全链条,推动效率跃升与创新模式变革。然而,面对AI技术迭代的爆发期&#xff0…...

[SIGPIPE 错误] 一个 Linux socket 程序,没有任何报错打印直接退出程序

1. 问题 在编写一个程序的时候,当然程序很复杂,遇到了一个 Linux socket 程序,没有任何报错打印直接退出程序,但是在程序里面我有很多 error log ,在程序退出的时候完全没有打印。为了说明问题,我编写了一…...

Qt 界面优化(绘图)

目录 1. 绘图基本概念2. 绘制各种形状2.1 绘制线段2.2 绘制矩形2.3 绘制圆形2.4 绘制文本2.5 设置画笔2.6 设置画刷 3. 绘制图片3.1 绘制简单图片3.2 平移图片3.3 缩放图片3.4 旋转图片 4. 其他设置4.1 移动画家位置4.2 保存/加载画家的状态 5. 特殊的绘图设备5.1 QPixmap5.2 Q…...

AQS(AbstractQueuedSynchronizer)解析

文章目录 一、AQS简介二、核心设计思想2.1 核心设计思想回顾2.2 CLH锁队列简介2.3 AQS对CLH队列的改动及其原因 三、核心组件详解3.1 state 状态变量3.2 同步队列 (FIFO双向链表) 四、核心方法深度解析4.1 获取同步状态 (独占模式) - acquire(int arg)4.2 释放同步状态 (独占模…...

Java并发编程常见问题与陷阱解析

引言 随着计算机硬件技术的飞速发展,多核处理器已经变得普遍,Java并发编程的重要性也日益凸显。然而,多线程编程并非易事,其中充满了许多潜在的问题和陷阱。作为一名Java开发工程师,掌握并发编程的常见问题及其解决方案…...

DEEPPOLAR:通过深度学习发明非线性大核极坐标码(1)

原文:《DEEPPOLAR: Inventing Nonlinear Large-Kernel Polar Codes via Deep Learning》 摘要 信道编码设计的进步是由人类的创造力推动的,而且恰如其分地说,这种进步是零星的。极性码是在Arikan极化核的基础上开发的,代表了编码…...

Java多态详解

Java多态详解 什么是多态? 比如我们说:“驾驶一辆车”,有人开的是自行车,有人开的是摩托车,有人开的是汽车。虽然我们都说“开车”,但“怎么开”是由具体的车类型决定的:“开”是统一的动作&a…...

go程序编译成动态库,使用c进行调用

以下是使用 Go 语言打包成 .so 库并使用 C 语言调用的完整步骤: 1. Go 语言打包成 .so 库 (1)编写 Go 代码 创建一个 Go 文件(如 calculator.go),并定义需要导出的函数。导出的函数名必须以大写字母开头…...

iVX:图形化编程与组件化的强强联合

在数字化浪潮中,软件开发范式正经历着从文本到图形的革命性转变。iVX 作为国产可视化编程领域的领军者,以 “图形化逻辑 组件化架构” 的双重创新,重新定义了软件开发的效率边界。其技术突破不仅体现在开发方式的革新,更通过一系…...

华为配置篇-RSTP/MSTP实验

MSTP 一、简介二、常用命令总结三、实验 一、简介 RSTP(快速生成树协议)​ RSTP(Rapid Spanning Tree Protocol)是 STP 的改进版本,基于 ​​IEEE 802.1w 标准​​,核心目标是解决传统 STP 收敛速度慢的问…...

端口号被占用怎么解决

windows环境下端口号被占用怎么解决 win r 快捷键打开cmd输入netstat -ano|findstr 端口号 通过这个命令找到pidtaskkill /pid pid端口号 /t /f 如下图所示 命令解读 netstat 是一个网络统计工具,它可以显示协议统计信息和当前的TCP/IP网络连接。 -a 参数告诉 nets…...

GO语言-导入自定义包

文章目录 1. 项目目录结构2. 创建自定义包3. 初始化模块4. 导入自定义包5. 相对路径导入 在Go语言中导入自定义包需要遵循一定的目录结构和导入规则。以下是详细指南(包含两种方式): 1. 项目目录结构 方法1:适用于Go 1.11 &#…...

ES常识5:主分词器、子字段分词器

文章目录 一、主分词器:最基础的文本处理单元主分词器的作用典型主分词器示例 二、其他类型的分词器:解决主分词器的局限性1. 子字段分词器(Multi-fields)2. 搜索分词器(Search Analyzer)3. 自定义分词器&a…...

NoSQL数据库技术与应用复习总结【看到最后】

第1章 初识NoSQL 1.1 大数据时代对数据存储的挑战 1.高并发读写需求 2.高效率存储与访问需求 3.高扩展性 1.2 认识NoSQL NoSQL--非关系型、分布式、不提供ACID的数据库设计模式 NoSQL特点 1.易扩展 2.高性能 3.灵活的数据模型 4.高可用 NoSQL拥有一个共同的特点&am…...

单片机-STM32部分:12、I2C

飞书文档https://x509p6c8to.feishu.cn/wiki/MsB7wLebki07eUkAZ1ec12W3nsh 一、简介 IIC协议,又称I2C协议,是由PHILP公司在80年代开发的两线式串行总线,用于连接微控制器及其外围设备,IIC属于半双工同步通信方式。 IIC是一种同步…...

【英语笔记(四)】诠释所有16种英语时态,介绍每种时态下的动词变形!!含有所有时态的的动词变形汇总表格

1 时态的单词构成 1.1 现在 1.1.1 一般现在时态 动词原形动词原形s(第三人称单数) 1.1.1.1 表达事实 I eat carrots. 我吃胡萝卜:我是吃胡萝卜这种食物的.(这个是事实陈述) The rabbit eats carrots. 兔子吃胡萝卜…...

【质量管理】什么是过程?

在文章【质量管理】谁是顾客?什么是质量链?-CSDN博客 中我们了解了什么是顾客,顾客不仅仅是企业以外的人,在企业的内部我们也有大大小小的顾客。并且我们了解了什么是质量链,企业内部的各种供给方和客户形成了质量链。…...

效率办公新工具:PDF Reader Pro V5.0功能解析与使用体验

在日常文档处理与数字办公的场景中,PDF 文件依然是主流格式之一。从合同审批、项目文档、财务报表,到技术方案和用户手册,PDF 的编辑、转换、标注、归档需求始终存在。 面对这些需求,越来越多用户希望有一款功能完整、跨平台、智…...

Java对象内存布局和对象头

1、面试题 1)说下JUC,AQS的大致流程 CAS自旋锁,是获取不到锁就一直自旋吗? 2)CAS和synchronized区别在哪里,为什么CAS好,具体优势在哪里? 3)sychro…...

Vue 跨域解决方案及其原理剖析

在现代 Web 开发中,跨域问题是前端开发者经常面临的挑战之一。当使用 Vue.js 构建应用时,跨域请求的处理尤为重要。本文将深入探讨 Vue 解决跨域的多种方法及其背后的原理,帮助开发者更好地理解和应对这一常见问题。 一、跨域问题概述 1. 同…...

TikTok 互动运营干货:AI 助力提升粘性

在 TikTok 运营的众多环节中,与用户的互动是建立紧密联系、提升账号粘性的关键所在。及时且真诚地回复评论和私信,能让用户切实感受到你的关注与尊重,从而极大地增强他们对你的好感与粘性。对于用户提出的问题,要以耐心、专业的态…...

Kids A-Z安卓版:儿童英语启蒙的优质选择

Kids A-Z安卓版 是一款由北美知名分级读物厂商 Learning A-Z 官方推出的英语分级学习应用,也被称为 Raz-Kids app。它专为 K-5 年级的学生设计,提供丰富的英语学习资源和互动学习体验,帮助孩子们在轻松愉快的环境中提升英语能力。通过动画、互…...

接口继承与扩展的使用技巧

在 TypeScript 中,接口继承和扩展是非常强大且灵活的功能,可以帮助我们更高效地管理类型和提高代码的可重用性。接口继承使得一个接口可以从另一个接口继承属性和方法,而接口扩展允许我们通过组合多个接口来构建更复杂的结构。这些特性使得 T…...

【React】Craco 简介

Craco 简介 Craco (Create React App Configuration Override) 是一个用于自定义 Create React App (CRA) 配置的工具,无需 eject(弹出)项目。 为什么需要 Craco Create React App 虽然提供了零配置的 React 开发体验,但其配置…...

HTML5中的Microdata与历史记录管理详解

Microdata 简介 Microdata 是 HTML5 引入的一种标记方式,用于在网页中嵌入机器可读的语义信息。通过使用 Microdata,开发者可以在 HTML 元素中添加特定的属性,以便搜索引擎和其他工具更好地理解网页内容。 Microdata 的核心属性包括 itemsc…...

UNet网络 图像分割模型学习

UNet 由Ronneberger等人于2015年提出,专门针对医学图像分割任务,解决了早期卷积网络在小样本数据下的效率问题和细节丢失难题。 一 核心创新 1.1对称编码器-解码器结构 实现上下文信息与高分辨率细节的双向融合 如图所示:编码器进行了4步&…...

Babel 深度解析:现代 JavaScript 开发的桥梁

1. 什么是 Babel? Babel 是一个 JavaScript 编译器(又称转译器),核心使命是解决 JavaScript 的环境兼容性问题。它允许开发者使用最新的语言特性(如 ES6、JSX、TypeScript),同时将代码转换为旧…...

MyBatis源码解读2(2.1、核心对象)

二、MyBatis的核心对象 2.1、核心对象 2.1、MappedStatement MyBatis其实是对JDBC的进一步封装,我们都知道JDBC有几个重要的对象: StatementPrepared StatementCallable StatementResultSet Statement、Prepared Statement、Callable Statement分别…...

03.three官方示例+编辑器+AI快速学习webgl_animation_multiple

本实例主要讲解内容 这个示例展示了Three.js中骨骼动画的高级应用技巧,重点演示了如何使用SkeletonUtils.clone()方法复制模型,并展示了两种不同的骨骼动画管理方式: 独立骨骼模式:每个模型拥有独立的骨骼结构,可播放…...

无锁秒杀系统设计:基于Java的高效实现

引言 在电商促销活动中,秒杀场景是非常常见的。为了确保高并发下的数据一致性、性能以及用户体验,本文将介绍几种不依赖 Redis 实现的无锁秒杀方案,并提供简化后的 Java 代码示例和架构图。 一、基于数据库乐观锁机制 ✅ 实现思路&#xf…...

MyBatis快速入门——实操

默认:电脑搭建好了Maven环境 本次入门实验使用的idea版本:ideaU2022.1 目录 一:前期准备工作 1. 创建一个springboot工程 2. Maven环境配置 3. 在mysql数据库中创建一个user表 4. 编写实体类User 二: 引入MyBatis的相关依赖…...

假如你的项目是springboot+vue怎么解决跨域问题

1. 前端代理(开发环境推荐) 适用场景:Vue 开发环境调试时,避免直接请求后端接口的跨域问题。 实现步骤: 在 Vue 项目的 vue.config.js 中配置代理: module.exports {devServer: {proxy: {/api: { // 代理…...

OpenResty反向代理

通过在 OpenResty 的配置文件中定义不同的 location 块,将匹配特定 URL 路径的请求转发到不同的后端 FastAPI 应用(即使它们运行在不同的端口或甚至是不同的服务器/容器上)。 核心思路: 多个 FastAPI 应用实例: 你的每…...

《Effective Python》第1章 Pythonic 思维详解——深入理解 Python 条件表达式(Conditional Expressions)

《Effective Python》第1章 Pythonic 思维详解——深入理解 Python 条件表达式(Conditional Expressions) 在 Python 中,条件表达式(conditional expressions)提供了一种简洁的方式来在一行中实现 if/else 的逻辑。它…...

【Typenum】 3 类型位运算(bit.rs)

一、源码 代码定义了一个类型级别的位(bit)系统,主要用于编译时的类型运算。 //! 类型级比特位实现 //! //! 这些是基础的比特位类型,作为本库中其他数值类型的构建基础 //! //! 已实现的**类型运算符**: //! //! - …...

python:trimesh 用于 STL 文件解析和 3D 操作

python:trimesh 是一个用于处理三维模型的库,支持多种格式的导入导出,比如STL、OBJ等,还包含网格操作、几何计算等功能。 Python Trimesh 库使用指南 安装依赖库 pip install trimesh Downloading trimesh-4.6.8-py3-none-any.w…...

stm32week15

stm32学习 十一.中断 2.NVIC Nested vectored interrupt controller,嵌套向量中断控制器,属于内核(M3/4/7) 中断向量表:定义一块固定的内存,以4字节对齐,存放各个中断服务函数程序的首地址,中断向量表定…...

数据库分库分表实战指南:从原理到落地

1. 为什么要分库分表? 1.1 单库瓶颈表现 存储瓶颈:单表数据超过5000万行,查询性能急剧下降性能瓶颈:单库QPS超过5000后响应延迟显著增加可用性风险:单点故障导致全系统不可用 1.2 突破性优势 --------------------…...

雷达工程师面试题目

雷达工程师面试题目 一、基础知识类 简述雷达的工作原理 请从电磁波的发射、传播、反射以及回波接收处理等环节,详细阐述雷达如何实现对目标的探测、定位与跟踪。 常见雷达体制及其特点 列举至少三种常见的雷达体制(如脉冲雷达、连续波雷达、相控阵雷达等),并分别说明…...

JVM-类加载子系统

最近在学习JVM,分模块整理一下JVM的笔记 目录 类加载子系统 一、加载 二、链接 1.验证 2.准备 3.解析 三、初始化 类加载子系统 类加载子系统负责将字节码文件加载到虚拟机中,我们正常编写完一个Java类并在前端编译器编译后会生成一个对应的字节码…...

从0开始学习大模型--Day06--大模型的相关网络架构

云服务器 在平时,我们总能听到诸如用服务器跑数据、模型,或者是搭建服务器之类的话,实际上,它相当于一台算力、内存、运行内存等各个方面都很强大的电脑,只需要我们用自己的电脑通过互联网链接他就能使用它&#xff0…...

控制LED灯设备

本章分别使用C库和系统调用的文件操作方式控制开发板的LED灯,展示如何在应用层通过系统提供的设备文件控制相关硬件。 本章的示例代码目录为:base_code/linux_app/led/sys_class_leds。 9.1. LED子系统 在Linux系统中,绝大多数硬件设备都有…...

Three.js + React 实战系列 - 联系方式提交表单区域 Contact 组件✨(表单绑定 + 表单验证)

对个人主页设计和实现感兴趣的朋友可以订阅我的专栏哦!!谢谢大家!!! 在现代网页中,一个精致的 Contact 区域不仅仅是表单的堆砌,更是用户与我们建立联系的第一印象。 在本节课中,我…...

Python-MCPAgent开发-DeepSeek版本

Python-MCPAgent开发-DeepSeek版本 尝试Windows使用Python完成【McpServer】【McpAgent】开发,当前使用OpenAI-Agents框架进行开发 1-核心知识点 先完成【LLM】配置再完成【McpServer】开发再完成【Agent】开发完成【LLM】【McpServer】【Agent】请求互通 2-思路整…...

Linux:43线程封装与互斥lesson31

mmap文件映射视屏:待看... 目录 线程栈 代码证明:一个线程的数据,其他线程也可以访问 线程封装 简单封装,2.thread Thread.hpp Main.cc Makefile 结果: ​编辑 问题1: 问题2: lamba表达式 模版封…...

stm32测频率占空比最好的方案

频率检测, 方案方法很多种, 其中最快最节省资源的方法. 分享给大家. 其它的方案都试过, 问题多多. 适合单片机在工业应用中, 1MHZ以下的频率检测. 1MHZ估计也行. 但是偏差估计是变大了. 我试过很多种方案, 可以看我前面的文章. 最后发现目前这种方案最为优秀. 主要特点为不占用…...

Redis--常见数据类型List列表

目录 一、概念 二、命令 2.1 LPUSH 2.2 LPUSHX 2.3 RPUSH 2.4 RPUSHX 2.5 LRANGE 2.6 LPOP 2.7 RPOP 2.8 LINDEX 2.9 LINSERT 2.10 LLEN 2.11 阻塞版本命令 三、内部编码 一、概念 列表类型是用来存储多个有序的字符串,列表中的每个字符串称为元素&…...

Linux : 多线程【线程概念】

Linux : 多线程【线程概念】 (一)线程概念线程是什么用户层的线程linux中PID与LWP的关系 (二) 进程地址空间页表(三) 线程总结线程的优点线程的缺点线程异常线程用途 (一)线程概念 线程是什么 在一个程序里的一个执行…...