当前位置: 首页 > news >正文

《 Reinforcement Learning for Education: Opportunities and Challenges》全文阅读

Reinforcement Learning for Education: Opportunities and Challenges

面向教育的强化学习:机遇与挑战

摘要

本综述文章源自作者在 Educational Data Mining (EDM) 2021 会议期间组织的 RL4ED 研讨会。我们组织了这一研讨会,作为一项社区建设工作的组成部分,旨在汇聚对强化学习(RL)与教育(ED)广义领域感兴趣的研究人员与实践者。本文旨在概述研讨会的活动情况,并总结强化学习在教育领域中的主要研究方向。

1 引言

强化学习(RL)是一种用于建模和自动化目标导向学习与序贯决策的计算框架 [1, 2]。与监督学习和无监督学习等其他学习方法不同,RL 强调的是智能体通过与环境的直接交互进行学习。RL 特别适用于智能体需要学习在不同情境下采取何种行动的策略,即如何将状态映射到动作,以最大化长期效用。智能体必须探索不同的行动以发现能够带来高奖励的行为;关键在于,这些行为不仅影响即时获得的奖励,还会影响下一个状态,并进而通过状态影响所有未来的奖励。这些特性——动作具有长期影响、奖励延迟,以及在不确定性下的序贯决策——构成了 RL 的核心优势。

到目前为止,RL 最令人印象深刻的一些应用主要局限于游戏领域 [3-6]。鉴于师生之间的序贯互动在教育(ED)中的核心地位,近年来在利用 RL 改善教育技术的最前沿水平方面出现了浓厚的兴趣。在 ED 中有几种问题场景适合应用 RL 方法,包括利用 RL 方法训练教学策略以及将人类学生建模为 RL 智能体。虽然前景广阔,但将开箱即用的 RL 方法应用于 ED 通常非常具有挑战性。此外,ED 中的许多问题场景还存在独特挑战,使得当前的 RL 方法无法直接适用。ED 中的一些关键挑战包括:(a)缺乏基于仿真环境训练大量数据需要的 RL 方法;(b)需要大规模(往往无限)的状态空间表示;(c)环境状态(即学生知识)观察受限;(d)奖励测量存在显著延迟且噪声大;以及(e)当 RL 方法应用于关乎学生未来的关键领域时,对其鲁棒性、可解释性和公平性的担忧。

RL4ED 研讨会的目标在于促进对 RL 和 ED 广泛领域感兴趣的研究者与实践者之间更紧密的联系。研讨会主要聚焦于两个方向:

  • RL → E D \rightarrow \mathbf{E D} ED : 探索如何利用 RL 方法的最新进展来改进教育技术的现状。

  • E D → R L \mathbf{E D} \rightarrow \mathbf{R L} EDRL : 确定 ED 中独特的挑战,这些挑战超越了当前方法论,但可以催生 RL 中新的技术创新和突破。

2 RL4ED@EDM’21 研讨会活动概况

本节我们概述了在 EDM 2021 会议期间组织的 RL4ED 研讨会;完整细节可在研讨会网站上获取。该研讨会作为在线活动举行;在最高峰时,注册人数超过 120 人,且同时在线参会人数超过 60 人。研讨会的结构围绕邀请演讲、投稿论文、聚光报告以及两场专题讨论会展开。

\subsection*{2.1 关注的主题}

如上所述,本次研讨会聚焦于两个主要方向,每个方向涵盖了若干感兴趣的专题。这些专题在邀请演讲嘉宾的选择和投稿论文的聚光报告选择时起到了指导作用。

R L → E D \mathbf{R L} \rightarrow \mathbf{E D} RLED 方向中,关注的主题集中在利用 RL 方法的最新进展解决 ED 问题场景,包括:(i)总结了具有适用于 ED 的 RL 最新进展的综述论文;(ii)开发适用于 ED 的 RL 方法的工具包、数据集和挑战;(iii)利用 RL 进行在线评估和 A/B 测试不同干预策略;以及(iv)RL 在 ED 问题场景中的新应用。\

E D → R L \mathbf{E D} \rightarrow \mathbf{R L} EDRL 方向中,关注的主题集中在 ED 问题场景中独特的挑战,这些挑战激发了 RL 方法的下一次突破,包括:(i)利用教学理论来缩小 RL 方法策略空间;(ii)利用 RL 框架构建开放式领域中学生的计算模型;(iii)开发能够高效利用历史学生数据的全新离线 RL 方法;以及(iv)结合 RL 的统计优势与符号推理以确保 ED 中应用的鲁棒性。

\subsection*{2.2 邀请演讲和专题讨论会}

我们邀请了来自学术界和工业界的一批嘉宾,覆盖了各个感兴趣的专题,并在不同视角和学科之间取得平衡。研讨会共安排了 7 个邀请演讲;每个演讲大约 25 分钟。下面列出了演讲嘉宾及其演讲主题:

\section*{[T1] Tanja Käser;在开放式学习环境中的建模与个性化学习。}

[T2] Simon Woodhead;Eedi 与 NeurIPS 2020 教育挑战数据集。\[0pt]

[T3] José Miguel Hernández Lobato;在观察性场景中去混淆强化学习。\[0pt]

[T4] Min Chi;教学政策对学生学习影响——一种强化学习方法。\[0pt]

[T5] Emma Brunskill;从教育及其他社会关注应用中的挑战获得启示的更实用的强化学习。\[0pt]

[T6] Joe Austerweil;“强化学习不过是一种需要最大化的价值吗?”\[0pt]

[T7] Shayan Doroudi;用于教学序列优化的强化学习——从过去中学习以满足未来的挑战。

这些邀请演讲的视频录像可在研讨会网站上观看。除了这些邀请演讲外,演讲嘉宾还参加了两个各为 30 分钟的专题讨论会。演讲后和专题讨论会后的问答环节为参与者提供了充分讨论的机会。

\subsection*{2.3 投稿论文和聚光报告}

鉴于本次研讨会的重点在于社区建设和交流,我们在论文征集时稍作尝试,征集了两种类型的投稿。第一种,我们称之为“研究轨”,包括报告正在进行或新研究成果的论文,这些论文此前未曾发表。第二种,我们称之为“重现轨”,包括最近已发表或已被接收在会议或期刊上公布的论文。

对于“研究轨”,我们共收到 4 篇投稿,并录用了 3 篇。对于“重现轨”,我们向相关领域的已发表论文作者发送邀请,共收到 6 篇投稿。总计,我们收到了 9 篇投稿论文,涵盖了研讨会感兴趣的各个主题。这些投稿论文作为聚光报告展示;每篇报告大约 8 分钟。总计共有 10 个聚光报告,其中包括这些投稿论文及一个额外的邀请报告,列表如下:\[0pt]

[S1] 基于决斗赌博机的统计后果。\[0pt]

(研究轨;[7])\[0pt]

[S2] 捕捉学生与机器人交互的数据驱动教育对话 RL 环境。(研究轨;[8])\[0pt]

[S3] 探索用于教育游戏中可迁移个性化学生模型的方法。(重现轨;[9])\[0pt]

[S4] 将自适应间隔启发式扩展到多技能题目。(重现轨;[10])\[0pt]

[S5] “过于个性化”:在线自适应算法中特征选择的重要性。(重现轨;[11])\[0pt]

[S6] “近似最优教师指导近似最优学习者”。(重现轨;[12])\[0pt]

[S7] 利用强化学习学习教育相关任务的专家模型。(重现轨;[13])\[0pt]

[S8] 使用深度强化学习模拟、训练和评估教学序列策略。(研究轨;[14])\[0pt]

[S9] 利用批量约束深度 Q 网络自适应搭架构以提升认知参与。(重现轨;[15])\[0pt]

[S10] 将强化学习整合入 ASSISTments 平台。(额外邀请的聚光报告)

这些聚光报告的视频录像可在研讨会网站上观看。

3 RL4ED 主要研究方向的总结

本节中,我们总结了强化学习在教育领域中的主要研究方向。\[0pt]

RL 方法用于跨任务个性化课程的设计。RL 在 ED 中最直接、研究最为充分的应用是为学生提供个性化课程的教学策略训练。在这一问题设置中,一般训练一个 RL 智能体来在智能辅导系统中诱导教学策略,而人类学生则作为 RL 术语中的“环境”存在 [2]。对于给定学生,该教学策略将学生的响应历史映射到下一任务,以最大化长期的学习收益。读者可参考 [16],该文对该主题进行了极好的综述;同时也请参见邀请演讲 [T7]。最新该方向的研究也覆盖于邀请演讲 [T4]、聚光报告 [S6] 和 [S8] 以及几篇近期作品 [12, 17-21]。尽管这是 RL 的自然应用,但在实践中,要在真实世界的 ED 领域训练出有效的基于 RL 的策略存在许多挑战;详见 [16]。其中一个主要挑战是学生的真实知识状态并不可直接观察到~ [ 12 , 17 ] [12,17] [12,17]——我们需要使用适当的表示将学生的响应映射为其知识状态。另一个主要挑战来自于缺乏基于仿真环境来训练需要海量数据的 RL 方法。通常,RL 智能体需要数百万个训练回合,而这些训练通常在游戏领域的仿真器中进行;然而,在 ED 领域,我们并没有这样的真实仿真器或人类学生的计算模型。为了解决这些挑战,一个重要的研究方向是探讨如何有效结合基于 RL 的策略与教学理论,或者利用教学理论来缩小 ED 问题设置中 RL 的策略空间。另一个重要研究方向是开发能够高效利用历史数据的全新离线 RL 方法;详见邀请演讲 [T5]。

RL 方法用于提供提示、支架和测验。除了跨任务的课程设计之外,RL 在 ED 中的另一个重要应用是训练能够在任务中提供提示作为反馈的策略。尤其对于复杂的开放领域(例如,基于积木的可视化编程或高中代数),提示、反馈和支架对于提升学生参与度和学习收益起着重要作用 [22-25]。在一项早期工作中,[26] 利用马尔科夫决策过程(MDP)形式化,用于从历史学生数据中自动生成逻辑证明辅导的提示。近期的工作中,[27] 提出了一种 RL 框架用于训练针对基于积木的可视化编程任务的提示策略,而不依赖历史学生数据,从而应对该领域下零样本提供提示的挑战。我们还请读者参见最近几项工作,包括 [15, 28],它们使用 RL 方法在关键决策点为学生提供支架与辅助;另请参见邀请演讲 [T4] 及聚光报告 [S9]。在一个略有不同的问题设置中,[29] 探讨了如何利用基于 RL 的策略为学生进行测验以推断其知识状态,从而解决 Eedi 的 NeurIPS 教育挑战中的问题 #4(参见 [30, 31] 及邀请演讲 [T2])。这些工作仍处于早期阶段,展示了利用基于 RL 的策略在跨任务之外的不同问题设置中的潜力。在未来几年中,我们相信 RL 方法将在为复杂开放任务提供反馈方面发挥至关重要的作用。一个令人兴奋的研究方向是训练基于 RL 的策略,在提供提示时平衡不同目标——是快速完成当前任务提示,还是在教师的角度最大化提示的教学价值,使学生在未来任务中获得更好表现。

RL 用于在线实验和 A/B 测试在教育平台中的应用。近年来,人们越来越关注利用 RL 方法评估大规模在线平台中不同教育干预措施的效果。特别是,一类特殊的 RL 方法——多臂老虎机(MAB)被最新研究用于自适应实验:每个学生被分配到一种技术版本或一种干预措施(在 MAB 术语中为“臂”),算法观察该学生的学习成果(与所分配“臂”相关的奖励);随后,每位学生更有可能被分配到先前证明更有效的技术版本,因为算法会发现哪些干预更有效 [32-34]。虽然标准 MAB 算法不支持基于学生个人特征的个性化,但情景 MAB 算法可以考虑学生特征,并使分配更加个性化,从而进一步提升学习收益。在最近的工作中,[12] 探讨了情景 MAB 算法中所用特征的效果,并强调了个性化在学习收益上的权衡(另请参见本论文聚光报告 [S5])。在另一个最近工作中,[35] 作为案例研究,通过发送作业邮件提醒来进行自适应实验,并报告在现实环境中进行此类实验时出现的各种开放性问题。我们还请读者参见其他几篇近期工作,包括 [36, 37] 以及聚光报告 [S1] 和 [S10]。在 [S10] 中,作者讨论了他们将基于 MAB 的自适应实验用于推荐和个性化学生在 ASSISTments 教育平台上接收内容的持续努力。总体而言,RL 用于自适应实验是一个非常有前景的领域,预期在未来几年中,我们将看到 RL 驱动技术在现实教育平台中的部署。该领域一个重要的研究方向是更好地理解自适应实验的伦理影响,并设计可考虑公平性的情景 MAB 算法,从而确保不同群体之间的教育公平。

RL 框架用于建模人类学生。与利用 RL 智能体代表教师 / 辅导系统不同,我们可以采取另一种视角,利用 RL 框架来对学生的学习或问题解决过程进行建模。在这种设置中,人类学生被建模为 RL 智能体,教师则代表“环境”;参见训练教学策略时将 RL 智能体表示为教师或辅导系统的设置。这种建模框架在开放式学习领域尤其有用,其中任务概念性强、开放且序贯,包括如基于积木的可视化编程和高中代数等领域。这样的 RL 计算模型有助于多种应用。例如,可以利用该模型根据学生尝试的解答诊断其错误,并设计出更有效的环境反馈(例如,通过适当的干预措施);参见 [39, 40]。此外,这种计算模型还可用作模拟学生,来评估教学算法或训练教学策略。在机器教学研究中 [41],近期的一系列工作已利用 RL 智能体作为学生模型来探讨针对序贯决策任务的教学理论基础。例如,[42-44] 研究了当学生被模型为模仿学习智能体时如何设计课程以及如何通过演示优化教学,以及 [45] 研究了当学生被建模为 RL 智能体时的策略教学与环境设计问题。最近的诸多工作和研讨会活动均聚焦于这一研究方向,包括 [9, 13, 46],邀请演讲 [T1] 和 [T6],以及聚光报告 [S3] 和 [S7]。在未来几年中,我们相信利用 RL 框架建模人类学生将继续成为一个重要的研究方向。其中最重要的研究问题之一是如何将以人为中心的学习特性纳入 RL 智能体中,使这些智能体能更好地代表真实的学生。更具体地说,开发能够捕捉人类学习者能力(例如,少样本学习、演绎推理和从不同反馈类型中学习)的 RL 智能体将具有重要意义。

RL 用于教育内容生成。另一个重要的研究方向是利用 RL 方法进行教育内容生成,例如生成新的练习题、测验或视频。这常被称为过程内容生成(PCG),近期工作已探索了 RL 在生成不同难度的 Sokoban 谜题 [47, 48] 和赛车游戏 [49] 中的适用性。在最近的工作中,[50] 结合 Monte Carlo 树搜索(MCTS)方法与符号技术,在基于积木的可视化编程领域合成新任务。这些合成任务可在许多实际系统中发挥作用——例如,辅导教师可以将新练习任务作为家庭作业或测验分配给学生,以检验其知识掌握情况,学生在未能解决某个任务后也可以通过系统自动获得新的类似任务。鉴于在线平台上提供个性化且多样化教育内容的迫切需求,RL 用于教育内容生成是一个需要进一步探索的重要研究领域。

4 结论

面向教育的强化学习是未来工作中一个重要的应用领域,它可能带来教育实际改进以及强化学习技术的新进展。EDM2021 研讨会上的演讲和讨论突显了社区对本文涵盖主要领域的热情,多样的视角以及专家小组的评论展示了从多个学科(包括但不限于学习科学、认知科学和机器学习)中汲取思想的重要性。这种多学科视角的需求及教育应用所提出的独特挑战表明,继续在此领域培养社区仍然十分必要。

相关文章:

《 Reinforcement Learning for Education: Opportunities and Challenges》全文阅读

Reinforcement Learning for Education: Opportunities and Challenges 面向教育的强化学习:机遇与挑战 摘要 本综述文章源自作者在 Educational Data Mining (EDM) 2021 会议期间组织的 RL4ED 研讨会。我们组织了这一研讨会,作为一项社区建设工作的组…...

Apache Kafka UI :一款功能丰富且美观的 Kafka 开源管理平台!!

Apache Kafka UI 是一个免费的开源 Web UI,用于监控和管理 Apache Kafka 集群,可方便地查看 Kafka Brokers、Topics、消息、Consumer 等情况,支持多集群管理、性能监控、访问控制等功能。 1 特征 多集群管理: 在一个地方监控和管理…...

无参数RCE

无参数RCE(Remote Code Execution,远程代码执行) 是一种通过利用目标系统中的漏洞,在不直接传递用户可控参数的情况下,实现远程执行任意代码的攻击技术。与传统的RCE攻击不同,无参数RCE不依赖外部输入参数…...

设计模式之状态模式:优雅管理对象行为变化

引言 状态模式(State Pattern)是一种行为型设计模式,它允许对象在其内部状态改变时改变它的行为,使对象看起来似乎修改了它的类。状态模式将状态转移逻辑和状态相关行为封装在独立的状态类中,完美解决了复杂条件判断问…...

拖动滑块 代替验证码,识别机器人的方式,实验原理

拖动滑块验证是一种常见的人机验证技术,用于区分真实用户和自动化程序(如机器人)。其核心原理不仅在于用户是否能将滑块移动到正确位置,还包括对拖动行为的轨迹、速度、加速度等特征的分析。以下是其实现原理及识别机器人的方式&a…...

深度访谈:数据中台的本质不是技术堆砌,而是业务引擎的重构

在数字化转型进入深水区的今天,企业逐渐意识到单纯的技术堆砌无法解决业务核心痛点。数据的割裂、重复建设的烟囱式系统、滞后于业务的分析能力,正迫使企业寻找“系统性解法”。 “未来的竞争,本质是数据响应速度的竞争。当竞争对手还在讨论‘…...

Spark中Maven的用法

在IDEA中去创建项目,并编写java代码来操作集群中的文件 1.IDEA 中创建 Maven 项目 步骤一:点击 File -> New -> Project,在弹出的窗口左侧选择 Maven,点击 Next: 步骤二:填写项目的 GroupId、Arti…...

tomcat http 怎么改成 https

步骤 1:生成自签名证书 如果你没有可用的 SSL/TLS 证书,可以使用 Java 的 keytool 工具生成一个自签名证书。 bash复制代码 keytool -genkeypair -alias tomcat -keyalg RSA -keystore keystore.jks -keysize 2048 执行此命令后,系统会提…...

Playwright与Selenium详细对比及Playwright快速入门

Playwright 与 Selenium 详细对比及入门指南索引 简介 本文章旨在帮助测试工程师了解Playwright和Selenium这两个主流的UI自动化测试工具,并快速入门Playwright。文档分为多个部分,本文作为主要索引,提供核心对比和基本概念,而详…...

03 UV

04 Display工具栏_哔哩哔哩_bilibili 讲的很棒 ctrlMMB 移动点 s 打针 ss 批量打针...

hadoop执行sqoop任务找不到jar

sqoop:1.4.7 hadoop:3.4.1 数据:oracel-hdfs 2025-04-15 16:57:00,850 INFO sqoop.Sqoop: Running Sqoop version: 1.4.7 2025-04-15 16:57:00,901 WARN tool.BaseSqoopTool: Setting your password on the command-line is insecure. Consider using -P instead. 2025-04-15 …...

【C#】Html转Pdf,Spire和iTextSharp结合,.net framework 4.8

🌹欢迎来到《小5讲堂》🌹 🌹这是《C#》系列文章,每篇文章将以博主理解的角度展开讲解。🌹 🌹温馨提示:博主能力有限,理解水平有限,若有不对之处望指正!&#…...

Mac系统升级node.js版本和npm版本并安装pnpm

1.升级node.js版本 第一步:查询当前node.js版本 node -v第二步:清除node.js的缓存 sudo npm cache clean -f第三步:验证缓存是否清空 npm cache verify第四步:安装n工具,n工具是专门用于管理node.js版本的工具 su…...

记录分享《若依Spring Cloud本地开发部署教程》

若依Spring Cloud本地开发部署教程 若依(RuoYi)是一个基于Spring Boot和Spring Cloud的权限管理系统,提供了丰富的功能模块和开箱即用的解决方案。本文将详细介绍如何在本地环境中进行若依Spring Cloud的开发和部署。 一、环境准备 Java环境…...

(小白0基础) 微调deepseek-8b模型参数详解以及全流程——训练篇

​ 本篇参考bilibili如何在本地微调DeepSeek-R1-8b模型_哔哩哔哩_bilibili 上篇:(小白0基础) 租用AutoDL服务器进行deepseek-8b模型微调全流程(Xshell,XFTP) —— 准备篇 初始变量 max_seq_length 2048 dtype None load_in_4bit True单批次最大处理模型大小dy…...

基于 PyGetWindow 获取窗口信息和控制窗口

PyGetWindow 是基于Python的一款简单、跨平台的模块,用来获取窗口信息和控制窗口。可以实现的功能有: 获取当前系统中所有打开窗口的列表。 根据窗口标题、窗口句柄等属性获取特定的窗口对象。 激活、最小化、最大化和关闭窗口。 获取和设置窗口的位置、…...

解锁动态规划的奥秘:从零到精通的创新思维解析(8)

前言: 小编在前几日讲述了关于动态规划的习题,下面小编继续跟着上次的步伐,继续进入多状态dp问题的讲解(但是今天这个题目不需要多状态),今天由于小编的精力有限,所以我就仅仅先讲述一个题目&am…...

使用RUN pip install flask和RUN pip install -r requirements.txt

在编写dockerfile文件的时候,有时候会遇上使用RUN pip install -r requirements.txt的情况,而且requirements.txt文件里面就一个包名,例如flask,那么不禁要问为什么不直接写成RUN pip install flask呢?其实不是不行&am…...

512天,倔强生长:一位技术创作者的独白

亲爱的读者与同行者: 我是倔强的石头_,今天是我在CSDN成为创作者的第512天。当系统提示我写下这篇纪念日文章时,我恍惚间想起了2023年11月19日的那个夜晚——指尖敲下《开端——》的标题,忐忑又坚定地按下了“发布”键。那时的我…...

【Java SE】Collections类详解

参考笔记:java Collections类 详解-CSDN博客 目录 一、Collections类简介 二、Collection类常用方法 1. 排序 ① static void reverse(List list) ② static void shuffle(List list) ③ static void sort(List list) ④ static void sort(List list, Comparator …...

Android LiveData学习总结(源码级理解)

LiveData 工作原理 数据持有与观察者管理:LiveData 内部维护着一个数据对象和一个观察者列表。当调用 observe 方法注册观察者时,会将 LifecycleOwner 和 Observer 包装成 LifecycleBoundObserver 对象并添加到观察者列表中。生命周期感知:L…...

RabbitMQ 为什么引入 Exchange 的概念, 交换机有什么作用.

RabbitMQ 引入 Exchange 的概念是为了实现消息的灵活路由和解耦生产者与消费者,这是 AMQP(Advanced Message Queuing Protocol)协议的核心设计之一。以下是 Exchange 存在的主要原因: 1. 解耦生产者与队列 问题:如果生…...

rabbitmq引入C++详细步骤

1. 安装RabbitMQ服务器 在Windows上:先安装Erlang,再安装RabbitMQ服务器。安装完成后,可通过访问http://localhost:15672来检查RabbitMQ服务器是否正常运行,默认的用户名和密码是guest/guest。 在Linux上:可使用包管理…...

Android 9.0系统源码定制:实现开机启动特定App的全面指南

在Android 9.0系统中,若需要通过修改系统源码实现开机启动特定应用(如系统预装应用或第三方应用),通常涉及对系统框架层(Framework)的深度定制开发。以下是详细的实现步骤和关键代码位置整理: 1…...

如何在不同版本的 Elasticsearch 之间以及集群之间迁移数据

作者:来自 Elastic Kofi Bartlett 当你想要升级一个 Elasticsearch 集群时,有时候创建一个新的独立集群并将数据从旧集群迁移到新集群会更容易一些。这让用户能够在不冒任何停机或数据丢失风险的情况下,在新集群上使用所有应用程序测试其所有…...

MySQL数据库精研之旅第六期:玩转数据库约束

目录 一、数据库约束的概念 二、约束类型 三、NOT NULL 非空约束 四、DEFAULT 默认值约束 五、UNIQUE 唯一约束 六、PRIMARY KEY 主键约束 七、FOREIGN KEY 外键约束 八、Check 约束 一、数据库约束的概念 数据库约束是指对数据库表中的数据所施加的规则或条件&#xf…...

【Java】面向对象程序三板斧——如何优雅设计包、封装数据与优化代码块?

🎁个人主页:User_芊芊君子 🎉欢迎大家点赞👍评论📝收藏⭐文章 🔍系列专栏:【Java】内容概括 【前言】 在Java编程中,类和对象是面向对象编程的核心概念。而包(Package&am…...

MCP、RAG与Agent:下一代智能系统的协同架构设计

一、智能系统架构的范式转移 1.1 传统架构的局限性 架构类型典型问题新架构需求单体架构扩展性差,维护成本高模块化解耦简单微服务缺乏智能决策能力认知能力嵌入纯LLM系统事实性错误,知识固化动态知识增强 1.2 三大核心组件的定位 #mermaid-svg-6tGuE…...

软件设计师2009-2022历年真题与答案解析(附pdf下载)

软考在即,现在给大家分享一下软件设计师2009-2022真题与答案解析 pdf全套,文末提供大家免费下载,大家都知道在软考备考过程中,拥有一套全面且实用的考试资料对于考生来说至关重要。目录如下: 历年真题及详解2004-2019 …...

前端 React 弹窗式 滑动验证码实现

目录 一、安装依赖 1、rc-slider-captcha 2、create-puzzle 二、个人封装好的组件拿去用 三、效果展示 一、安装依赖 这里需要引入两个依赖,若有后端图片接入,可以不引入第二个依赖 1、rc-slider-captcha 滑动验证码生成的库 国内网&#xff1a…...

【触想智能】工业触摸一体机在金融智能设备领域上应用的优势

工业触摸一体机在金融智能设备领域上具有许多独特的优势。这些设备结合了工业级的强度和耐用性,以及先进的触控技术和高性能处理能力,为金融机构提供全面可靠的解决方案。下面将介绍工业触摸一体机在金融智能设备领域上的应用优势。 触想嵌入式工业触摸一…...

本地实现Rtsp视频流推送

简言:使用ffmpeg实现本地视频流推送 srs存储(延时推送) 准备工作 安装包: ffmpeg:http://ffmpeg.org/download.html EasyDarwin:EasyDarwin流媒体音视频资源汇总 srs安装教程地址:http://…...

人工智能中的卷积神经网络(CNN)综述

文章目录 前言 1. CNN的基本原理 1.1 卷积层 1.2 池化层 1.3 全连接层 2. CNN的发展历程 2.1 LeNet-5 2.2 AlexNet 2.3 VGGNet 2.4 ResNet 3. CNN的主要应用 3.1 图像分类 3.2 目标检测 3.3 语义分割 3.4 自然语言处理 4. 未来研究方向 4.1 模型压缩与加速 4.2 自监督学习 4.3 …...

Mac电脑交叉编译iphone设备可以运行的redsocks, openssl, libsevent

准备:intel x86_64芯片的mac电脑,系统为mac os15.3.1,iphone为6s的ios14.4(rootful越狱) 第一步:准备工具链(推荐使用 theos clang) 如果你已经安装过 Theos(或 NewTheos)&#x…...

入门51单片机(1)-----点灯大师梦开始的地方

前言 这一次的博客主要是要记录一下学习的记录的,方便以后去复习一下的,当然这篇博客还是针于零基础的伙伴萌,看完这篇博客,大家就可以学会点灯了。 安装软件 方法一下一下来教!!萌新宝贝萌可以学会的!帮…...

[1-01-09].第08节:基础语法 - 数组常见算法 + Arrays工具类 + 数组中常见异常

一、 数组的常见算法 1.1 数值型数组特征值统计 这里的特征值涉及到:平均值、最大值、最小值、总和等 **举例1:**数组统计:求总和、均值 public class TestArrayElementSum {public static void main(String[] args) {int[] arr {4,5,6,…...

dnf install openssl失败的原因和解决办法

网上有很多编译OpenSSL源码(3.x版本)为RPM包的文章,这些文章在安装RPM包时都是执行rpm -ivh openssl-xxx.rpm --nodeps --force 这个命令能在缺少依赖包的情况下能强行执行安装 其实根据Centos的文档,安装RPM包一般是执行yum install或dnf install。后者…...

UE5 Chaos :官方文献总结 + 渲染网格体 (Render Mesh) 和模拟网格体 是如何关联的?为什么模拟网格体 可以驱动渲染网格体?

官方文献:https://dev.epicgames.com/community/learning/tutorials/pv7x/unreal-engine-panel-cloth-editor 1. 流程概述 本文档介绍了如何通过面板编辑器(Panel Editor)在Unreal Engine中生成基于面板的布料资源。流程主要包含从Marvelou…...

Swift观察机制新突破:如何用AsyncSequence实现原子化数据监听?

网罗开发 (小红书、快手、视频号同名) 大家好,我是 展菲,目前在上市企业从事人工智能项目研发管理工作,平时热衷于分享各种编程领域的软硬技能知识以及前沿技术,包括iOS、前端、Harmony OS、Java、Python等…...

Lombok库

文章目录 Lombok1.介绍2.主要注解2.1如何使用 Lombok2.1.1添加依赖2.1.2 使用Lombok注解2.1.3Lombok的其他常用注解ValueBuilderGoF23种设计模式之一:建造模式使用Builder注解自动生成建造模式的代码 SingularSlf4j使用选择合适的注解 Lombok 1.介绍 Lombok 是一个…...

算法思想之模拟

欢迎拜访:雾里看山-CSDN博客 本篇主题:算法思想之模拟 发布时间:2025.4.14 隶属专栏:算法 目录 滑动窗口算法介绍核心特点常见问题优化方向 例题替换所有的问号题目链接题目描述算法思路代码实现 提莫攻击题目链接题目描述算法思路…...

Windows 系统如何使用Redis 服务

前言 在学习过程中,我们长期接触到的是Mysql 关系型数据库,也是够我们平时练习项目用的,但是后面肯定会有大型数据的访问就要借助新的新的工具。 一、什么是Redis Redis(Remote Dictionary Server)是一个基于内存的 键…...

2025年常见渗透测试面试题-红队面试宝典上(题目+回答)

网络安全领域各种资源,学习文档,以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具,欢迎关注。 目录 一、如何判断是否是域环境? 二、定位域控的 IP 三、定位域管所在机器 四、Kerberos 核心…...

Base64在线编码解码 - 加菲工具

Base64在线编码解码 - 加菲工具 打开网站 加菲工具 选择“Base64 在线编码解码” 或者直接打开https://www.orcc.top/tools/base64 输入需要编码/解码的内容,点击“编码”/“解码”按钮 编码: 解码: 复制已经编码/解码后的内容。...

前端面试宝典---闭包

闭包介绍 使用闭包: 在函数内声明一个变量,避免外部访问在该函数内再声明一个函数访问上述变量(闭包)返回函数内部的函数使用完毕建议闭包函数null;译放内存 function createCounter() {let count 0;return function () {coun…...

算法:有一个整数数组,长度为n。她希望通过一系列操作将数组变成一个回文数组。

小红有一个整数数组,长度为n。她希望通过一系列操作将数组变成一个回文数组。每次操作可以选择数组中任意两个相邻的元素 ai和 ai1,将它们的值同时加一。请你计算至少需要多少次操作使得数组变成一个回文数组。如果不可能,则输出-1。否则输出…...

数字人:开启医疗领域的智慧变革新时代(5/10)

摘要:数字人技术作为医疗变革的基石,通过多学科融合实现虚拟医生、手术模拟、医学教育等多元应用,贯穿诊前、术中、术后全流程,显著提升医疗效率、优化资源分配、推动个性化服务。尽管面临技术、伦理、数据安全等挑战,…...

正则表达式在线校验(RegExp) - 加菲工具

正则表达式在线校验 - 加菲工具 打开网站 加菲工具 选择“正则表达式在线校验” 或者直接打开https://www.orcc.top/tools/regexp 输入待校验的源文本与正则表达式,点击“校验”按钮 需要注意检验后的内容可能存在多空格,可以拉下去看看~...

某车企面试备忘

记录两个关于Binder的问题,我感觉面试官提的非常好,作一下备忘。 1.通过Binder进行的IPC(进程间通信)是线程阻塞的吗? 参考答案: Binder是Android平台的一种跨进程通信(IPC)机制&…...

从Ampere到Hopper:GPU架构演进对AI模型训练的颠覆性影响

一、GPU架构演进的底层逻辑 AI大模型训练效率的提升始终与GPU架构的迭代深度绑定。从Ampere到Hopper的演进路径中,英伟达通过‌张量核心升级‌、‌显存架构优化‌、‌计算范式革新‌三大技术路线,将LLM(大语言模型)训练效率提升至…...