当前位置: 首页 > news >正文

通过推测搜索加速大型语言模型推理 (SpecSearch) 论文总结

通过推测搜索加速大型语言模型推理 (SpecSearch) 论文总结

1. 研究背景与任务

基于树搜索的推理方法(如思维树Tree-of-Thoughts)通过探索多个中间推理步骤,显著增强了大型语言模型(LLMs)的推理能力。然而,这些方法需要生成大量推理思考,导致推理延迟增加了几个数量级,严重限制了LLM在实时应用中的适用性。这种延迟主要源于思考生成环节,占据了超过91%的总推理时间,构成了效率的主要瓶颈。面对这些挑战,研究者们致力于开发一种能够在保持推理质量的同时显著加速基于树搜索的LLM推理过程的新框架。

2. SpecSearch方法

论文提出了"推测搜索"(Speculative Search, SpecSearch)框架,结合了创新的思考生成方法和质量保证机制。理解这一方法之前,有必要先了解基于树搜索的推理基础。

2.1 基于树搜索的推理基础

在基于树搜索的推理架构中,整个推理过程被构建为一棵树。每个节点代表一个推理思考或步骤,节点之间的边表示推理的逻辑流动,而从根节点到叶节点的完整路径则代表一个推理解决方案。这种结构由三个核心组件支撑:思考生成器(负责生成可能的推理思考)、思考评估器(评估生成思考的质量)和搜索算法(如束搜索或蒙特卡洛树搜索,决定如何在思考空间中探索)。

2.2 双层推测思考生成器

SpecSearch的第一个创新是引入了双层推测思考生成器,该生成器同时在思考和令牌两个层次工作。在思考级别,小模型被用来并行生成多个完整思考候选项,特别是利用小模型在简单推理步骤上的高效性。这些生成的思考随后由思考评估器进行质量评分。基于预设的质量阈值,系统会拒绝低质量的思考,只保留高质量思考进入搜索树。对于被拒绝的低质量思考,系统会使用大模型进行重新生成,并应用令牌级别的推测解码来加速修正过程。

这种双层设计充分利用了小模型的速度优势和大模型的质量优势,实现了效率与质量的平衡。实验表明,小模型生成的思考中有超过40%的质量实际上超过了大模型的平均水平,这为思考级别的推测提供了坚实基础。

2.3 质量保持拒绝机制

为确保推理质量不受加速过程影响,SpecSearch设计了一种创新的质量保持拒绝机制。该机制为每个推理步骤设置动态质量阈值,这些阈值反映了大模型在相应步骤预期达到的质量水平。通过分析大模型历史推理思考的模式,研究者发现随着推理深入,思考质量通常会逐渐下降。基于这一观察,系统采用了基于历史的统计估计方法,利用指数移动平均(EMA)来更新质量阈值:

β̂(k+1) = θβ̂(k) + (1-θ)Θ(V_p^(k))

其中θ是控制历史数据重要性的超参数(通常设为0.9),Θ是一个非参数统计估计函数,V_p^(k)是当前步骤中大模型修正思考的质量集合。这种机制确保系统只接受质量不低于大模型平均水平的思考,拒绝质量较低的思考并使用大模型进行修正。

2.4 理论保证

SpecSearch框架不仅在实践中表现优异,还提供了严格的数学证明作为理论保障。研究者证明了质量保持条件:如果阈值β不低于大模型的平均质量μ,则推理质量不会降低。具体来说,条件β(k) ≥ μ(k)_p对所有k = 1,2,…,K成立时,系统能够保证质量不会降低。此外,研究还表明,随着样本数N增加,保持质量的概率会单调增加,当N足够大时,这一概率将趋近于1,为系统的可靠性提供了坚实保障。

3. 实验设计

3.1 实验配置

为全面评估SpecSearch的性能,研究者设计了一系列严谨的实验。主要评估使用了MATH-100(100个高级数学竞赛问题)和GSM8K-100(100个小学数学应用题)两个数据集,并在扩展评估中纳入了完整GSM8K(1,319个问题)、AIME(高级数学竞赛题)、Olympiad Bench(奥林匹克数学题)以及HumanEval(代码生成基准)等更多样化的数据集。

实验采用了两种规模的模型配置:大模型使用Qwen2.5-72B-Instruct-GPTQ-Int4和Llama3-70B-Instruct-GPTQ-Int4,小模型则使用对应的较小版本Qwen2.5-7B-Instruct-GPTQ-Int4和Llama3-8B-Instruct-GPTQ-Int4。思考评估器方面,实验采用了MATH-psa和Math-Shepherd两种不同的评估器。

3.2 基线方法与搜索算法

实验将SpecSearch与两种基线方法进行对比:标准自回归生成(AR)和现有的推测采样方法(SpS)。在搜索算法方面,实验使用了两种主流的搜索策略:

束搜索(Beam Search)是一种启发式搜索算法,从根节点开始,在每一层生成多个候选节点,但只保留得分最高的k个节点(称为"束宽度")进入下一层。这种算法通过剪枝保持搜索效率,但可能错过最优解。

蒙特卡洛树搜索(MCTS)则是一种基于模拟的决策算法,包含四个关键步骤:选择(使用UCB等策略从根节点选择最有前途的节点)、扩展(为选中节点生成新的子节点)、模拟(从新节点开始进行随机模拟至终点)和回传(将模拟结果反向传播,更新路径上所有节点的价值)。MCTS能更好地平衡探索与利用,适合复杂决策空间。

评估采用两个主要指标:准确率(正确预测的百分比)和加速比(基线延迟与方法延迟的比值)。

4. 实验结果

4.1 主要性能评估

在MATH-100和GSM8K-100数据集上的实验结果显示,SpecSearch实现了显著的推理加速,同时保持了相当的推理准确率。具体来说,在Qwen模型上,SpecSearch比传统自回归生成(AR)快3.35倍,比现有的推测采样方法(SpS)快1.72倍。在Llama模型上,加速比同样可观,分别达到1.99倍和1.42倍。

最令人印象深刻的是,这种加速几乎没有损害推理准确率。在多数情况下,准确率的变化不超过1个百分点,甚至在Llama模型上的某些数据集中,SpecSearch还略微提高了准确率。下表展示了主要实验结果:

数据集模型方法准确率(%)延迟(秒)vs ARvs SpS
MATH-100QwenAR87.00275.78NA0.51
MATH-100QwenSpS88.00141.551.95NA
MATH-100QwenSpecSearch87.0082.353.351.72
GSM8K-100QwenAR97.00138.24NA0.50
GSM8K-100QwenSpS97.0069.431.99NA
GSM8K-100QwenSpecSearch96.0048.182.871.44

4.2 广泛兼容性实验

SpecSearch的另一个重要优势是其广泛的兼容性。实验表明,该方法能够与不同的搜索算法和思考评估器无缝集成,并在各种组合中保持卓越性能。

在搜索算法兼容性方面,SpecSearch与束搜索配合使用时,比传统方法快2.87倍,准确率为96%;与MCTS结合时,加速比达到2.61倍,准确率高达98%。在思考评估器兼容性方面,SpecSearch与Math-Shepherd评估器配合使用时,加速比达到惊人的4.11倍,准确率为94%;与Math-psa结合时,加速比为2.87倍,准确率为96%。这些结果充分证明了SpecSearch框架的通用性和适应性。

4.3 消融研究与机制分析

为了理解SpecSearch各组件的重要性,研究者在MATH-50数据集上进行了细致的消融研究。实验结果显示,评估模块和拒绝机制对系统性能至关重要。

当评估方法被替换时,准确率从88%显著下降到78%,表明适当的思考评估对保持高质量推理至关重要。同样,拒绝模块的变体实验也证明了设计的合理性:固定阈值导致准确率降至80%,随机拒绝策略不仅准确率降至80%,延迟还有所增加,而简单的大模型参与策略则使准确率降至84%。这些结果证明了SpecSearch原始设计的每个组件都对整体性能有不可替代的贡献。

可视化分析进一步揭示了推理过程中的质量变化规律。研究发现,随着推理步骤的深入,思考质量会逐步下降,从初始步骤的约0.9分降至后期步骤的约0.5分。这一发现为动态质量阈值设计提供了重要依据。此外,分析还确认了小模型的能力:超过40%的小模型生成思考质量超过大模型平均水平,这为思考级别推测提供了坚实基础。

5. 结论与意义

SpecSearch框架在大型语言模型推理加速领域做出了多项重要贡献。首先,它创新性地提出了双层推测架构,首次将推测执行扩展到思考级别,同时巧妙结合思考和令牌两个层次的推测。其次,它设计了动态质量保持拒绝机制,确保推理质量不会因加速而下降。此外,研究还提供了严格的数学证明,从理论上保证了推理质量。

实验结果表明,SpecSearch实现了高达3.35倍的推理加速,同时保持了相当的推理质量。更重要的是,它展示了广泛的兼容性,能够与多种搜索算法、评估器和数据集无缝集成。

这些成果对实际应用具有重要意义。SpecSearch使基于树搜索的高质量推理在实时应用中变得可行,为需要多步骤深度思考的复杂场景提供了加速决策的可能,同时也优化了计算资源的利用,特别是在资源受限场景中。

未来研究可以进一步改进思考评估,开发能更准确识别错误推理的评估器;探索更多模型大小的协同工作模式;以及为不同领域的推理任务定制专门的加速策略。随着这些方向的发展,我们有理由期待LLM推理能力和效率的进一步提升。

6. 原文地址

https://www.arxiv.org/pdf/2505.02865

相关文章:

通过推测搜索加速大型语言模型推理 (SpecSearch) 论文总结

通过推测搜索加速大型语言模型推理 (SpecSearch) 论文总结 1. 研究背景与任务 基于树搜索的推理方法(如思维树Tree-of-Thoughts)通过探索多个中间推理步骤,显著增强了大型语言模型(LLMs)的推理能力。然而,这些方法需要生成大量推理思考,导致…...

从代码学习深度学习 - 语义分割和数据集 PyTorch版

文章目录 前言什么是语义分割?图像分割和实例分割Pascal VOC2012 语义分割数据集Pascal VOC2012 语义分割数据集介绍基本信息语义分割部分特点数据格式评价指标应用价值数据集获取使用提示辅助工具代码 (`utils_for_huitu.py`)读取数据预处理数据自定义语义分割数据集类读取数…...

【计算机视觉】OpenCV实战项目:Deep Machine Learning Tutors:基于OpenCV的实时面部识别系统深度解析

Deep Machine Learning Tutors:基于OpenCV的实时面部识别系统深度解析 1. 项目概述2. 技术原理2.1 面部识别流程2.2 关键技术组件2.2.1 Haar级联分类器2.2.2 深度特征提取 3. 项目实现细节3.1 系统架构3.2 核心算法实现3.2.1 人脸检测3.2.2 实时处理流水线 4. 项目运…...

OSCP - Proving Grounds - EvilBox-One

主要知识点 类似黑盒测试,毫无线索的情况下只能去猜,如果是php文件则会比较容易达到入侵的目的即使有php文件了,由于不知道代码,只能测试一下有没有文件包含漏洞所以反正没线索的时候,就只能猜 具体步骤 nmap扫描&a…...

初识Linux · 传输层协议TCP · 下

目录 前言: 滑动窗口和流量控制机制 流量控制 滑动窗口 1.滑动窗口如何移动 2.滑动窗口的大小如何变化的 3.如果发生了丢包如何解决(快重传) 拥塞控制 延迟应答 面向字节流 RST PSH URG 什么是 PSH? 什么是 URG&…...

OpenCv实战笔记(4)基于opencv实现ORB特征匹配检测

一、原理作用 ORB 原理(Oriented FAST and Rotated BRIEF): 特征点检测:使用 FAST 算法检测角点(关键点)。 方向计算:为每个关键点分配主方向,增强旋转不变性。 特征描述&#xff1a…...

LeetCode LCR 007. 三数之和 (Java)

题目描述 给定一个整数数组 nums,判断是否存在三个元素 a, b, c,使得 a b c 0?找出所有满足条件且不重复的三元组。 解题思路 核心方法:排序 双指针 排序:首先将数组排序,便于后续去重和双指针操作。…...

Spark的三种部署模式及其特点与区别

Spark支持多种集群部署模式,主要分为以下三类: 部署模式特点适用场景资源管理依赖Local模式单机运行,所有进程(Driver、Executor)在同一个JVM中开发调试、小规模数据测试无集群资源管理,仅本地线程模拟无需…...

2505d,d的借用检查器

void func(scope ref int*) {}unique(int*) a ...; assert(a !is null);unique(int*) b a; assert(a is null); assert(b !is null);func(b); // ok用live作为检查器,不必有断定了. int* a ...; int* b a; // 所有权转至b *a 3; // 不能再用a.编译器保证约束指针. live…...

前端EXCEL插件,智表ZCELL产品V3.0 版本发布,底层采用canvas全部重构,功能大幅扩展,性能极致提升,满足千万级单元格加载

本次更新是底层全部重构,按照现代浏览器要求,采用canvas方式进行了重构,预留了将来扩展空间,特别是在大数据量性能提升方面有了较大提升,可以满足千万级单元格加载,欢迎大家体验使用。 体验地址&#xff1…...

如何理解编程中的递归、迭代与回归?

作为编程初学者,递归、迭代和回归这三个概念常常让人感到困惑。本文将通过生活化的比喻、Python代码示例和直观的对比,帮助你彻底理解这三个重要概念及其应用场景。 一、从生活比喻理解核心概念 1. 递归(Recursion)—— 俄罗斯套…...

【金仓数据库征文】学校AI数字人:从Sql Server到KingbaseES的数据库转型之路

摘要:本文围绕学校 AI 数字人项目从 Sql Server 数据库替换至 KingbaseES 数据库的实践展开,涵盖迁移背景、两种数据库对比、替换实施步骤、应用效果展示、问题与解决措施等多方面内容,为教育领域类似项目提供了详实参考。 目录 1.背景与需求…...

stm32 lcd绘制波形和频谱

一、项目准备 主要利用LCD驱动中的画点和画连线函数,驱动是正点原子给我写好了的画点和画线的函数等些相关函数 void LCD_Draw_Circle(u16 x0,u16 y0,u8 r); //画圆 void LCD_DrawLine(u16 x1, u16 y1, u16 x2, u16 y2); //画线 二、画波形图函数实…...

深入理解卷积神经网络的输入层:数据的起点与预处理核心

内容摘要 本文围绕卷积神经网络输入层展开,详细介绍其在网络中的重要作用,包括接收不同领域数据的形式及传递数据的过程。深入解读数据预处理的关键操作,如去均值、归一化和PCA/白化。助力读者透彻理解输入层,为构建高效卷积神经…...

基于大模型与异步技术的股票分析系统实现

在金融量化分析领域,高效的数据获取与智能的策略决策是核心竞争力。本文结合异步数据抓取技术与大模型工具集成,构建一套完整的股票分析系统,实现从海量数据采集到智能信息查询的全流程自动化。 一、量化分析的数据基石:异步高效…...

BUCK基本原理学习总结-20250509

一、电感伏秒平衡特性 处于稳定状态的电感,开关导通时间(电流上升段)的伏秒数须与开关关断(电流下降段)时的伏秒数在数值上相等,尽管两者符号相反。这也表示,绘出电感电压对时间的曲线,导通时段曲线的面积必须等于关断时段曲线的面积。 二、BUCK的基本概念和原理 基…...

BERT类模型

1. BERT类模型是否需要处理 [CLS] 或池化? 那首先搞懂 [CLS] 和池化 (1)[CLS] 的作用 BERT 的输入格式中,每个序列的开头会添加一个特殊的 [CLS] Token(Classification Token)。它的设计初衷是为分类任务…...

Taro 编译不平不同平台小程序

Taro 提供了针对不同小程序平台的编译命令,主要通过 --type 参数指定目标平台。以下是各平台常用命令及说明: --- ### **一、核心命令格式** 1. **直接使用 taro-cli** bash taro build --type [平台类型] taro dev --type [平台类型] # 开发模式&…...

PHP框架在分布式系统中的应用!

随着互联网业务的快速发展,分布式系统因其高可用性、可扩展性和容错性成为现代应用架构的主流选择。而PHP作为一门成熟的Web开发语言,凭借其简洁的语法、丰富的框架生态和持续的性能优化,逐渐在分布式系统中崭露头角。本文将深入探讨PHP框架在…...

PCB设计实践(十三)PCB设计中差分线间距与线宽设置的深度解析

一、差分信号的基本原理与物理背景 差分信号技术通过两条等幅反相的传输线实现信号传输,其核心优势体现在电磁场耦合的对称性上。根据麦克斯韦方程组的对称解原理,两条线产生的电磁场在远场区域相互抵消,形成以下特性: 1. 共模噪…...

在 Kubernetes 中使用 Docker 实现 GPU 支持的完整方案

目录 在 Kubernetes 中使用 Docker 实现 GPU 支持的完整方案 一、背景说明 二、目标 三、环境准备 四、安装 NVIDIA Container Toolkit(nvidia-docker2) 五、配置 Docker 支持 NVIDIA Runtime 六、测试 Docker 能否使用 GPU 七、部署 Kubernetes…...

Vision Transformer(ViT)

Vision Transformer(ViT)是一种将​​Transformer模型​​应用于计算机视觉任务的创新方法,由Google Research团队在2020年提出。它打破了传统卷积神经网络(CNN)在图像处理中的主导地位,通过全局注意力机制…...

(剪映)字幕实现卡拉OK效果

三种实现方式: 一、剪映自带“模板” 二、剪映自带“动画” 三、使用蒙版特效 具体操作步骤如下 模板的方式 一、模板的方式 1.在时间线轨道区 选中文本 2.在工具栏区中的文本-->模板中选择要实现的效果,左键单击,即可实现效果&am…...

Java结构化并发深度解析:原理、设计与实践

作为Java开发者,当我们需要处理复杂的并发场景时,传统的线程和ExecutorService模型往往导致代码难以维护和调试。Java 21引入的结构化并发(Structured Concurrency)通过创新的设计理念彻底改变了这一局面。本文将深入剖析其实现原理、架构设计,并通过复杂场景案例展示其强大…...

【Linux系列】跨平台安装与配置 Vim 文本编辑器

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…...

Level1.5算数运算符与赋值运算符

目录 一、算术运算符和赋值运算符 1.1算术运算符 - * / % // ** 1.2.赋值运算符 - * / % // ** 二、等比例缩小(变量火柴人案例) 三、颜色的三种表达方法取余%运算 1.颜色单词 turtle.pencolor(pink) 2.RGB颜色turtle.pe…...

基于GF域的多进制QC-LDPC误码率matlab仿真,译码采用EMS算法

目录 1.算法仿真效果 2.算法涉及理论知识概要 3.MATLAB核心程序 4.完整算法代码文件获得 1.算法仿真效果 matlab2022a仿真结果如下(完整代码运行后无水印): 本课题实现的是四进制QC-LDPC 仿真操作步骤可参考程序配套的操作视频。 2.算…...

CentOS 7 修改锁屏时间为永不

在 CentOS 7 中,默认情况下,系统会在一定时间不活动后自动锁屏。对于某些用户来说,可能希望禁用自动锁屏功能或者将锁屏时间设置为“永不”。本文将介绍如何通过图形界面和命令行两种方式修改 CentOS 7 的锁屏时间,确保系统永不自…...

STM32-ADC模数转换器(7)

对GPIO来说,它只能读取引脚的高低电平,使用了ADC模数转化器之后,就可以对高电平和低电平之间的任意电压进行量化,最终用一个变量来表示,读取这个变量,就能得到引脚输入的具体电压是多少了。 ADC模数转化器…...

前端SSE技术详解:从入门到实战的完整指南

前端SSE技术详解:从入门到实战的完整指南 一、初识SSE:比WebSocket更轻量的选择 很多开发者第一次听说Server-Sent Events(SSE)时,都会下意识问:“这和WebSocket有什么区别?” 就像选择交通工…...

mac u盘重装mac10.15Catalina系统

我的电脑提mac2017的air 重装过程 (文件夹中间有空格时为 Install\ macOS\ Catalina 才行) (有需要的,最好做一下备份,有些东西可以及时找到配置和文件之类的, u盘制作是在mac电脑上操作的) 一、先下载系统镜像文件或自行到官方…...

8051模板移植

8051模板移植 一,新建工程文件二,Keil配置 一,新建工程文件 在工程文件下建立Driver和User 打开Keil,点击扳手选择芯片型号 出现下图情况,选择是,然后会多出一个启动文件,以后有用 二&…...

轻松制作高质量视频,实时生成神器LTX-Video重磅登场!

探索LTX-Video:实时视频生成跨越新高度 在如今这个视觉内容主导的数字时代,视频生成成为推动创意表达的关键。而今天,我们将带您深入探索LTX-Video,一个强大的开源项目,致力于通过尖端技术将视频生成提升到一个全新的…...

两个数组的交集(暴力、set、哈希)

一.题目 给定两个数组 nums1 和 nums2 ,返回 它们的 交集 。输出结果中的每个元素一定是 唯一 的。我们可以 不考虑输出结果的顺序 。 示例 1: 输入:nums1 [1,2,2,1], nums2 [2,2] 输出:[2]示例 2: 输入&#xf…...

[架构之美]Spring Boot多环境5种方案实现Dev/Test/Prod环境隔离

[架构之美]Spring Boot多环境5种方案实现Dev/Test/Prod环境隔离(十六) 摘要:本文深入剖析Spring Boot多环境配置的5种实现方案,涵盖YAML分组配置、Maven Profile集成、Kubernetes适配等企业级实践,并附赠配置加密方案…...

LWIP的IP协议笔记

IP协议简介 IP协议是TCP/IP协议族的基石,它为上层提供无连接、不可靠的服务 无连接:指IP通信双方都不长久的维持对方的任何信息。这表示上层协议每次发送数据,都需要明确指出对方的IP地址 不可靠:指IP协议不能把IP数据报准确到…...

matlab介绍while函数

MATLAB 中的 while 语句介绍 在 MATLAB 中,while 语句是一种循环结构,用于在满足特定条件时反复执行一段代码块。与 for 循环不同,while 循环的执行次数是动态的,取决于循环条件是否为真。 语法 while condition% 循环体代码 e…...

每日算法刷题Day2 5.10:leetcode数组1道题3种解法,用时40min

4.LC 旋转矩阵(中等,学习) 面试题 01.07. 旋转矩阵 - 力扣(LeetCode) 思想: 法一: 额外空间数组来回赋值拷贝 法二: 1.翻转90度得到等式a[j][n-i-1]a[i][j],但是会改变a[j][n-i-1]原始值,再去看该位置变到哪一位置 分析可得,4个…...

【图书管理系统】深度讲解:图书列表展示的后端实现、高内聚低耦合的应用、前端代码讲解

1.约定前后端交互接口 [请求] /book/getListByPage [参数] currentPage1&pageSize10 [响应] 返回封装的result对象对应的Json数据 2. 整体逻辑 2.1 Controller的逻辑 (1)把接收的参数封装为PageRequest类,里面有属性:curren…...

本地大模型工具深度评测:LM Studio vs Ollama,开发者选型指南

引言 在大语言模型本地化部署的技术浪潮中,隐私保护与成本优化成为核心诉求。LM Studio与Ollama作为两款明星级本地大模型工具,凭借对开源模型的支持能力,成为开发者关注的焦点。本文将从技术架构、应用场景、实操体验三个维度展开深度对比&a…...

天线的PCB设计

目录 天线模块设计的重要性 天线模块的PCB设计 天线模块设计的重要性 当智能手表突然断连、无人机信号飘忽不定——你可能正在经历一场来自天线模块的"无声抗议"。这个隐藏在电子设备深处的关键组件,就像数字世界的隐形信使,用毫米级的精密结…...

《P1226 【模板】快速幂》

题目描述 给你三个整数 a,b,p,求 abmodp。 输入格式 输入只有一行三个整数,分别代表 a,b,p。 输出格式 输出一行一个字符串 a^b mod ps,其中 a,b,p 分别为题目给定的值, s 为运算结果。 输入输出样例 输入 #1复制 2 10 9输…...

推荐一款免费开源工程项目管理系统软件,根据工程项目全过程管理流程开发的OA 办公系统

在当今的工程项目管理领域,许多企业和团队面临着诸多难题。传统的管理方式往往依赖于人工记录和分散的工具,导致项目进度难以实时把控,任务分配不够清晰,合同管理混乱,事件提醒不及时,财务管理缺乏系统性&a…...

AZScreenRecorder最新版:功能强大、操作简便的手机录屏软件

AZScreenRecorder最新版是一款功能强大的手机录屏软件,专为安卓设备设计。它无需ROOT权限,支持无限录制时长,操作简单,录制过程中可以随时暂停,满足不同用户的个性化录屏需求。此外,用户还可以自定义分辨率…...

[sklearn机器学习概述]机器学习-part3

获取数据、数据处理、特征工程后,就可以交给预估器进行机器学习,流程和常用API如下。 1.实例化预估器(估计器)对象(estimator), 预估器对象很多,都是estimator的子类(1)用于分类的预估器sklearn.neighbors.KNeighbors…...

[模型选择与调优]机器学习-part4

七 模型选择与调优 1 交叉验证 (1) 保留交叉验证HoldOut HoldOut Cross-validation(Train-Test Split) 在这种交叉验证技术中,整个数据集被随机地划分为训练集和验证集。根据经验法则,整个数据集的近70%被用作训练集&#xff…...

PyTorch API 1 - 概述、数学运算、nn、实用工具、函数、张量

文章目录 torch张量创建操作索引、切片、连接与变异操作 加速器生成器随机采样原地随机采样准随机采样 序列化并行计算局部禁用梯度计算数学运算常量逐点运算归约操作比较运算频谱操作其他操作BLAS 和 LAPACK 运算遍历操作遍历操作遍历操作遍历操作遍历操作遍历操作遍历操作遍历…...

如何在mac上使用便利贴

可以在 App Store 下载便利贴应用实现在电脑上贴便条的效果。 以 「桌面便利贴」这款应用为例,创建的便利贴会像桌面上的文件一样展示在桌面上,随时可以查看。还可以修改便笺的颜色、透明度、字体、高亮等等。 我比较喜欢的功能是将便签固定在所有窗口的…...

Linux——Mysql索引和事务

目录 一,Mysql索引介绍 1,索引概述 1,索引的优点 2,索引的缺点 2,索引作用 3,索引分类 普通索引 唯一索引 主键索引 组合索引 全文索引 4,查看索引 5,删除索引 6&…...

vim 查看复杂的宏扩展

在一些复杂项目中,使用宏可以简化代码。但是对于刚接触项目的人来说,分析层层嵌套的宏,是件头疼的事情。 使用 vim 的多窗口功能,可以为此提供一些帮助。 如下图,分析4层嵌套的宏,DEFINE_I440FX_MACHINE -…...