当前位置: 首页 > news >正文

DeepSeek-Prover-V2模型原理速览

文章目录

  • prerequisite:Lean4
  • 研究亮点
  • 通过子目标分解实现递归证明搜索
    • 基于子目标的定理证明中的课程学习
  • 统一非形式化推理和形式化证明
    • 通过合成数据实现冷启动
    • 以推理为导向的强化学习
  • DeepSeek-Prover-V2 的训练细节
    • 专家迭代
    • 监督式微调
  • 快速使用
  • REF

DeepSeek-Prover-V2-671B 是deepseek在4月30日放出来的一个用于数学推理的模型,模型基于deepseekV3, 在lean4证明框架内做了自动定理证明能力的训练。模型架构如图所示:
在这里插入图片描述
在这里插入图片描述

prerequisite:Lean4

Lean4:Lean 是微软研究院在 2013 年推出的计算机定理证明器。Lean4 于 2021 年发布,为 Lean 定理证明器的重新实现,能够生成 C 代码后进行编译,以便开发高效的特定领域自动化。
Lean作为一门独特的语言,兼具数学和编程两方面的特性。
作为交互式定理证明器,Lean 提供了严格的逻辑框架,数学家可以将数学定理转换成代码,并严格验证这些定理的正确性。
作为通用函数式编程语言,它具有依赖类型的严格的纯函数式语言性质。

研究亮点

  1. DeepSeek-Prover-V2论文提出了一个综合冷启动阶段合成推理数据的pipeline,用于高级形式化定理证明。
  2. DeepSeek-V3 作为作为子目标分解和引理形式化(Lean4证明框架)的统一模型,将高层次的证明草图与形式化步骤相结合,生成一系列可管理的子目标;
  3. 子目标可以利用较小的7B模型高效解决,从而显著降低了计算需求
  4. 开发的课程学习框架利用这些分解后的子目标生成难度逐渐增加的训练任务,从而创建了更有效的学习进程
  5. 通过将完整的正式证明与DeepSeek-V3的思维链推理相结合,建立了宝贵的冷启动推理数据,弥合了非形式化数学思维与形式化证明结构之间的差距。随后的强化学习阶段显著增强了这种联系,从而在形式化定理证明能力上取得了重大进步;

通过子目标分解实现递归证明搜索

将复杂定理的证明分解为一系列较小的引理,利用 DeepSeek-V3作为形式化定理证明中子目标分解的统一工具。

基于V3分解证明步骤:为了证明一个给定的形式化定理陈述,提示 DeepSeek-V3 首先用自然语言分析数学问题,然后将证明分解为更小的步骤,并将每一步翻译为对应的 Lean 形式化陈述。由于通用模型已知在生成完整的 Lean 证明方面存在困难,研究者指导 DeepSeek-V3 仅生成一个省略细节的高层次证明草图。最终的思维链以一个由一系列 “have” 语句组成的 Lean 定理告终,每条语句都以 “sorry” 占位符结束,表示需要解决的子目标。这种方法反映了人类构建证明的风格,即将复杂定理逐步简化为一系列更易于处理的引理序列。

递归求解:借助 DeepSeek-V3 生成的子目标,采用递归求解策略,系统地解决每一个中间证明步骤。从“have”语句中提取子目标表达式,将其替换为原始问题中的目标(见图3(a)),并将前面的子目标作为前提条件纳入(见图3(b))。这种构造使得后续子目标能够利用早期步骤的中间结果来求解,从而促进更局部化的依赖结构,并有助于开发更简单的引理。
为了减少广泛证明搜索的计算开销,使用了一个较小的7B证明模型,该模型专门针对处理分解后的引理进行了优化。在成功解决所有分解步骤后,可以自动生成原始定理的完整证明。
在这里插入图片描述

基于子目标的定理证明中的课程学习

两种类型的子目标定理:利用子目标来扩展用于模型训练的形式化陈述的范围。研究者生成了两种类型的子目标定理:一种将前面的子目标作为前提条件,另一种则不包含,分别对应于图3(b)和图3(a)。这两种类型都被整合到专家迭代阶段(Polu 和 Sutskever,2020),建立了一个逐步引导证明器模型系统地解决一组精选的具有挑战性问题的课程。
这一过程基于与 AlphaProof 的测试时强化学习(DeepMind,2024)相同的底层原理,即通过生成目标问题的变体来增强模型解决具有挑战性的国际数学奥林匹克(IMO)级别问题的能力。在这里插入图片描述

统一非形式化推理和形式化证明

proverV2的算法框架分为两个阶段,利用了两种互补的模型:DeepSeek-V3 用于引理分解,以及一个7B证明模型用于完成相应的形式化证明细节。这种流程提供了一种自然且可扩展的机制,通过结合语言模型的高层次推理与精确的形式化验证,合成形式化推理数据。通过这种方式,在单一模型内统一了非形式化数学推理和证明形式化的能力。

通过合成数据实现冷启动

研究者筛选出一组具有挑战性的问题,这些问题在端到端的处理过程中尚未被7B证明模型解决,但所有分解后的子目标均已成功解决。
通过组合所有子目标的证明,研究者构建了原始问题的完整形式化证明。然后,将这个证明附加到DeepSeek-V3的思维链中,该思维链概述了相应的引理分解,从而产生了一个连贯的非形式化推理与后续形式化证明的综合。这使得研究者能够收集数百个高质量的合成冷启动数据,这些数据成为训练DeepSeek-Prover-V2的基础。

以推理为导向的强化学习

在对证明模型进行合成冷启动数据的微调之后,执行一个强化学习阶段,以进一步增强其将非形式化推理与形式化证明构建相结合的能力。基于RLPAF(基于证明助手反馈的强化学习)方法,使用二元正确与否的反馈作为主要的奖励监督形式。在训练过程中,研究者观察到生成的证明结构经常偏离由思维链指导提供的引理分解。
为解决这一问题,在训练的早期步骤中引入了一致性奖励,惩罚结构上的不一致,明确强制在最终证明中包含所有分解的“have”结构引理。在实践中,强制这种对齐可以提高证明的准确性,尤其是在需要多步推理的复杂定理上。

DeepSeek-Prover-V2 的训练细节

DeepSeek-Prover-V2 是通过一个两阶段训练流程开发的,该流程建立了两种互补的证明生成模式:

  • 高效率非思维链(non-CoT)模式:这种模式专注于快速生成形式化的Lean证明代码,侧重于生成简洁的证明,而不显示明确的中间推理步骤。
  • 高精度思维链(CoT)模式:这种模式系统地阐述中间推理步骤,强调透明性和逻辑连贯性,然后构建最终的形式化证明。
    与DeepSeek-Prover-V1.5(Xin等人,2024b)一致,这两种生成模式由两个不同的引导提示控制(具体示例见附录A)。在第一阶段,在课程学习框架内采用专家迭代方法训练一个非思维链(non-CoT)证明模型,同时通过基于子目标的递归证明为难题合成证明。选择非思维链生成模式是为了加速迭代训练和数据收集过程,因为它提供了显著更快的推理和验证周期。在此基础上,第二阶段利用通过整合DeepSeek-V3的复杂数学推理模式与合成形式化证明生成的冷启动思维链(CoT)数据。思维链(CoT)模式通过进一步的强化学习阶段得到增强,遵循通常用于推理模型的标准训练流程。

专家迭代

DeepSeek-Prover-V2的非思维链(non-CoT)模式的训练过程遵循专家迭代(Polu和Sutskever,2020)的范式,这是开发形式化定理证明器的广泛采用的框架。在每次训练迭代中,当前最佳的证明策略被用于生成对之前迭代中尚未解决的难题的证明尝试。这些由Lean证明助手验证成功的尝试被纳入SFT数据集,用于训练改进的模型。这种迭代循环确保模型不仅从初始演示数据集中学习,还能提炼出自己的成功推理轨迹,逐步提高解决更难问题的能力。整体训练过程与DeepSeek-Prover-V1(Xin等人,2024a)和DeepSeek-Prover-V1.5(Xin等人,2024b)基本保持一致,仅对训练问题的分布进行了两处修改。
首先,纳入了来自自动形式化和各种开源数据集(Ying等人,2024;Dong和Ma,2025;Lin等人,2025)的额外问题,扩大了训练问题领域的覆盖范围。其次,通过子目标分解生成的问题扩充了数据集,旨在解决MiniF2F基准测试(Zheng等人,2022)的验证集中更具挑战性的实例。

监督式微调

在DeepSeek-V3-Base-671B(DeepSeek-AI,2024)上进行监督式微调,使用恒定的学习率5e-6,在16,384个标记的上下文窗口内进行训练。训练语料库由两个互补的来源组成:(1)通过专家迭代收集的非思维链(non-CoT)数据,这些数据生成不含中间推理步骤的Lean代码;(2)在第2.2节中描述的冷启动思维链(CoT)数据,这些数据将DeepSeek-V3的高级数学推理过程提炼成结构化的证明路径。非思维链(non-CoT)部分强调在Lean定理证明器生态系统中的形式化验证技能,而思维链(CoT)示例则明确模拟将数学直觉转化为形式化证明结构的认知过程。
在这里插入图片描述
未来工作将致力于将这一范式扩展到类似AlphaProof的系统,最终目标是攻克代表自动化定理证明前沿挑战的国际数学奥林匹克(IMO)级别的数学问题。


快速使用

DeepSeek-Prover-V2-671B 与DeepSeek-V3使用同样的模型架构。使用transformers库加载Prover-V2-7B模型。

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch
torch.manual_seed(30)model_id = "DeepSeek-Prover-V2-7B"  # or DeepSeek-Prover-V2-671B
tokenizer = AutoTokenizer.from_pretrained(model_id)formal_statement = """
import Mathlib
import Aesopset_option maxHeartbeats 0open BigOperators Real Nat Topology Rat/-- What is the positive difference between $120\%$ of 30 and $130\%$ of 20? Show that it is 10.-/
theorem mathd_algebra_10 : abs ((120 : ℝ) / 100 * 30 - 130 / 100 * 20) = 10 := bysorry
""".strip()prompt = """
Complete the following Lean 4 code:```lean4
{}
Before producing the Lean 4 code to formally prove the given theorem, provide a detailed proof plan outlining the main proof steps and strategies.
The plan should highlight key ideas, intermediate lemmas, and proof structures that will guide the construction of the final formal proof.
""".strip()chat = [{"role": "user", "content": prompt.format(formal_statement)},
]model = AutoModelForCausalLM.from_pretrained(model_id, device_map="auto", torch_dtype=torch.bfloat16, trust_remote_code=True)
inputs = tokenizer.apply_chat_template(chat, tokenize=True, add_generation_prompt=True, return_tensors="pt").to(model.device)import time
start = time.time()
outputs = model.generate(inputs, max_new_tokens=8192)
print(tokenizer.batch_decode(outputs))
print(time.time() - start)

REF

https://github.com/deepseek-ai/DeepSeek-Prover-V2
https://deepseeksai.com/prover-v2-671b/
DeepSeek-Prover-V2:AdvancingFormalMathematicalReasoningvia
ReinforcementLearningforSubgoalDecomposition:https://arxiv.org/pdf/2504.21801
https://huggingface.co/deepseek-ai/DeepSeek-Prover-V2-7B/tree/main
https://lean-zh.lookeng.cn/

相关文章:

DeepSeek-Prover-V2模型原理速览

文章目录 prerequisite:Lean4研究亮点通过子目标分解实现递归证明搜索基于子目标的定理证明中的课程学习 统一非形式化推理和形式化证明通过合成数据实现冷启动以推理为导向的强化学习 DeepSeek-Prover-V2 的训练细节专家迭代监督式微调 快速使用REF DeepSeek-Prove…...

网络编程,使用select()进行简单服务端与客户端通信

这里在Ubuntu环境下演示 一般流程 服务端常用函数: socket():创建一个新的套接字。bind():将套接字与特定的IP地址和端口绑定。listen():使套接字开始监听传入的连接请求。accept():接受一个传入的连接请求&#xff…...

QT数据库实验

一、实验目的和要求 1、掌握Qt中掌握绘图工具和图形界面设计;绘制常见的图形。 2、熟悉Qt界面设计中常用的控件。 3、了解滚动条、滑动条、进度条、旋转按钮控件的用法。 二、实验内容 1、设计一个绘图软件,完成图像的绘制操作。 2、建立按钮的信号…...

【PyTorch完全指南】从深度学习原理到工业级实践

目录 🌟 前言技术背景与价值当前技术痛点解决方案概述目标读者说明🔍 一、技术原理剖析核心概念图解核心作用讲解关键技术模块技术选型对比🛠 二、实战演示环境配置要求核心代码实现1. 基础Tensor操作2. 神经网络构建3. 训练循环实现运行结果验证⚡ 三、性能对比测试方法…...

Spring AI 实战:第七章、Spring AI Advisor机制之记忆大师

引言:当AI的记性比金鱼还差 你:我叫张三,很高兴认识你AI:很高兴认识你,张三! 如果你有任何问题或者需要帮助,请随时告诉我你:我叫什么AI:抱歉,我无法知道你的名字。不过你可以告诉我一些关于你的信息,如果你愿意分享的话!AI的内心OS:爱谁谁,我反正不知道 如上图所…...

工业AI质检:从传统算法到多模态大模型应用

工业AI质检:从传统算法到多模态大模型应用 引言 在制造业质量控制领域,传统人工检测的漏检率高达15%-20%,而基于规则算法的视觉检测系统仅能处理已知缺陷类型。随着多模态大模型技术的突破,工业质检正进入"认知智能"新阶段——系统不仅能识别缺陷,更能理解工艺…...

STM32智能垃圾桶:四种控制模式实战开发

简介 从零到一打造企业级智能垃圾桶系统,实现按键、语音、红外、蓝牙多模式控制。本项目采用STM32F103C8T6作为主控芯片,通过模块化设计整合多种控制方式,确保系统稳定、高效且易于维护。文章将提供完整硬件连接方案、代码实现细节及企业级开发技术,帮助开发者掌握智能垃圾…...

Python语句入门:从基础到实践

Python作为一门简洁优雅的编程语言,其语句结构清晰易懂,非常适合初学者学习。本文将全面介绍Python中的各种基本语句,帮助编程新手快速掌握Python编程基础。语句是计算机执行程序的最小单位。 一、Python语句概述 Python程序由一系列语句组…...

Kubernetes(k8s)学习笔记(五)--部署Ingress实现域名访问和负载均衡

Ingress是基于nginx,通过在k8s中部署ingress,可实现域名访问和pod节点间的负载均衡。 下面是实现过程: 一.准备一个ingress-controller.yaml文件 apiVersion: v1 kind: Namespace metadata:name: ingress-nginxlabels:app.kubernetes.io/n…...

数据库MySQL学习——day8(复习与巩固基础知识)

文章目录 1. 数据库基础概念复习2. 常用SQL命令复习2.1 SELECT 查询数据2.2 INSERT 插入数据2.3 UPDATE 更新数据2.4 DELETE 删除数据 3. 表操作复习3.1 创建表3.2 修改表3.3 删除表 4. 实践任务4.1 创建样例数据库和表4.2 插入和更新数据4.3 使用WHERE、ORDER BY、LIMIT进行查…...

【ArcGIS微课1000例】0144:沿线或多边形要素添加折点,将曲线线段(贝塞尔、圆弧和椭圆弧)替换为线段。

文章目录 增密工具介绍举例1. 圆2. 椭圆3. 折线增密工具介绍 沿线或多边形要素添加折点。还可将曲线线段(贝塞尔、圆弧和椭圆弧)替换为线段。 原理图如下所示: 用法: 通过距离参数对直线段进行增密。利用距离、最大偏转角或最大偏移偏差参数,通过增密操作对曲线段进行简化…...

python中的模块/库

python中的模块/库 什么是库/模块,通俗来讲是用来干啥的? 模块/库就是一个/多个.py的一个文件。通常是用来定义一些通用的方法,避免代码冗余。怎么python中自带的这些模块和库? 使用import进行导入,之后其中的内容就可…...

全面掌握 Jetpack Compose 的 State 体系:核心用法与最佳实践

Jetpack Compose 中的 State 类型全面解析 Jetpack Compose 提供了多种 State 类型来管理 UI 状态。以下是主要的 State 类型及其使用场景: 基础 State 类型 1. mutableStateOf 最基本的可观察状态,用于简单值的变化跟踪: var count by …...

Pyhton类方法添加装饰器案例解析

from functools import wrapsdef keep_alive(func):"""装饰器:为方法自动维护长连接"""wraps(func)def wrapper(self, *args, **kwargs):if not self.conn:self.conn ConnectHandler(**self.device_params)self.conn.enable()return…...

58认知干货:创业经验分享及企业形式的汇总

机会永远都是留给有眼光、能发现机会的人,而不是留给有准备的人!往往机会就在身边,普罗大众却无法发现,而真正适合创业的人,天然具备这方面的能力。 当然后天的补足也未尝不可:“故常有欲以观其微,常无欲以观其妙。””引用《道德经》 读懂这句话自然便会拥有对商业和…...

n8n 快速入门2:构建自动化工作流

n8n 快速入门2:构建自动化工作流 什么是n8n?项目目标准备工作步骤一:创建新工作流步骤二:添加触发节点步骤三:配置NASA节点与凭证1. 添加NASA节点2. 设置NASA API凭证3. 使用表达式设置时间范围步骤四:添加If条件节点1. 创建条件分支2. 测试条件逻辑步骤五:配置输出节点…...

TimSort算法解析

文章目录 1. 核心数据结构1.1 TimSort类定义1.2 关键概念:Run 2. TimSort解决的具体问题分析2.1 处理现实世界中的数据特性2.2 提高排序稳定性2.3 优化归并排序的空间复杂度2.4 处理特殊情况的鲁棒性2.5 适应性能力与算法自调整2.6 优化合并操作效率 3. TimSort核心…...

CATIA高效工作指南——曲面设计篇(一)

引言 在工业设计领域,CATIA的曲面建模与线束展开功能是构建复杂产品的核心技术。本文整合了​​曲面封闭性检查​​、​​无参数曲面创建​​、​​缝合优化策略​​等核心知识点,结合实战案例与高阶技巧,为工程师提供系统化的解决方案。 一…...

PCB叠层设计方案

1叠层处理 在设计多层 PCB 电路板之前, 设计者需要首先根据电路的规模、 电路板的尺寸和电磁兼容( EMC)的要求来确定所采用的电路板结构, 也就是决定采用 4 层,6 层, 还是更多层数的电路板。 这就是设计多层…...

机器人编程基础---C语言中的控制语句

C语言中的控制语句 C语言中的控制语句条件语句if 语句switch 语句循环语句for 循环while 循环do-while 循环代码示例C语言中的控制语句 控制语句是编程中用于控制程序执行流程的语句。在C语言中,控制语句包括条件语句和循环语句,它们允许程序根据条件选择不同的执行路径或重…...

13.Excel:分列

一 分列的作用 将一个单元格中的内容拆分到两个或多个单元格当中。 二 如何使用 1.常规分列使用 注意:分列功能一次只能拆分一列。 长度一致或者数据间有分隔符。 补充:快速选择一列。 CTRL shift 向下箭头。 补充:中英文逗号不同。 可以先通…...

理解数学概念——幂律(power law)

在统计学中,幂律(power law)(即按照幂的规律)是指两个量之间的函数关系,其中一个量的相对变化会导致另一个量以与常量指数成正比的关系产生相对变化:一个量随着另一个量的幂而变化。(例如, ,r 的变化导致s 按照幂 的…...

Go语言chan底层原理

本篇文章内容参考小徐先生等文章,带有个人注解等内容,帮助大家更好的了解chan的底层实现,原文是在语雀chan底层,可以点击查看,如果感觉还不错的同学,不妨点一个免费的赞和关注,冲冲冲&#xff0…...

传感器数据处理笔记

里程计模型: 两轮差分地盘的运动学模型三轮全向底盘的运动学模型航迹推算(Dead Reckoning) 里程计标定 线性最小二乘的基本原理最小二乘的直线拟合最小二乘在里程计标定中的应用 差分底盘的优势就是: 结构简单便宜&#xff0…...

8.5 从零到生产:Docker+K8s+CI/CD全链路部署实战手册

从零到生产:Docker+K8s+CI/CD全链路部署实战手册 #mermaid-svg-61OPZrCvQokymEG2 {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-61OPZrCvQokymEG2 .error-icon{fill:#552222;}#mermaid-svg-61OPZrCvQokymEG2 .err…...

Android逆向学习(八)Xposed快速上手(上)

Android逆向学习(八)Xposed快速上手(上) 前言 xposed是一个用来hook的工具,简而言之,通过替换/system/bin/app_process程序控制zygote进程,这样的话,app_process在启动过程中会加载XposedBridge.jar这个j…...

Linux网络编程:套接字

目录 一 前言 二 源ip地址和目的ip地址 三 认识端口号 四 理解 "端口号" 和 "进程ID" 五 理解源端口号和目的端口号 六 认识TCP(Transmission Control Protocol)协议 七 UDP((User Datagram Protocol&#xff…...

C++八股--6--mysql 日志与并发控制

这里向大家介绍一下数据库基础:共分为以下章节 10前序.日志系统 这是数据库的核心。我放到首页来介绍,给大家一个前置概念,方便进行更好的学习 日志文件我们用来记录事务对数据库更新操作的文件,分为以记录为单位的文件和数据块…...

bc 命令

一.bc 命令概述 bc 是 Linux 系统中一个用于任意精度算术运算的计算器语言,它支持整数和浮点数的计算,还能进行复杂的数学运算。在你给出的代码里,bc 被用来执行数值比较和计算。 二.| bc 和 | bc -l 的作用与功能 1. | bc | 是管道符号&…...

文献分享:CH-CL配对和VL结构域的完整性影响IgG1分泌过程

背景 IgG抗体的CH1结构域通过内质网蛋白质量控制(ERQC)机制,由分子伴侣BiP介导,控制抗体的组装和分泌。然而,目前尚不清楚这一过程是否需要可变域。2024年5月2日,韩国亚洲大学的研究人员在Frontiersin Mol…...

【vue3】黑马程序员前端Vue3小兔鲜电商项目【八】

黑马程序员前端Vue3小兔鲜电商项目【八】登录页面 登录页面的主要功能就是表单校验和登录登出业务。 账号密码 accountpasswordcdshi0080123456cdshi0081123456cdshi0082123456cdshi0083123456cdshi0084123456cdshi0085123456cdshi0086123456cdshi0087123456cdshi0088123456 …...

spring cloud 与 cloud alibaba 版本对照表

Spring cloud的组件 spring官方提供netflix提供alibaba提供其它注册中心consuleurekanacosapache(zookeeper)、tencent(paloris北极星)负载均衡loadBalancerribbondubbo远程调用openFeignfeigndubbogoogle(grpc)熔断器cricutBreakerhystrixsentinel网关gatewayzuul第一代MSE&a…...

Rockermq的部署与使用(0-1)

​RocketMQ​ 是阿里巴巴开源的一款 ​分布式消息中间件,具有高吞吐、低延迟、高可用等特点,广泛应用于多个领域,包括异步通信解耦、企业解决方案、金融支付、电信、电子商务、快递物流、广告营销、社交、即时通信、移动应用、手游、视频、物…...

基于SpringBoot + HTML 的宠物医院预约管理

宠物医院管理系统,java项目,springboot项目。idea能打开运行。 使用技术:springboot,mybatis,HTML ,mysql 5.7 共分为三个角色:系统管理员、医生、用户 功能模块:系统管理&#xff0…...

Python的ArcPy基于Excel表格对大量遥感影像批量重分类

本文介绍基于Python中的ArcPy模块,以Excel表格内的信息,对遥感影像加以重分类的方法。 首先,明确一下本文的需求。现有按照文章ArcPy批量将栅格文件的属性表导出为Excel表格的方法(https://blog.csdn.net/zhebushibiaoshifu/artic…...

qml显示视频帧(QQuickImageProvider)

一、实现方式 解码视频可以选择:opencv、ffmpeg等。 显示视频可以选择:Qt Multimedia、QQuickImageProvider、ShaderEffect、自定义QQuickItem等。 本文使用opencv解码视频,QQuickImageProvider显示视频。 二、QQuickImageProvider 中,requestImage 和 requestTexture区…...

硬件工程师面试常见问题(13)

第六十一问:电压跟随器问题(有待改进) 电压跟随器主要用途在哪里? 答:电压跟随器主要用途:一般用于多级放大电路的输入入级、输出级,也可连接两电路,起缓冲作用。 电压跟随器电路连…...

[特殊字符] 专业角度深入讲解:大模型备案(生成式人工智能)

🏷️ 一、什么是大模型备案? 大模型备案是指 大模型产品 在向公众开放及商用之前,经过 国家互联网信息办公室(网信办) 等监管部门的 备案审批 过程。 ✅ 目的: 加强生成式 AI 服务的合规管理 促进 AI 技…...

机器学习的简单介绍

目录 一、发展历程与学科定位 二、核心研究方向与技术突破 三、技术挑战与瓶颈 四、未来趋势与创新方向 五、应用场景与产业影响 总结与展望 机器学习作为人工智能的核心分支,近年来在理论和应用层面均取得了突破性进展。本文将从发展历程、核心研究方向、…...

多语言笔记系列:Polyglot Notebooks 混合使用多语言并共享变量

混合使用多语言并共享变量 混合使用多种语言(C#、F#、Powershell、SQL、KQL、Python、Html、JavaScript、JavaScript、Mermaind等语言),是多语言笔记的最大特性,并且支持各语言之间共享变量这一创新功能。 语言及共享变量的支持情况 语言变量共享C#支…...

操作系统结构图

操作系统组成结构 ├── 用户界面(外壳) │ ├── 图形用户界面(GUI): 提供可视化交互(如窗口、图标) │ └── 命令行界面(CLI): 通过文本指令操作(如Bash、PowerShe…...

Docker 使用与部署(超详细)

目录 引入 入门使用 部署对比 镜像仓库 命令解释 基础 常见命令 示例 数据卷的使用 数据卷的概念 数据卷的使用 挂载本地目录文件 镜像 结构 Dockerfile 容器网络 部署 DockerCompose 语法 ​编辑 基础命令 引入 当我们在 Linux 上部署一个集成了很多中间件…...

Android第三次面试总结之Java篇补充

一、Array 与 ArrayList 在 Android 中的深度对比与优化 1. 内存模型与性能差异的本质原因 数组(Array)的内存布局 基本类型数组(如 int[])在 Java 中是连续的原始数据块,直接存储值,无额外对象开销&#…...

CVPR2023 | 通过降低对图像块损坏的敏感性来提高视觉Transformer的鲁棒性

Improving Robustness of Vision Transformers by Reducing Sensitivity to Patch Corruptions 摘要-Abstract引言-Introduction相关工作-Related Work降低对Patch损坏的敏感性-Reducing Sensitivity to Patch Corruptions实验-Experiments分析与讨论-Analysis and Discussions…...

NV228NV254固态美光颗粒NV255NV263

NV228NV254固态美光颗粒NV255NV263 美光颗粒固态硬盘技术解析与选购指南 一、美光颗粒技术体系解析 1. 颗粒分类与性能差异 美光颗粒采用独特编号体系,NV254(如MT29F8T08GLLBHL4-36QMES)代表8Tb TLC颗粒,采用BOS(浮…...

LeetCode 1007. 行相等的最少多米诺旋转 题解

示例 输入:tops [2,1,2,4,2,2], bottoms [5,2,6,2,3,2] 输出:2 解释: 图一表示:在我们旋转之前, tops 和 bottoms 给出的多米诺牌。 如果我们旋转第二个和第四个多米诺骨牌,我们可以使上面一行中的每个…...

c盘怎么安全清理---微软电脑管家

1、c盘红了怎么办 问了ai,也是要安装第三方的软件,win自带的不行吗?找找看 2、主角登场 仔细一看确实是官方自带的 3、使用自带工具扫描 4、转移文件到其他的盘 系统应用管理中的工具里面有个可以转移安装的软件到d盘,有一些软…...

C语言----指针入门篇

1. 指针是什么? 指针理解的两个要点: 1. 指针是内存中一个最小单元的编号 也就是地址 2. 平时口语中说的指针 通常指的是指针变量 是用来存放内存地址的变量 下面我将会具体解释上面两个要点 这时我们就不得不提一提内存了 1.1 什么是内存呢? C语言中的内存布局 程序…...

GitHub 趋势日报 (2025年05月03日)

本日报由 TrendForge 系统生成 https://trendforge.devlive.org/ 📈 今日整体趋势 Top 10 排名项目名称项目描述今日获星总星数语言1hacksider/Deep-Live-Camreal time face swap and one-click video deepfake with only a single image⭐ 1582⭐ 59337Python2aip…...

Go-Spring 全新版本 v1.1.0

Go-Spring 全新版本 v1.1.0 已于 2025 年发布。该版本具有诸多新特性,具体如下: 命名与结构优化:命名更加符合 Go 规范,模块划分更加合理,核心设计更加简洁。功能增强:突破性地支持统一日志框架&#xff0c…...