当前位置: 首页 > news >正文

论文笔记——KIMI-VL:具有增强推理能力的有效开源视觉语言模型

KIMI-VL:具有增强推理能力的有效开源视觉语言模型

原文地址:https://arxiv.org/pdf/2504.07491v1

开源地址:https://github.com/MoonshotAI/Kimi-VL

目录

  • 简介
  • 架构概述
  • 训练方法
  • 主要功能
  • 性能基准
  • 通过长链思考增强推理
  • 应用
  • 结论

简介

视觉语言模型 (VLM) 在人工智能领域正变得越来越重要,使系统能够处理和理解视觉和文本信息。Kimi-VL 代表了开源 VLM 的一项重大进步,解决了开源模型与 GPT-4o 和 Google Gemini 等专有解决方案之间的性能差距。该模型由 Moonshot AI 的 Kimi 团队开发,在效率、可扩展性和推理能力方面进行了创新。

Kimi-VL 架构

图 1:Kimi-VL 架构,展示了 MoonViT 视觉编码器处理各种输入类型、MLP 投影仪和混合专家 (MoE) 语言模型。

Kimi-VL 的独特之处在于其混合专家 (MoE) 架构,该架构允许构建更高效的模型,仅激活 28 亿个参数(总共 160 亿个),同时保持与更大模型相媲美的性能。该模型还具有原生分辨率视觉编码器 (MoonViT),可以处理原始分辨率的图像而无需子图像分割,并支持 128K tokens 的扩展上下文窗口,使其能够处理复杂的、多轮交互和长篇内容。

架构概述

Kimi-VL 的架构包含三个主要组成部分:

  1. MoonViT 视觉编码器:一种原生分辨率视觉编码器,可以处理各种分辨率的图像,而无需进行子图像分割。这使得 Kimi-VL 能够处理各种视觉输入,包括小图像、精细细节、长视频、UI 截图以及具有特殊纵横比的 OCR 内容。该编码器采用了一种打包方法和 2D 旋转位置嵌入 (RoPE) 来保持空间关系。

  2. MLP 投影仪:用作视觉编码器和语言模型之间的桥梁,将视觉特征与语言表示空间对齐。

  3. MoE 语言模型 (Moonlight):基于 DeepSeek-V3,该组件使用 MoE 架构,激活了 28 亿个参数(总共 160 亿个)。MoE 方法使模型能够在保持高性能的同时,保持可控的计算成本。

整个训练过程中使用的优化器是 Muon 的增强版本,它仔细调整了每个参数的更新规模,并包括权重衰减以提高训练稳定性和模型性能。

训练方法

Kimi-VL 的开发遵循结构化的多阶段方法:

训练流程

图 2:Kimi-VL 的预训练阶段,展示了从文本预训练到联合预训练、冷却和长上下文激活的进展。

  1. 预训练阶段

    • 使用 5.2T 数据进行文本预训练
    • 使用 2.0T 数据进行视觉编码器 (ViT) 训练
    • 使用 1.4T 数据进行联合预训练(高达 40% 的多模态)
    • 使用 0.6T 高质量文本和多模态数据进行联合冷却
    • 使用 0.3T 数据进行联合长上下文激活,将 RoPE 基数从 50,000 扩展到 800,000
  2. 后训练阶段

    微调和 RL 阶段

    图 3:后训练流程,展示了监督微调、长链思考 (CoT) 监督微调和强化学习阶段。

  • 联合监督微调 (SFT) 以增强指令遵循能力
  • 长链思维 (CoT) SFT 以实现详细的推理
  • 强化学习进一步提高推理能力,并对过长的回复进行惩罚
  1. 数据构建: 训练利用了多样化的多模态数据,包括字幕数据、交错数据、OCR 数据、知识数据、代理数据和视频数据,这些数据经过精心策划,以确保高质量和非重复性。

  2. 基础设施: 训练采用了 4D 并行(数据、专家、流水线和上下文并行)和 ZeRO1 优化策略,以提高内存效率并减少通信开销。

关键能力

Kimi-VL 展示了几个关键能力,使其区别于其他模型:

  1. 原生高分辨率处理: MoonViT 编码器可以处理原始分辨率的图像,从而能够精确理解视觉细节和复杂文档。

  2. 长上下文理解: 凭借 128K 的上下文窗口,Kimi-VL 可以处理冗长的文档、视频和多轮对话,并在整个过程中保持上下文感知。

  3. OCR 和文档理解: 该模型擅长解析表格、数学方程式和图像中的文本,并将其准确地转换为 Markdown 等结构化格式。

  4. 多语言支持: Kimi-VL 在理解和生成多种语言(包括中文)的内容方面表现出强大的性能,正如其解决中文几何问题的能力所表明的那样。

  5. UI 导航和交互: 该模型可以解释 UI 元素并引导用户浏览应用程序界面,如 Chrome 设置导航示例所示。

  6. 强大的视觉推理: 通过其增强的推理能力,Kimi-VL 可以解决需要视觉感知和逻辑推理的复杂问题。

性能基准

Kimi-VL 在各种基准测试中都取得了具有竞争力的性能,特别是与参数数量相似或更大的模型相比:

Benchmark Performance

图 4:Kimi-VL-A3B 在各种基准类别中的比较性能,包括通用 VLM 任务、OCR、多图像处理、长视频理解、文档理解和代理能力。

在数学推理任务中,Kimi-VL-Thinking 以最少的参数展示了卓越的性能:

MathVision Performance

图 5:MathVision 性能比较,显示 Kimi-VL-A3B-Thinking 以更少的激活参数实现了优于其他模型的结果。

该模型在以下方面表现出强大的性能:

  • MMMU (Massive Multitask Multimodal Understanding) 准确率 57%
  • MMBench-EN 准确率 83.1%
  • InfoVQA 准确率 83.2%
  • LongVideoBench 准确率 64.5%
  • MMLongBench-Doc 准确率 35.1%
  • ScreenSpot-Pro 准确率 34.5%

通过长链思维增强推理能力

Kimi-VL 尤其值得关注的一个方面是通过实施长链思维 (CoT) 处理来增强推理能力。 这种方法最终促成了 Kimi-VL-Thinking 的开发,通过以下方式显着提高了模型解决复杂问题的能力:

  1. 将复杂的任务分解为更小、更易于管理的步骤
  2. 明确详细地描述其推理过程
  3. 在提供最终答案之前评估和改进其方法

Einstein Manuscript Analysis

图 6:Kimi-VL 分析爱因斯坦手稿的思维过程示例,展示了详细的逐步推理。

这种方法的有效性体现在模型性能随思维 token 长度的扩展上:

Reasoning Performance Scaling

图 7:在 MathVision、MathVista 和 MMMU 基准测试中,测试时准确率随最大思考长度的变化而变化。

如图所示,将最大思考 token 长度从 1k 增加到 16k,可以显著提高数学推理基准测试的准确性:MathVision(从 18.7% 提高到 36.8%),MathVista(从 66.7% 提高到 71.3%),以及 MMMU(从 49.2% 提高到 61.7%)。这表明,允许模型拥有更多的“思考空间”可以使其更有效地解决复杂问题。

应用

Kimi-VL 的能力使其适用于广泛的应用:

  1. UI 导航和指导:该模型可以指导用户完成复杂的界面,如其在 Chrome 设置中导航的能力所示。

Chrome Settings Navigation

图 8:Kimi-VL 演示逐步 UI 导航以启用 Chrome 中的“请勿跟踪”功能。

  1. 视频理解:该模型可以从视频内容中提取信息和见解,理解事件的进展和随时间变化的内容。

Video Understanding

图 9:Kimi-VL 分析视频内容以识别和解释演示文稿中对中国谚语的修改。

  1. 文档分析:Kimi-VL 擅长从复杂文档(包括表格和公式)中提取和格式化信息。

Document Processing

图 10:Kimi-VL 处理表格、数学公式和手写文本的示例。

  1. 视觉问答:该模型可以高精度地回答有关图像的问题,即使是对于复杂的场景或专业知识也是如此。

Visual QA Examples

图 11:Kimi-VL 回答各种视觉问题的示例,从识别地标到识别视频游戏环境。

  1. 数学问题解决:Kimi-VL 可以理解和解决以视觉方式呈现的数学问题,并逐步展示其工作过程。

Math Problem Solving

图 12:Kimi-VL 解决了一个用中文呈现的几何问题,展示了语言的多功能性和数学推理能力。

结论

Kimi-VL 代表了开源视觉语言模型领域的重大进步。通过将高效的 MoE 架构与原生分辨率视觉编码器和扩展的上下文窗口相结合,该模型在广泛的任务中实现了有竞争力的性能,同时保持了合理的计算要求。

通过 Long-CoT 监督微调和强化学习开发的 Kimi-VL-Thinking 进一步增强了模型的推理能力,使其能够解决需要视觉理解和逻辑推理的复杂问题。

Kimi-VL 的主要贡献包括:

  1. 一种高效的开源 VLM,仅激活 2.8B 参数,即可实现与更大的模型相比具有竞争力的性能
  2. 一种原生分辨率视觉编码器,可以处理各种视觉输入,而没有分辨率限制
  3. 一个 128K 上下文窗口,可以处理长文档、视频和多轮对话
  4. 通过 Long-CoT 处理增强推理能力
  5. 在通用 VLM 任务、OCR、文档理解和数学推理方面表现出色

这些进步使 Kimi-VL 成为一个多功能的工具,适用于广泛的应用,从 UI 导航和文档处理到复杂的问题解决和教育辅助。作为一种开源模型,Kimi-VL 有助于先进 AI 能力的民主化,使研究人员、开发者和终端用户更容易获得强大的多模态理解能力。

相关文章:

论文笔记——KIMI-VL:具有增强推理能力的有效开源视觉语言模型

KIMI-VL:具有增强推理能力的有效开源视觉语言模型 原文地址:https://arxiv.org/pdf/2504.07491v1 开源地址:https://github.com/MoonshotAI/Kimi-VL 目录 简介架构概述训练方法主要功能性能基准通过长链思考增强推理应用结论 简介 视觉…...

大模型蒸馏-小模型超进化

👏作者简介:大家好,我是爱吃芝士的土豆倪,24届校招生Java选手,很高兴认识大家📕系列专栏:Spring原理、JUC原理、Kafka原理、分布式技术原理、数据库技术、JVM原理、AI应用🔥如果感觉…...

辅助记忆数字和唱名的小工具【仅PC端】

通过网盘分享的文件:random_music_note.exe 链接: https://pan.baidu.com/s/1Akc2gPzAcyhEfPHlbOYLXw?pwd4fua 提取码: 4fua –来自百度网盘超级会员v7的分享...

Android 知识沉淀

注解 1.枚举类型传参优化 enum WeekDay{SUNDAY, MONDAY}public static void setDay(WeekDay day){}我们已知,枚举类型是一个对象,对象占用的空间较大,有 12 个对象头对象的数据部分8 字节对齐,所以这里可以利用注解优化&#xff…...

KiActivateWaiterQueue函数和Queue->Header.WaitListHead队列等待列表的关系

第一部分&#xff1a; if (Thread->ApcState.KernelApcPending && (Thread->SpecialApcDisable 0) && (Thread->WaitIrql < APC_LEVEL)) { } else { // // Insert wait block in ob…...

代码学习总结(一)

代码学习总结&#xff08;一&#xff09; 这个系列的博客是记录下自己学习代码的历程&#xff0c;有来自平台上的&#xff0c;有来自笔试题回忆的&#xff0c;主要基于 C 语言&#xff0c;包括题目内容&#xff0c;代码实现&#xff0c;思路&#xff0c;并会注明题目难度&…...

设计模式 --- 策略模式

​策略模式&#xff08;Strategy Pattern&#xff09;是一种 ​​行为型设计模式​​&#xff0c;用于动态切换算法或策略​​&#xff0c;使得算法可以独立于客户端变化。它通过封装算法策略并使其可互换&#xff0c;提升了系统的灵活性和扩展性&#xff0c;尤其适用于需要多种…...

c++进阶之----智能指针

1.概念 在 C 中&#xff0c;智能指针是一种特殊的指针类型&#xff0c;它封装了裸指针&#xff08;raw pointer&#xff09;的行为&#xff0c;并通过 RAII&#xff08;Resource Acquisition Is Initialization&#xff0c;资源获取即初始化&#xff09;机制自动管理动态分配的…...

08-JVM 面试题-mk

1.JVM 的各部分组成 知道JVM 的好处:知道java 运行机制,排查问题的能力增加,比如内存泄漏、CPU飙高 JVM 是什么:Java Virtual Machine缩写,Java程序的运行环境(java二进制字节码的运行环境) 好处: 一次编写,到处运行自动内存管理,垃圾回收机制从图中可以看出 JVM …...

MTK7628基于原厂的mtk-openwrt-sdk-20160324-8f8e4f1e.tar.bz2 源代码包,配置成单网口模式的方法

一、配置. 在SDK工程下&#xff0c;运行make kernel_menuconfig&#xff0c;如下图所示&#xff1a; Ralink Module --->选上“One Port Only”&#xff0c;如下图所示&#xff1a; 如果P0网口实现WAN口&#xff0c;就配置成W/LLLL,否则就配置成LLLL/W. 二、修改网口的原代…...

青少年编程与数学 02-016 Python数据结构与算法 15课题、字符串匹配

青少年编程与数学 02-016 Python数据结构与算法 15课题、字符串匹配 一、字符串匹配问题的基本概念&#xff08;一&#xff09;定义&#xff08;二&#xff09;术语 二、暴力匹配算法&#xff08;Naive String Matching&#xff09;&#xff08;一&#xff09;算法逻辑&#xf…...

基础层数据从kafka读取写入hbase的优化方案

背景: 上游kafka的topic只有一个分区,所以spark在消费的时候,无论设置的executor数有多少,最终只有一个executor在执行,如果不指定executor num的话,默认是开启两个executor,有一个executor的资源是浪费的,例如下面显示的情况,其实只有一个executor是active的状态. 在消费的时…...

thingsboard3.9.1编译问题处理

问题1&#xff1a; [ERROR] Failed to execute goal org.thingsboard:gradle-maven-plugin:1.0.12:invoke (default) on project http: Execution default of goal org.thingsboard:gradle-maven-plugin:1.0.12:invoke failed: Plugin org.thingsboard:gradle-maven-plugin:1.…...

Adobe Photoshop 2025 Mac中文 Ps图像编辑

Adobe Photoshop 2025 Mac中文 Ps图像编辑 一、介绍 Adobe Photoshop 2025 Mac版集成了多种强大的图像编辑、处理和创作功能。①强化了Adobe Sensei AI的应用&#xff0c;通过智能抠图、自动修复、图像生成等功能&#xff0c;用户能够快速而精确地编辑图像。②3D编辑和动画功…...

什么是VLA

视觉-语言-动作&#xff08;VLA&#xff09;技术综述&#xff1a;迈向具身智能的未来 1. 引言 随着人工智能从单一模态感知迈向多模态交互&#xff0c;视觉-语言-动作&#xff08;Vision-Language-Action, VLA&#xff09; 技术逐渐成为连接感知、推理与物理行动的核心桥梁。V…...

数据结构:C语言版严蔚敏和解析介绍,附pdf

《数据结构&#xff1a;C语言版&#xff08;第2版&#xff09;》严蔚敏李冬梅吴伟民.pdf 《数据结构&#xff1a;C语言版》严蔚敏&#xff0c;李冬梅.pdf 《数据结构C语言第2版习题解析与实验指导》李冬梅.pdf 「《数据结构&#xff1a;C语言版&#xff08;第2版 &#xff09;》…...

C++线段树详解与实现技巧

📚 C++线段树详解与实现技巧 线段树(Segment Tree)是一种高效处理 区间查询 和 区间更新 的数据结构,时间复杂度为 O(log n)。本文结合代码实例,详解其核心原理与实现细节。 🌳 线段树结构特点 完全二叉树:使用数组存储,父子节点关系通过下标计算。区间划分:每个节…...

202527 | RabbitMQ-基础 | 队列 | Direct + Fanout + Topic 交换机 | 消息转换器

RabbitMQ RabbitMQ 架构与核心概念详解 一、整体架构图 #mermaid-svg-UTlKmvHL7RNWK6vu {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-UTlKmvHL7RNWK6vu .error-icon{fill:#552222;}#mermaid-svg-UTlKmvHL7RNWK6v…...

【学习笔记】服务器上使用 nbconvert 将 Jupyter Notebook 转换为 PDF

1. 环境准备&#xff1a;安装必要工具 在服务器终端运行以下命令&#xff0c;确保依赖已安装&#xff1a; (1) 安装 nbconvert 和 pandoc pip install nbconvert pandoc (2) 安装 LaTeX&#xff08;推荐 TeX Live&#xff09; # Ubuntu/Debian sudo apt-get update sudo a…...

List、Set集合通过Stream流求和

目录 一、泛型为Integer、Long、Double、BigDecimal求和 二、泛型为实体类 对单个属性求和 对多个属性分别分组求和 并返回聚合后的对象 多字段乘积求和&#xff08;基本数据类型&#xff09; 多字段乘积求和&#xff08;BigDecimal&#xff09; 对对象中的多个字段求和…...

微软VSCode 能否击败 Cursor 和 Windsurf?

微软是否能利用平台优势和许可限制来阻止竞争对手? AI 代码编辑器之战加剧 蓬勃发展的 AI 代码编辑领域竞争日益激烈,这个最具变革性和盈利性的新技术领域正在适应相互间的竞争。Visual Studio Code 目前是最主导的代码编辑器。 “根据 Stack Overflow 调查,Visual Studi…...

VSCode会击败Cursor和Windsurf吗?

VSCode 会击败 Cursor 和 Windsurf 吗&#xff1f;微软能不能靠自己的地盘优势和规则限制打压对手&#xff1f;答案是"能"&#xff0c;但他们真的会这么干吗&#xff1f; Cursor & Windsurf vs VSCode Copilot 大PKAI编程工具大战越来越激烈现在最火最赚钱的AI…...

机器学习(4)—— K近邻算法

文章目录 1. K近邻算法&#xff08;K-Nearest Neighbors, KNN&#xff09;原理1.1. K近邻算法是什么算法&#xff1f;1.2. 核心思想 2. K近邻算法的步骤2.1. 选择K值2.2. 计算距离2.3. 选择最近邻&#xff1a;2.4. 做出预测&#xff1a; 3. K值的选择4. 数据标准化5. 优缺点6. …...

深入解读 React 纯组件(PureComponent)

什么是纯组件&#xff1f; React 的纯组件(PureComponent)是 React.Component 的一个变体&#xff0c;它通过浅比较(shallow comparison)props 和 state 来自动实现 shouldComponentUpdate() 方法&#xff0c;从而优化性能。 核心特点 1. 自动浅比较&#xff1a; PureCompon…...

常见MQ及类MQ对比:Redis Stream、Redis Pub/Sub、RocketMQ、Kafka 和 RabbitMQ

常见MQ及类MQ对比 基于Grok调研 Redis Stream、Redis Pub/Sub、RocketMQ、Kafka 和 RabbitMQ 关键点&#xff1a; Redis Pub/Sub 适合简单实时消息&#xff0c;但不持久化&#xff0c;消息可能丢失。Redis Stream 提供持久化&#xff0c;适合需要消息历史的场景&#xff0c;但…...

202528 | RabbitMQ-高级 | 消息可靠性 | 业务幂等性 | 延迟消息

消息可靠性 RabbitMQ发送者可靠性 一、发送者重连机制 #mermaid-svg-gqr6Yr5UNZX87ZDU {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-gqr6Yr5UNZX87ZDU .error-icon{fill:#552222;}#mermaid-svg-gqr6Yr5UNZX87ZD…...

Java EE期末总结(第六章)

一、IoC 1、Bean装配流程 IOC装配流程在代码中的对应就体现在Service这个注解 依赖注入在代码中体现在 &#xff0c;比如 Resource UserService userService 二、AOP 简化流程&#xff0c;为程序员简便操作 tmd编不下去了我自己看视频都没理解md不弄了&#xff1b; 给两个…...

ASP.NET Core 性能优化:内存缓存

文章目录 前言一、什么是缓存二、内存缓存三、使用内存缓存1&#xff09;注册内存缓存服务2&#xff09;注入与基本使用3&#xff09;高级用法GetOrCreate&#xff08;避免缓存穿透&#xff09;异步方法&#xff1a;GetOrCreateAsync&#xff08;避免缓存穿透&#xff09;两种过…...

Go小技巧易错点100例(二十六)

本期分享&#xff1a; 1. string转[]byte是否会发生内存拷贝 2. Go程序获取文件的哈希值 正文&#xff1a; string转[]byte是否会发生内存拷贝 在Go语言中&#xff0c;字符串转换为字节数组&#xff08;[]byte&#xff09;确实会发生内存拷贝。这是因为在Go中&#xff0c;字…...

《算法笔记》3.5小节——入门模拟->进制转换

1022 D进制的AB #include <iostream> using namespace std; int maxn32;int main() {int z[maxn],num0,a,b,d;cin>>a>>b>>d;int resab;do{z[num]res%d;resres/d;}while(res);for (int i num-1; i >0 ; i--) {cout<<z[i];}return 0; }问题 A:…...

【MQTT-协议原理】

MQTT-协议原理 ■ MQTT-协议原理■ MQTT-服务器 称为"消息代理"&#xff08;Broker&#xff09;■ MQTT协议中的订阅、主题、会话■ 一、订阅&#xff08;Subscription&#xff09;■ 二、会话&#xff08;Session&#xff09;■ 三、主题名&#xff08;Topic Name&a…...

JWT认证服务与授权 .netCore

1.实现流程图 2.认证信息概述 Header:System.IdentityModel.Tokens.Jwt.JwtHeader Payload: System.IdentityModel.Tokens.Jwt.JwtPayload Issuer: http://localhost:7200 Audience: http://localhost:7200 Expiration: 2025/4/11 15:06:14 Claim - Type: http://schemas…...

编译原理 实验二 词法分析程序自动生成工具实验

文章目录 实验环境的准备实验实验预备知识分析案例所要做的任务实战 实验环境的准备 安装flex 安装MinGW MinGW Installation Manager页面 apply changes 下载比较耗时 只看到了一个文件&#xff0c;复制过去 配置环境变量 使用gcc -v检验是否安装完成 实验 实验预备知识…...

【C++初学】课后作业汇总复习(一)概述、输入输出、类的入门——理解封装

一、概述、输入输出、类的入门——理解封装 - 1. ab input two number output sum of a and b; #include <iostream>using namespace std;int main() {int a 0;int b 0;cin >> a >> b;cout << ab <<endl;return 0; }2.输入1~7任意一个整数&…...

数学建模:针对汽车行驶工况构建思路的延伸应用

前言&#xff1a; 汽车行驶工况构建的思简单理解为将采集的大量数据进行“去除干扰、数据处理&#xff0c;缩减至1800S的数据”&#xff0c;并可达到等效替换的目的&#xff0c;可以使在试验室快速复现&#xff1b;相应的解决思路、办法可应用在 “通过能量流采集设备大量采集…...

Qt 之opengl shader language

着色器示例代码 实际运行效果...

dolphinscheduler创建文件夹显示存储未启用的问题--已解决

只要修改api-server/comf/common.properties和standalone-server/conf/common.properties里面的内容就可以了&#xff0c;应为你要靠standalone-server这个服务启动dolphinscheduler-web&#xff0c;其他就算怎么改你重启dolphinscheduler的时候系统也不会识别新的common.prope…...

解密 Linux 线程:多线程编程与资源管理

个人主页&#xff1a;chian-ocean 文章专栏-Linux 前言&#xff1a; 在Linux中&#xff0c;线程 是一种轻量级的执行单元&#xff0c;它是进程的一部分。多个线程可以在同一个进程内并行执行任务&#xff0c;通常它们共享该进程的资源&#xff0c;如内存空间、文件描述符等。…...

Node.js net模块详解

Node.js 的 net 模块提供了基于 TCP 或 IPC 的网络通信能力&#xff0c;用于创建服务器和客户端。以下是 net 模块的核心 API 详解&#xff0c;包含类、方法、事件及示例。 1. 模块引入 const net require(net);2. 核心类与方法 2.1 net.Server 类 用于创建 TCP 或 IPC 服务…...

Node.js中fs模块详解

Node.js 中 fs 模块&#xff08;非 Promise&#xff09;API 详解 Node.js 的 fs 模块提供了同步和异步的文件系统操作。以下是非 Promise 版本的 API 详解&#xff1a; 1. 文件读取操作 const fs require(fs);// 异步读取文件 fs.readFile(file.txt, utf8, (err, data) >…...

Mouse without Borders – 用一套鼠标 / 键盘控制四台电脑

同时操控 2 台电脑&#xff0c;只需一个鼠标和键盘&#xff01;完全免费&#xff0c;由微软官方提供 | 零度解说_哔哩哔哩_bilibili Mouse Without Borders 简介‌ Mouse Without Borders&#xff08;无界鼠标&#xff09;是由微软开发的免费键鼠共享工具&#xff0c;支持在局…...

《车辆人机工程-汽车驾驶操纵实验》

汽车操纵装置有哪几种&#xff0c;各有什么特点 汽车操纵装置是驾驶员直接控制车辆行驶状态的关键部件&#xff0c;主要包括以下几种&#xff0c;其特点如下&#xff1a; 一、方向盘&#xff08;转向操纵装置&#xff09; 作用&#xff1a;控制车辆行驶方向&#xff0c;通过转…...

使用DaemonSet部署集群守护进程集

使用DaemonSet部署集群守护进程集 文章目录 使用DaemonSet部署集群守护进程集[toc]一、使用DaemonSet部署日志收集守护进程集二、管理DaemonSet部署的集群守护进程集1.对DaemonSet执行滚动更新操作2.对DaemonSet执行回滚操作3.删除DaemonSet 一、使用DaemonSet部署日志收集守护…...

破解升腾c10,改造成下载机(第二篇:获取xterm终端)

当c10刷好华为ct3100系统后&#xff0c;就开始获取xterm终端&#xff0c;然后再安装entware. 第一步&#xff1a;获取xterm终端。 点击桌面左下角的工具图标 再点browser 输入百度网址&#xff0c;访问&#xff01; 然后再将网页另存为&#xff5e;&#xff5e;&#xff5e;…...

浏览器多开

使用浏览器的用户功能&#xff0c;创建多个用户即可完成浏览器多开的需求&#xff0c;插件等相对独立 需要命名 然后就可以通过多个用户切换来实现多开了&#xff0c;不同任务选择不同用户...

使用Python实现的音符生成和节拍器程序

推荐超级课程: 本地离线DeepSeek AI方案部署实战教程【完全版】Docker快速入门到精通Kubernetes入门到大师通关课AWS云服务快速入门实战目录 **摘要****先决条件****设置**生成音符频率播放音符节拍器合并结论摘要 节拍器和随机音符生成器各有用途,但单独使用时功能有限。本…...

【生活相关-日语-日本-东京-留学生-搬家后或新入驻-水道局申请饮用水(1)-办理手续】

【生活相关-日语-日本-东京-搬家后-水道局申请饮用水-办理手续】 1、前言2、情况说明&#xff08;1&#xff09;他人代办&#xff08;2&#xff09;打电话&#xff08;3&#xff09;网络申请&#xff08;4&#xff09;你将会面临什么&#xff0c;主要步骤&#xff08;5&#xf…...

PyTorch模型构造实战:从基础到复杂组合

本文通过多个示例演示如何使用PyTorch构建不同类型的神经网络模型&#xff0c;涵盖基础多层感知机、自定义块、顺序块以及复杂组合模型。所有代码均附带输出结果&#xff0c;帮助读者直观理解模型结构。 1. 多层感知机&#xff08;MLP&#xff09; 使用nn.Sequential快速构建一…...

【高性能缓存Redis_中间件】一、快速上手redis缓存中间件

一、铺垫 在当今的软件开发领域&#xff0c;消息队列扮演着至关重要的角色。它能够帮助我们实现系统的异步处理、流量削峰以及系统解耦等功能&#xff0c;从而提升系统的性能和可维护性。Redis 作为一款高性能的键值对数据库&#xff0c;不仅提供了丰富的数据结构&#xff0c;…...

并发编程--互斥锁与读写锁

并发编程–互斥锁与读写锁 文章目录 并发编程--互斥锁与读写锁1. 基本概念2. 互斥锁2.1 基本逻辑2.2 函数接口2.3示例代码12.4示例代码2 3. 读写锁3.1 基本逻辑3.2示例代码 1. 基本概念 互斥与同步是最基本的逻辑概念&#xff1a; 互斥指的是控制两个进度使之互相排斥&#x…...