当前位置: 首页 > news >正文

AI与计算机视觉(CV):目标检测与图像分割的最新进展

AI与计算机视觉(CV):目标检测与图像分割的最新进展

系统化学习人工智能网站(收藏):https://www.captainbed.cn/flu

文章目录

  • AI与计算机视觉(CV):目标检测与图像分割的最新进展
    • 摘要
    • 引言
    • 算法架构革新:从模块化到端到端
      • 1. 目标检测:实时性与精度的双重突破
      • 2. 图像分割:从语义到实例的精细化演进
    • 数据驱动:从大规模标注到合成数据革命
      • 1. 数据集演进:从通用到垂直
      • 2. 合成数据:破解标注瓶颈
    • 工程化落地:从实验室到产业界
      • 1. 自动驾驶:视觉感知系统的技术博弈
      • 2. 医疗影像:AI辅助诊断的精准化突破
    • 关键挑战与突破方向
      • 1. 技术瓶颈
      • 2. 伦理与安全
      • 3. 成本优化路径
    • 未来展望
    • 结论

摘要

随着深度学习技术的突破与硬件算力的指数级提升,计算机视觉(CV)领域正经历从传统方法向AI驱动范式的结构性变革。目标检测与图像分割作为CV两大核心任务,在自动驾驶、医疗影像、工业质检等场景中呈现技术融合与产业落地的双重趋势。本文从算法架构、数据集演进、工程化落地三个维度,系统梳理YOLOv10、Segment Anything Model(SAM)等前沿技术进展,结合特斯拉Optimus机器人视觉系统、Meta LLaVA多模态大模型等典型案例,剖析当前领域面临的标注成本高、小样本泛化难等挑战,并展望2025年前后端到端视觉模型、神经渲染技术对产业生态的重构价值。

在这里插入图片描述


引言

根据Gartner技术成熟度曲线,计算机视觉技术已跨越泡沫破裂低谷期,进入稳步爬升的光明期。目标检测(Object Detection)与图像分割(Image Segmentation)作为CV两大支柱任务,其技术演进呈现以下特征:

  1. 精度与效率的博弈:COCO数据集上mAP指标从2016年Faster R-CNN的28.8%提升至2023年RT-DETR的67.3%,但模型参数量增长超10倍;
  2. 任务边界的消融:Mask R-CNN开创检测与分割联合训练范式,2024年华为盘古CV大模型实现目标检测、实例分割、关键点检测的三任务统一建模;
  3. 产业落地的分化:工业质检场景要求模型体积<50MB,医疗影像分析则依赖高精度3D分割(Dice系数>0.95)。

本文从算法创新、数据驱动、工程落地三大主线,解析目标检测与图像分割技术的最新突破与产业实践。


算法架构革新:从模块化到端到端

1. 目标检测:实时性与精度的双重突破

目标检测技术演进
双阶段检测器
单阶段检测器
Transformer驱动
R-CNN系列
YOLO系列
DETR变体
Fast R-CNN 2015
YOLOv5 2020
RT-DETR 2023
  • YOLOv10:轻量化实时检测新标杆

    • 架构创新:采用CSPNet v3骨干网络+动态锚框分配策略,在NVIDIA Jetson Orin上实现45FPS@720P的实时检测,模型体积压缩至9.8MB;
    • 性能突破:COCO val2017数据集上mAP@0.5达62.1%,较YOLOv8提升3.7个百分点,尤其在小目标检测(<32×32像素)上准确率提升22%;
    • 工程价值:已应用于大疆无人机障碍物避障系统,误检率较传统方法降低76%。
  • RT-DETR:Transformer在检测领域的范式迁移

    • 混合架构:融合CNN特征提取与Transformer解码器,通过可变形注意力机制(Deformable Attention)将计算复杂度从O(N²)降至O(N);
    • 数据效率:在仅有10%标注数据的条件下,mAP@0.5指标仅下降5.3%,显著优于YOLOv9的12.7%性能衰减;
    • 行业落地:特斯拉Optimus机器人视觉系统采用DETR变体,实现动态场景中30类物体的实时追踪,定位误差<3cm。

2. 图像分割:从语义到实例的精细化演进

# SAM 2.0伪代码示例(简化版)
class SegmentAnythingModel:def __init__(self):self.image_encoder = ViT_Large()  # 视觉Transformer编码器self.prompt_encoder = TextEncoder()  # 文本/点/框提示编码器self.mask_decoder = MaskDecoder()  # 分割掩码解码器def forward(self, image, prompt):image_features = self.image_encoder(image)prompt_features = self.prompt_encoder(prompt)return self.mask_decoder(image_features, prompt_features)
  • SAM 2.0:交互式分割的通用模型

    • 技术突破:构建1100万张图像+11亿掩码的SA-1B数据集,支持文本、点、框、涂鸦等多种交互提示,在零样本学习(Zero-Shot)场景下mIoU达68.2%;
    • 产业影响:Adobe Photoshop 2024集成SAM API,用户通过自然语言指令即可完成图像主体分割,处理效率较传统方法提升20倍;
    • 学术价值:开创"提示工程(Prompt Engineering)"在CV领域的应用,推动视觉大模型向多模态交互演进。
  • MedSAM:医疗影像专用分割模型

    • 领域适配:在LiTS肝脏数据集上,结合3D U-Net与SAM架构,实现CT影像中肝脏肿瘤分割的Dice系数0.934,较原始SAM提升14.6%;
    • 临床价值:联影智能uAI Vision平台采用该技术,将肝癌诊断时间从30分钟缩短至90秒,假阳性率降低至0.8%。

数据驱动:从大规模标注到合成数据革命

1. 数据集演进:从通用到垂直

数据集发布年份规模(图像/视频)核心特点
COCO201433万张80类目标,多尺度标注
LVIS201916.4万张1203类长尾目标
SA-1B20231100万张11亿掩码,交互式分割标注
Waymo Open202020万段视频激光雷达-摄像头多模态数据
  • SA-1B:交互式分割的"ImageNet时刻"
    • 标注范式:采用"点击+修正"的半自动标注流程,人类标注员效率提升5倍,单张图像标注成本从$1.2降至$0.18;
    • 领域泛化:在农业病害检测、遥感影像分析等垂直领域,通过领域自适应训练(Domain Adaptation),mIoU指标提升8-12个百分点。

2. 合成数据:破解标注瓶颈

  • NVIDIA Omniverse Replicator

    • 技术路径:基于物理引擎生成带精确标注的合成数据,支持光照、材质、传感器噪声的参数化控制;
    • 产业应用:宝马集团采用该技术生成100万张合成图像,将缺陷检测模型训练时间从6周缩短至72小时,召回率提升至99.2%。
  • Grounded-SAM

    • 方法创新:将SAM与CLIP模型结合,通过文本描述自动生成分割掩码,在PASCAL VOC数据集上实现91.3%的零样本分割精度;
    • 学术影响:该工作入选CVPR 2024 Oral,开创"文本驱动的视觉标注"新范式。

工程化落地:从实验室到产业界

1. 自动驾驶:视觉感知系统的技术博弈

  • 特斯拉Occupancy Networks

    • 架构突破:将BEV(鸟瞰图)与Occupancy Grid结合,通过时空序列建模实现3D空间占用预测,在雨雾天气下检测准确率较传统方法提升37%;
    • 工程挑战:需处理100万公里/天的车队回传数据,Dojo超算集群训练效率较A100集群提升4倍。
  • 华为ADS 3.0

    • 多模态融合:采用192线激光雷达+11摄像头+4D毫米波雷达的融合方案,在城区NOA场景中,异形障碍物识别准确率达99.6%;
    • 成本优化:通过激光雷达国产化与芯片自研,将传感器套件成本控制在$3000以内,较Waymo方案降低90%。

2. 医疗影像:AI辅助诊断的精准化突破

  • 联影智能uAI Vision

    • 技术架构:集成3D U-Net、Transformer与SAM模型,实现CT/MRI影像中多器官、多病灶的联合分割;
    • 临床验证:在复旦大学附属中山医院开展的万人级多中心研究中,将肺癌筛查的敏感度从89.2%提升至96.7%,假阳性率降低至1.2%。
  • DeepMind AlphaFold 3

    • 跨模态突破:将视觉Transformer应用于蛋白质结构预测,结合冷冻电镜数据,在蛋白质-配体复合物预测中RMSE降低至0.8Å;
    • 产业影响:辉瑞制药采用该技术加速药物研发,将先导化合物筛选周期从18个月缩短至3个月。

关键挑战与突破方向

1. 技术瓶颈

  • 小样本学习:医疗影像领域单个病种标注数据通常<1000例,需开发基于元学习(Meta-Learning)的少样本分割算法;
  • 长尾分布:LVIS数据集中尾部类别(如"鳄梨核")的AP指标较头部类别低42个百分点,需结合重采样与损失函数优化;
  • 实时性要求:工业质检场景要求模型推理延迟<50ms,需开发轻量化网络架构与模型剪枝技术。

2. 伦理与安全

  • 算法偏见:COCO数据集中"人"类别的标注数量是"长颈鹿"的10万倍,导致模型对少数类目标的检测性能下降;
  • 可解释性:医疗影像AI系统的黑箱特性导致医生信任度不足,需开发基于注意力机制的可视化工具;
  • 数据隐私:医疗影像数据跨境传输受GDPR等法规限制,需开发联邦学习(Federated Learning)框架。

3. 成本优化路径

技术方向成本降低措施典型案例
模型压缩知识蒸馏、量化感知训练腾讯优图将人脸检测模型压缩至1.2MB
硬件加速专用ASIC芯片、稀疏计算寒武纪MLU370-X8算力达256TOPS
合成数据物理引擎模拟、对抗生成网络Waymo用合成数据替代30%实车数据

未来展望

  1. 端到端视觉大模型:2025年前后,Meta LLaVA、谷歌Gemini等模型将实现目标检测、分割、跟踪的多任务统一建模,参数规模突破万亿级;
  2. 神经渲染技术:NVIDIA Instant NeRF等算法将推动3D重建与分割的融合,在AR/VR、数字孪生领域产生变革性影响;
  3. 具身智能突破:特斯拉Optimus、波士顿动力Atlas等机器人将深度融合检测与分割能力,实现复杂环境中的自主操作。

结论

目标检测与图像分割技术的演进,本质是算法效率、数据质量、工程能力的三维竞赛。YOLOv10、SAM 2.0等模型的突破,标志着CV领域正从"暴力计算"转向"智能涌现"。随着多模态大模型、神经渲染、具身智能等技术的融合创新,2025年或将成为CV技术从感知智能向认知智能跃迁的关键节点。产业界需在追求技术突破的同时,构建数据安全、算法公平、工程可控的可持续发展体系,最终实现AI视觉技术在千行百业的深度赋能。

相关文章:

AI与计算机视觉(CV):目标检测与图像分割的最新进展

AI与计算机视觉&#xff08;CV&#xff09;&#xff1a;目标检测与图像分割的最新进展 系统化学习人工智能网站&#xff08;收藏&#xff09;&#xff1a;https://www.captainbed.cn/flu 文章目录 AI与计算机视觉&#xff08;CV&#xff09;&#xff1a;目标检测与图像分割的…...

嵌入式开发学习日志Day17

第十一章 结构体与共用体 一、结构体 1、结构体 一般形式 【struct 标识符】 结构体中的标识符一般首字母大写&#xff1b; 【.】结构体成员运算符&#xff1b; 优先级 1 级 结合方向&#xff1a;从左至右&#xff1b; 【->】:指向结构体成员运算符&#x…...

awesome-digital-human本地部署及配置:打造高情绪价值互动指南

在数字化交互的浪潮中&#xff0c;awesome-digital-human-live2d项目为我们打开了本地数字人互动的大门。结合 dify 聊天 api&#xff0c;并借鉴 coze 夸夸机器人的设计思路&#xff0c;能为用户带来充满情绪价值的交互体验。本文将详细介绍其本地部署步骤、dify 配置方法及情绪…...

ClickHouse多表join的性能优化:原理与源码详解

本文将从底层原理和源代码的角度详细解释 ClickHouse 多表 JOIN 的处理过程&#xff0c;尽量用通俗移动的语言&#xff0c;让初学者也能理解。本文会分步骤推导&#xff0c;涵盖 JOIN 的原理、实现方式、关键代码逻辑以及优化机制&#xff0c;同时确保逻辑清晰、内容全面。最后…...

国产Excel处理控件Spire.XLS系列教程:C# 将Excel文件转换为Markdown格式

Microsoft Excel 是一款强大的数据管理工具&#xff0c;广泛用于数据处理和分析。然而&#xff0c;其专有格式&#xff08;如 XLS 和 XLSX&#xff09;在不同平台之间共享时&#xff0c;常常面临兼容性问题。相比之下&#xff0c;Markdown 是一种轻量级的标记语言&#xff0c;因…...

C++线程库

1. 基本概念 1.1 线程&#xff08;Thread&#xff09; 线程是操作系统能够进行运算调度的最小单位。它被包含在进程之中&#xff0c;是进程中的实际运作单位。一个进程可以并发多个线程&#xff0c;每条线程并行执行不同的任务。 1.2 并发与并行 并发&#xff08;Concurren…...

Missashe计网复习笔记(随时更新)

Missashe计算机网络复习笔记 前言&#xff1a;这篇笔记用于博主对计网这门课所学进行记录和总结&#xff0c;也包括一些个人的理解。正在更新当中…… 第一章 计算机网络体系结构 考纲内容 (一) 计算机网络概述 计算机网络的概念、组成与功能;计算机网络的分类; 计算机网络…...

解决osx-arm64平台上conda默认源没有提供 python=3.7 的官方编译版本的问题

CONDA_SUBDIRosx-64 conda create -n py37_env python3.7 是一个用于创建特定架构环境的命令&#xff0c;主要针对 macOS 系统。下面为你详细解析它的功能和作用&#xff1a; 命令功能解析 这个命令的主要功能是创建一个名为 py37_env 的 Conda 环境&#xff0c;并且指定该环…...

Cjson格式解析与接入AI大模型

JSON格式的解析与构造 基本概念 JSON是JavaScript Object Notation的简称&#xff0c;中文含义为“JavaScript 对象表示法”&#xff0c;它是一种数据交换的文本格式&#xff0c;而不是一种编程语言。 JSON 是一种轻量级的数据交换格式&#xff0c;采用完全独立于编程语言的…...

RocketMQ 深度解析:架构设计与最佳实践

在分布式系统架构日益复杂的今天&#xff0c;消息中间件作为系统间通信的桥梁&#xff0c;扮演着至关重要的角色。RocketMQ 作为阿里开源的高性能分布式消息中间件&#xff0c;凭借其卓越的性能、丰富的功能以及高可用性&#xff0c;在电商、金融、互联网等众多领域得到广泛应用…...

【Light】帕多瓦大学超表面技术:开启矢量光束相位偏振定制新时代

01 前言 近年来&#xff0c;完美涡旋光束&#xff08;Perfect Vortex Beams&#xff09;因其独特的环形强度分布和与拓扑电荷无关的特性&#xff0c;成为研究热点。然而&#xff0c;传统方法在生成此类光束时面临相位和偏振控制的挑战&#xff0c;通常需要复杂的光学系统或多重…...

2021-11-15 C++下一个生日天数

缘由c今日日期到生日天数-编程语言-CSDN问答 int isLeap(int year)//判断闰年 {//缘由https://ask.csdn.net/questions/7567048?spm1005.2025.3001.5141return ((!(year % 4) && year % 100) || !(year % 400)); } int daysInMonth(int year, int month)//返回月天数…...

基于nodejs + Koa +Nuxt3的订单系统项目实战

以下是一个基于 Node.js Koa Nuxt3 的订单系统项目实战指南&#xff0c;包含关键实现步骤和代码示例&#xff1a; 一、项目架构设计 project/ ├── backend/ # Koa 后端 │ ├── config/ # 配置文件 │ ├── controllers/ # 控制器 │ ├──…...

# YOLOv2:目标检测的升级之作

YOLOv2&#xff1a;目标检测的升级之作 在目标检测领域&#xff0c;YOLO&#xff08;You Only Look Once&#xff09;系列算法以其高效的速度和创新的检测方式受到了广泛关注。今天&#xff0c;我们就来深入探讨一下 YOLOv2&#xff0c;看看它是如何在继承 YOLOv1 的基础上进行…...

国债收益率、需求与抛售行为的逻辑解析

国债收益率、需求与抛售行为的逻辑解析 1. 国债收益率的定义 国债收益率是衡量国债投资回报的核心指标&#xff0c;分为两种常见计算方式&#xff1a; 当前收益率&#xff08;Current Yield&#xff09;&#xff1a;年利息收入 债券当前市场价格 例如&#xff1a;面值100元、…...

使用Python和TensorFlow实现图像分类的人工智能应用

最近研学过程中发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;忍不住分享一下给大家。点击链接跳转到网站人工智能及编程语言学习教程。读者们可以通过里面的文章详细了解一下人工智能及其编程等教程和学习方法。下面开始对正文内容的…...

嵌入式培训之C语言学习完(十七)结构体、共用体、枚举、typedef关键字与位运算

目录 一、结构体&#xff08;struct关键字&#xff09; &#xff08;一&#xff09;声明一个结构体数据类型 &#xff08;二&#xff09;结构体的成员初始化与赋值 a、结构体变量赋值 b、结构体成员初始化 c、结构体的定义形式 &#xff08;三&#xff09;考点&#xff…...

cilium路由模式和aws-eni模式下的IPAM

来看Cilium路由的几种核心模式。 封装模式&#xff08;overlay&#xff09; 首先是最基础的封装模式。这是默认情况下&#xff0c;如果你没有特别配置&#xff0c;Cilium会自动运行的模式。它的最大特点就是对底层网络环境的要求非常低&#xff0c;可以说是开箱即用。具体怎么…...

深入理解 Java 代理模式:从基础到实战​

在软件开发的世界里&#xff0c;设计模式是程序员智慧的结晶&#xff0c;它们为解决常见问题提供了经过验证的最佳实践。代理模式作为一种常用的结构型设计模式&#xff0c;在 Java 开发中有着广泛的应用。本文将深入探讨 Java 代理模式&#xff0c;从基本概念、分类、实现原理…...

Python毕业设计219—基于python+Django+vue的房屋租赁系统(源代码+数据库+万字论文)

毕设所有选题&#xff1a; https://blog.csdn.net/2303_76227485/article/details/131104075 基于pythonDjangovue的房屋租赁系统(源代码数据库万字论文)219 一、系统介绍 本项目前后端分离&#xff0c;分为租客、房东、管理员三种角色 1、租客&#xff1a; 注册、登录、公…...

Spring Boot 框架概述

1. 简介 Spring Boot 是由 Pivotal 团队开发的一个用于简化 Spring 应用开发的框架。它通过提供默认配置、嵌入式服务器和自动配置等特性&#xff0c;让开发者能够更快速地构建独立的、生产级别的 Spring 应用。 Spring Boot 的主要特点包括&#xff1a; 快速创建独立的 Spri…...

MySQL 8.0(主从复制)

MySQL 8.0 的 主从复制&#xff08;Master-Slave Replication&#xff09; 是一种数据库高可用和数据备份的核心技术&#xff0c;下面用 一、什么是主从复制&#xff1f; 就像公司的「领导-秘书」分工&#xff1a; 主库&#xff08;Master&#xff09;&#xff1a;负责处理所…...

探索大型语言模型的 LLM 安全风险和 OWASP 十大漏洞

大型语言模型 (LLM) 引领着技术进步,推动着包括医疗保健在内的各个领域的自动化进程。在 Halodoc,我们通过 AI 驱动技术的运用直接见证了这一变化。然而,强大的功能伴随着同样重大的责任——保障这些系统的安全对于保护敏感信息和维护信任至关重要。本博客探讨了与 LLM 相关…...

算法与数据结构 - 二叉树结构入门

目录 1. 普通二叉树结构 1.1. 常见术语 1.2. 完全二叉树 (Complete Binary Tree) 1.3. 满二叉树 (Full Binary Tree) 2. 特殊二叉树结构 2.1. 二叉搜索树 (BST) 2.1.1. BST 基本操作 - 查找 2.1.2. BST 基本操作 - 插入 2.1.3. BST 基本操作 - 删除 2.2. 平衡二叉树…...

基于AQS实现Reentrantlcok

好久没有更新了 这次来补充上一次AQS还没有实现的可重入锁部分&#xff01; 我们知道ReentrantLock是可重入的锁&#xff0c;主要的核心是state&#xff0c;他是一个原子性的整数&#xff0c;我们只需要将获取锁的代码boolean由false到true变成0->1即可完成。在完成删除逻辑…...

TiDB预研-分页查询、连接查询、执行计划

目录 分页查询原理连接查询原理查询计划分析 https://docs.pingcap.com/zh/tidb/stable/dev-guide-join-tables/ https://cn.pingcap.com/blog/tidb-query-optimization-and-tuning-1/ https://github.com/pingcap/blog-cn/blob/master/how-to-use-tidb.md 分页查询 深分…...

五、【LLaMA-Factory实战】模型部署与监控:从实验室到生产的全链路实践

【LLaMA-Factory实战】模型部署与监控&#xff1a;从实验室到生产的全链路实践 一、引言 在大模型应用落地过程中&#xff0c;从实验室研究到生产环境部署存在巨大挑战。本文基于LLaMA-Factory框架&#xff0c;详细介绍大模型部署与监控的完整流程&#xff0c;包含推理优化、…...

Unity 点击按钮,打开 Windows 文件选择框,并加载图片

代码如下&#xff1a; using System; using System.Collections; using System.Runtime.InteropServices; using UnityEngine; using UnityEngine.Events; using UnityEngine.Networking; using UnityEngine.UI;/// <summary> /// 文件日志类 /// </summary> // […...

深入解析磁盘 I/O 与零拷贝技术:从传统读取到高效传输

深入解析磁盘 I/O 与零拷贝技术&#xff1a;从传统读取到高效传输 在现代计算机系统中&#xff0c;磁盘 I/O 操作是数据处理的核心环节之一。无论是读取文件、写入数据&#xff0c;还是进行网络传输&#xff0c;磁盘 I/O 的效率直接影响到系统的整体性能。本文将深入探讨磁盘 I…...

第十六章,网络型攻击防范技术

网络攻击介绍 网络攻击 --- 指的是入侵或破坏网络上的服务器 ( 主机 ) &#xff0c;盗取服务器的敏感数据或占用网络带宽。 网络攻击分类&#xff1a; 流量型攻击 网络层攻击 应用层攻击 单包攻击 畸形报文攻击 --- 向目标主机发送有缺陷的IP报文&#xff0c;使得目标在…...

线程的生命周期·

知识点详细说明 Java线程的生命周期由Thread.State枚举明确定义,包含以下6种状态: 1. 新建状态(NEW) 定义:线程对象被创建后,但未调用start()方法。特点: 未分配系统资源(如CPU时间片)。可通过Thread.getState()获取状态为NEW。示例:Thread t = new Thread(); // 状…...

kafka 面试总结

Kafka的幂等性是一种机制&#xff0c;确保生产者发送的每条消息在Broker端只被持久化一次&#xff0c;即使生产者因网络问题等原因重试发送&#xff0c;也不会导致消息重复。 实现原理 生产者ID&#xff08;PID&#xff09; 每个生产者实例在初始化时&#xff0c;会被分配一个…...

Webpack基本用法学习总结

Webpack 基本使用核心概念处理样式资源步骤&#xff1a; 处理图片资源修改图片输出文件目录 自动清空上次打包的内容EslintBabel处理HTML资源搭建开发服务器生产模式提取css文件为单独文件问题&#xff1a; Css压缩HTML压缩 小结1高级SourceMap开发模式生产模式 HMROneOfInclud…...

5月9日复盘-混合注意力机制

5月9日复盘 四、混合注意力 混合注意力机制&#xff08;Hybrid Attention Mechanism&#xff09;是一种结合空间和通道注意力的策略&#xff0c;旨在提高神经网络的特征提取能力。 1. CBAM Convolution Block Attention Module &#xff0c;卷积块注意力模块 论文地址&…...

YOLOv8 优化:基于 Damo-YOLO 与 DyHead 检测头融合的创新研究

文章目录 YOLOv8 的背景与发展Damo-YOLO 的优势与特点DyHead 检测头的创新之处融合 Damo-YOLO 与 DyHead 检测头的思路融合后的模型架构融合模型的代码实现导入必要的库定义 Damo-YOLO 的主干网络定义特征金字塔网络&#xff08;FPN&#xff09;定义 DyHead 检测头定义融合后的…...

【网安播报】Meta 推出 LlamaFirewall开源框架以阻止 AI 越狱、注入和不安全代码

1、Meta 推出 LlamaFirewall 框架以阻止 AI 越狱、注入和不安全代码 Meta 宣布推出 LlamaFirewall&#xff0c;这是一个开源框架&#xff0c;旨在保护人工智能 &#xff08;AI&#xff09; 系统免受新出现的网络风险&#xff0c;例如提示词注入、越狱和不安全代码等。除了 Llam…...

QT 解决msvc fatal error C1060: 编译器的堆空间不足

一.物理内存太小&#xff0c;代码又比较复杂&#xff0c;递归嵌套之类的。 1.修改虚拟内存的大小&#xff0c;一般设置为物理内存的1.5倍。 二.msvc工程的编译默认开启的是多线程编译&#xff0c;所以电脑内存确实不够&#xff0c;采用如下设置。 QMAKE_CXXFLAGS -j1 三.ms…...

PX4开始之旅(一)自动调参

核心知识点&#xff1a;无人机震动与滤波参数 1. 通俗易懂的解释 想象一下&#xff0c;你的无人机就像一个非常敏感的“听众”&#xff0c;它的“耳朵”就是陀螺仪和加速度计这些传感器&#xff0c;用来感知自己是如何移动和旋转的。理想情况下&#xff0c;它应该只“听”到你…...

C++ 中 lower_bound 与 upper_bound 函数详解

C 中 lower_bound 与 upper_bound 函数详解 文章目录 C 中 lower_bound 与 upper_bound 函数详解**一、核心定义与区别****二、使用条件与时间复杂度****三、实际应用场景****四、注意事项与常见误区****五、代码示例****六、总结** 一、核心定义与区别 lower_bound 作用&#…...

minio数据迁移(两台服务器没法相互通信)

场景描述: A服务器 无法访问 B服务器&#xff0c;B服务器 也无法访问 A&#xff08;即双方都不能通过公网或内网直连对方&#xff09; MinIO 官方提供了 mc&#xff08;MinIO Client&#xff09;命令行工具&#xff0c;可以直接实现 Bucket 之间的数据迁移&#xff1a; 安装 …...

O2OA(翱途)开发平台系统安全-用户登录IP限制

O2OA(翱途)开发平台[下称O2OA开发平台或者O2OA]支持对指定的用户设置可以连接的客户端计算机的IP地址&#xff0c;以避免用户在不安全的环境下访问系统。本篇主要介绍如何开启O2OA用户登录IP限制。 一、先决条件&#xff1a; 以拥有管理员权限的用户账号登录O2OA(翱途)开发平…...

CSS flex:1

在 CSS 中&#xff0c;flex: 1 是一个用于弹性布局&#xff08;Flexbox&#xff09;的简写属性&#xff0c;主要用于控制 flex 项目&#xff08;子元素&#xff09;如何分配父容器的剩余空间。以下是其核心作用和用法&#xff1a; 核心作用 等分剩余空间&#xff1a;让 flex …...

OpenHarmony平台驱动开发(十一),PIN

OpenHarmony平台驱动开发&#xff08;十一&#xff09; PIN 概述 功能简介 PIN即管脚控制器&#xff0c;用于统一管理各SoC的管脚资源&#xff0c;对外提供管脚复用功能。 基本概念 PIN是一个软件层面的概念&#xff0c;目的是为了统一对各SoC的PIN管脚进行管理&#xff0…...

.NET高频技术点(持续更新中)

1. .NET 框架概述 .NET 框架的发展历程.NET Core 与 .NET Framework 的区别.NET 5 及后续版本的统一平台 2. C# 语言特性 异步编程&#xff08;async/await&#xff09;LINQ&#xff08;Language Integrated Query&#xff09;泛型与集合委托与事件属性与索引器 3. ASP.NET…...

Spring Cloud - 2( 12000 字详解 Spring Cloud)

一&#xff1a;服务注册和服务发现 - Eureka 1.1 背景 在上一章节的例子中&#xff0c;我们可以看到远程调用时 URL 被硬编码&#xff0c;这导致在更换机器或新增机器时&#xff0c;相关的 URL 需要进行相应的变更。这就需要让所有相关服务去修改 URL&#xff0c;随之而来的就…...

解决Win11下MySQL服务无法开机自启动问题

问题描述 在win11系统中&#xff0c;明明将MySQL服务设置成了自动启动&#xff0c;但在重启电脑后MySQL服务还是无法自动启动&#xff0c;每次都要重新到计算机管理的服务中找到服务再手动启动。 解决方式 首先确保mysql服务的启动类型为自动。 设置方法&#xff1a;找到此电…...

RGB矩阵照明系统详解及WS2812配置指南

RGB矩阵照明系统详解及WS2812配置指南 一、RGB矩阵照明简介 RGB矩阵照明是一种强大的功能&#xff0c;允许使用外部驱动器驱动的RGB LED矩阵为键盘增添绚丽的灯光效果。该系统与RGBLIGHT功能无缝集成&#xff0c;因此您可以使用与RGBLIGHT相同的键码来控制它&#xff0c;操作…...

全球首款无限时长电影生成模型SkyReels-V2本地部署教程:视频时长无限制!

一、简介 SkyReels-V2 模型集成了多模态大语言模型&#xff08;MLLM&#xff09;、多阶段预训练、强化学习以及创新的扩散强迫&#xff08;Diffusion-forcing&#xff09;框架&#xff0c;实现了在提示词遵循、视觉质量、运动动态以及视频时长等方面的全面突破。通过扩散强迫框…...

代理ARP与传统ARP在网络通信中的应用及区别研究

一些问题 路由器隔离广播域&#xff0c;每个接口/网段都是独立的广播域ARP请求是二层广播包&#xff0c;广播包没法通过路由器ARP请求没法穿越互联网到达目标主服务器 一些思考 电脑访问互联网服务器的时候&#xff0c;ARP询问的内容&#xff0c;真的是访问服务器么&#xf…...

理解 Envoy 的架构

理解 Envoy 的架构对于深入理解 Istio 至关重要&#xff0c;因为 Envoy 是 Istio 数据平面的核心。Envoy 是一个高性能的 C 分布式代理&#xff0c;设计为云原生应用和大规模微服务架构的网络基础。 以下是 Envoy 架构的关键组成部分和核心理念&#xff1a; 核心设计理念&…...