多模态大语言模型arxiv论文略读(三十五)
On the Out-Of-Distribution Generalization of Multimodal Large Language Models
➡️ 论文标题:On the Out-Of-Distribution Generalization of Multimodal Large Language Models
➡️ 论文作者:Xingxuan Zhang, Jiansheng Li, Wenjing Chu, Junjia Hai, Renzhe Xu, Yuqing Yang, Shikai Guan, Jiazheng Xu, Peng Cui
➡️ 研究机构: Tsinghua University、Beijing Jiaotong University
➡️ 问题背景:当前的多模态大语言模型(Multimodal Large Language Models, MLLMs)在多种生成任务中展现了卓越的能力,尤其是在视觉-语言感知(Vision-Language Perception, VLP)和图像到图像(Image-to-Image, I2I)任务中。然而,研究发现,这些模型在处理超出其训练数据分布的领域特定任务时,表现出了显著的泛化能力不足,尤其是在医疗和分子图像数据上。
➡️ 研究动机:尽管MLLMs在处理常见对象识别任务时表现出色,但它们在处理特定领域任务时的泛化能力有限。为了进一步理解这些模型在特定领域任务中的表现不佳的原因,并探索提高其泛化能力的方法,研究团队对MLLMs在不同分布偏移和领域特定任务中的零样本泛化能力进行了全面评估。
➡️ 方法简介:研究团队通过构建一系列合成图像、自然分布偏移和领域特定数据集(如医疗和分子图像数据集),评估了14种当前最先进的MLLMs在不同数据分布下的零样本泛化能力。此外,研究团队还分析了模型在特定领域任务中表现不佳的三个潜在原因:语义误解、视觉特征提取不足和映射缺陷。
➡️ 实验设计:实验在20个数据集上进行,包括合成图像、自然分布偏移和领域特定数据集。实验设计了不同类型的分布偏移(如合成图像、自然分布偏移和领域特定数据集),以及不同类型的领域特定任务(如医疗和分子图像识别),以全面评估模型在不同条件下的泛化能力。研究团队还探讨了上下文学习(In-Context Learning, ICL)在提高模型泛化能力方面的潜力,特别是在处理领域特定任务时。
Q-Bench+: A Benchmark for Multi-modal Foundation Models on Low-level Vision from Single Images to Pairs
➡️ 论文标题:Q-Bench+: A Benchmark for Multi-modal Foundation Models on Low-level Vision from Single Images to Pairs
➡️ 论文作者:Zicheng Zhang, Haoning Wu, Erli Zhang, Guangtao Zhai, Weisi Lin
➡️ 研究机构: 上海交通大学、南洋理工大学
➡️ 问题背景:多模态大语言模型(MLLMs)在计算机视觉领域取得了显著进展,但其在低级视觉感知和理解方面的能力仍缺乏系统评估。低级视觉能力在图像质量评估(IQA)、感知视觉失真(如噪声、模糊)和其他低级属性(如色彩、光照、构图、风格等)中扮演着重要角色,这些能力与自然照片的美学以及人类对新兴计算机图形生成或AI生成图像的偏好密切相关。
➡️ 研究动机:为了填补这一空白,研究团队提出了Q-Bench+,这是首个系统评估MLLMs在低级视觉任务上的能力的基准。Q-Bench+旨在评估MLLMs在低级视觉感知、描述和评估方面的能力,以模拟人类在这些任务中的表现。
➡️ 方法简介:研究团队构建了三个基准数据集:LLVisionQA+、LLDescribe+和IQA Benchmark。LLVisionQA+包含2,990张单张图像和1,999对图像,用于评估MLLMs在低级视觉感知任务中的表现;LLDescribe+包含499张单张图像和450对图像,用于评估MLLMs在低级视觉描述任务中的表现;IQA Benchmark则利用现有的IQA数据库来评估MLLMs在图像质量评估任务中的表现。
➡️ 实验设计:实验设计了多种低级视觉属性(如清晰度、亮度、色彩等)的评估任务,包括单张图像和图像对的感知任务、描述任务以及评估任务。实验还设计了不同类型的低级视觉问题(如Yes-or-No问题、What问题、How问题),以全面评估MLLMs在不同条件下的表现。此外,研究团队还提出了一种基于softmax的策略,用于提取MLLMs的量化质量评分,并通过prompt-ensemble方法进一步提升MLLMs在IQA任务中的表现。
Exploring Perceptual Limitation of Multimodal Large Language Models
➡️ 论文标题:Exploring Perceptual Limitation of Multimodal Large Language Models
➡️ 论文作者:Jiarui Zhang, Jinyi Hu, Mahyar Khayatkhoei, Filip Ilievski, Maosong Sun
➡️ 研究机构: University of Southern California, Tsinghua University, Vrije Universiteit Amsterdam
➡️ 问题背景:多模态大语言模型(Multimodal Large Language Models, MLLMs)在回答视觉问题方面展现了显著的能力。然而,这些模型在识别图像中的小物体时存在明显的局限性,尤其是在处理小文本描述等细节时。尽管提高输入图像的分辨率可以增强模型的响应准确性,但这种局限性的具体程度及其背后的原因尚未得到系统性的研究。
➡️ 研究动机:现有的研究已经提供了关于MLLMs对物体大小敏感性的轶事证据,但这种现象及其根本原因尚未得到全面探索。为了填补这一空白,研究团队对几种最先进的MLLMs进行了定量研究,旨在揭示这些模型在处理小物体时的普遍局限性,并识别影响这种局限性的各种视觉因素。
➡️ 方法简介:研究团队通过在两个常见的视觉问答数据集GQA和TextVQA上进行实验,评估了七种最先进的MLLMs在处理不同大小目标物体时的性能。实验中,根据目标物体的相对大小将数据集分为五个等级,观察模型性能随物体大小变化的趋势。此外,研究团队还系统地分析了四个影响MLLMs识别小物体能力的因素:物体质量、物体大小、干扰物体和物体位置。
➡️ 实验设计:实验设计了不同因素的变化,包括物体质量(采样率)、物体大小、干扰物体的数量和物体位置,以全面评估MLLMs在不同条件下的表现。实验结果表明,物体质量在达到一定阈值后对模型性能的影响不大,而物体大小的减小会导致模型性能显著下降。此外,干扰物体的存在和物体位置的变化也会显著影响模型的识别准确性。
Visual Question Answering Instruction: Unlocking Multimodal Large Language Model To Domain-Specific Visual Multitasks
➡️ 论文标题:Visual Question Answering Instruction: Unlocking Multimodal Large Language Model To Domain-Specific Visual Multitasks
➡️ 论文作者:Jusung Lee, Sungguk Cha, Younghyun Lee, Cheoljong Yang
➡️ 研究机构: NC Research, Republic of Korea
➡️ 问题背景:大型语言模型(LLMs)在自然语言处理(NLP)领域取得了显著进展,但其在多模态输入领域的应用,尤其是将多模态LLMs(MLLMs)扩展到特定领域的视觉任务上,仍面临挑战。当前,MLLMs主要应用于视觉-语言任务,如图像描述、推理或问答,而对于传统的特定领域视觉任务(如识别或检测)的研究相对较少。
➡️ 研究动机:为了克服这一挑战,研究团队开发了一种方法,将特定领域的视觉数据集转换为统一的问答格式(Visual Question Answering Instruction, VQA-IN),从而扩展MLLMs到特定领域的视觉任务。该方法不仅能够评估LLMs在特定领域视觉任务中的能力,还能同时执行多任务处理。
➡️ 方法简介:研究团队提出了VQA-IN方法,该方法能够将视觉-语言数据集和特定领域的视觉数据集转换为统一的问答格式。通过这种方式,研究团队能够评估不同MLLM架构在特定领域视觉任务中的表现。此外,研究还引入了控制句子长度的方法,以适应不同任务的需求。
➡️ 实验设计:实验在多个公开数据集上进行,包括视觉-语言任务(如COCO Caption, VQAv2, OKVQA, GQA)和特定领域视觉任务(如AffectNet, HaGRID, RefCOCOg)。实验结果表明,使用VQA-IN方法训练的MLLMs在特定领域视觉任务中表现出色,同时在视觉-语言任务中也保持了良好的性能。
Agent Smith: A Single Image Can Jailbreak One Million Multimodal LLM Agents Exponentially Fast
➡️ 论文标题:Agent Smith: A Single Image Can Jailbreak One Million Multimodal LLM Agents Exponentially Fast
➡️ 论文作者:Xiangming Gu, Xiaosen Zheng, Tianyu Pang, Chao Du, Qian Liu, Ye Wang, Jing Jiang, Min Lin
➡️ 研究机构: Sea AI Lab, National University of Singapore, Singapore Management University
➡️ 问题背景:多模态大语言模型(Multimodal Large Language Models, MLLMs)在视觉-语言任务中表现出色,但对抗性图像/提示可以“越狱”这些模型,导致不安全的行为。研究团队发现了一种新的越狱范式——感染性越狱(Infectious Jailbreak),在这种范式中,攻击者只需越狱一个代理,就能在多代理环境中迅速感染几乎所有其他代理,导致有害行为的广泛传播。
➡️ 研究动机:现有的研究已经揭示了对抗性图像和提示可以越狱MLLMs,导致有害行为。为了进一步理解这种威胁,并探索其背后的机制,研究团队通过模拟包含多达一百万个LLaVA-1.5代理的多代理环境,验证了感染性越狱的可行性。研究旨在为未来的安全防护提供有价值的见解和方法。
➡️ 方法简介:研究团队提出了一种系统的方法,通过随机配对聊天(Randomized Pair-Wise Chat)来模拟多代理环境中的交互,并形式化了感染性动态。研究团队构建了一个包含四个组件的MLLM代理模型:MLLM M、RAG模块R、文本历史H和图像相册B。通过模拟多代理环境,研究团队评估了感染性越狱的传播速度和影响范围。
➡️ 实验设计:研究团队在包含多达一百万个LLaVA-1.5代理的多代理环境中进行了实验。实验设计了不同因素的变化,如感染率、恢复率、不同的攻击类型和聊天多样性,以全面评估感染性越狱的有效性和传播速度。实验结果表明,向任意一个代理的记忆库中注入对抗性图像,足以在27到31轮聊天后使几乎所有代理感染并表现出有害行为。研究团队还提出了一个简单的原则,用于确定防御机制是否能够有效遏制感染性越狱的传播。
相关文章:
多模态大语言模型arxiv论文略读(三十五)
On the Out-Of-Distribution Generalization of Multimodal Large Language Models ➡️ 论文标题:On the Out-Of-Distribution Generalization of Multimodal Large Language Models ➡️ 论文作者:Xingxuan Zhang, Jiansheng Li, Wenjing Chu, Junjia…...
Linux 安装pm2并全局可用
前言 本文基于:操作系统 CentOS Stream 8 使用工具:Xshell8、Xftp8 服务器基础环境: node - 请查看 Linux安装node并全局可用 所需服务器基础环境,请根据提示进行下载、安装。 1.安装依赖 npm install pm2 -g2.配置全局软链…...
39.剖析无处不在的数据结构
数据结构是计算机中组织和存储数据的特定方式,它的目的是方便且高效地对数据进行访问和修改。数据结构表述了数据之间的关系,以及操作数据的一系列方法。数据又是程序的基本单元,因此无论是哪种语言、哪种领域,都离不开数据结构&a…...
基于 Vue 的Tiptap 富文本编辑器使用指南
目录 🧰 技术栈 📦 所需依赖 📁 文件结构 🧱 编辑器组件实现(components/Editor.vue) ✨ 常用操作指令 🧠 小贴士 🧩 Tiptap 扩展功能使用说明(含快捷键与命令&am…...
【音视频】AAC-ADTS分析
AAC-ADTS 格式分析 AAC⾳频格式:Advanced Audio Coding(⾼级⾳频解码),是⼀种由MPEG-4标准定义的有损⾳频压缩格式,由Fraunhofer发展,Dolby, Sony和AT&T是主 要的贡献者。 ADIF:Audio Data Interchange Format ⾳…...
vue中将elementUI和echarts转成pdf文件
若要将包含 ElementUI 组件数据和多个 ECharts 图表的数据转换为 PDF 文档,可结合 html2canvas、jspdf 以及 dom-to-image 来实现。其中,html2canvas 和 dom-to-image 可将 ECharts 图表转换为图片,jspdf 则用于生成 PDF 文档。对于 ElementU…...
基于 Electron、Vue3 和 TypeScript 的辅助创作工具全链路开发方案:涵盖画布系统到数据持久化的完整实现
基于 Electron、Vue3 和 TypeScript 的辅助创作工具全链路开发方案:涵盖画布系统到数据持久化的完整实现 引言 在数字内容创作领域,高效的辅助工具是连接创意与实现的关键桥梁。创作者需要一款集可视化画布、节点关系管理、数据持久化于一体的专业工具&…...
本地部署DeepSeek-R1模型接入PyCharm
以下是DeepSeek-R1本地部署及接入PyCharm的详细步骤指南,整合了视频内容及官方文档核心要点: 一、本地部署DeepSeek-R1模型 1. 安装Ollama框架 下载安装包 访问Ollama官网(https://ollama.com/download)或通过视频提供的百度云盘链接下载对应系统的安装包。Windows用户…...
基于LightGBM-TPE算法对交通事故严重程度的分析与可视化
基于LightGBM-TPE算法对交通事故严重程度的分析与可视化 原文: Analysis and visualization of accidents severity based on LightGBM-TPE 1. 引言部分 文章开篇强调了道路交通事故作为意外死亡的主要原因,引起了多学科领域的关注。分析事故严重性特…...
音视频小白系统入门课-3
本系列笔记为博主学习李超老师课程的课堂笔记,仅供参阅 往期课程笔记传送门: 音视频小白系统入门笔记-0音视频小白系统入门笔记-1音视频小白系统入门笔记-2 视频: 由一组图像组成:像素、分辨率、RGB 8888(24位) 、RGBA(32位)为…...
考研系列-计算机网络-第五章、传输层
一、传输层提供的服务 1.重点知识...
将Ubuntu系统中已有的Python环境迁移到Anaconda的虚拟环境中
需求:关于如何将Ubuntu系统中已有的Python环境迁移到Anaconda的虚拟环境test2里,而且他们提到用requirements.txt 安装一直报错,所以想尝试直接拷贝的方法。 可以尝试通过直接拷贝移植的方式迁移Python环境到Anaconda虚拟环境,但…...
AI 数字短视频数字人源码开发:多维赋能短视频生态革新
在短视频行业深度发展的进程中,AI 数字短视频数字人源码开发凭借其独特的技术优势,从多个维度为行业生态带来了革命性的变化,重塑短视频创作、传播与应用的格局。 数据驱动,实现内容精准化创作 AI 数字短视频数字人源码开发能够深…...
ffmpeg 硬解码相关知识
一:FFMPEG 支持的硬解方式:如下都是了解知识 DXVA2 - windows DXVA2 硬件加速技术解析 一、核心特性与适用场景 技术定义:DXVA2(DirectX Video Acceleration 2)是微软推出的基于 DirectX 的硬件加速标准…...
Ubuntu数据连接访问崩溃问题
目录 一、分析问题 1、崩溃问题本地调试gdb调试: 二、解决问题 1. 停止 MySQL 服务 2. 卸载 MySQL 相关包 3. 删除 MySQL 数据目录 4. 清理依赖和缓存 5.重新安装mysql数据库 6.创建程序需要的数据库 三、验证 1、动态库更新了 2、头文件更新了 3、重新…...
边缘计算全透视:架构、应用与未来图景
边缘计算全透视:架构、应用与未来图景 一、产生背景二、本质三、特点(一)位置靠近数据源(二)分布式架构(三)实时性要求高 四、关键技术(一)硬件技术(二&#…...
迅为iTOP-RK3576开发板/核心板6TOPS超强算力NPU适用于ARM PC、边缘计算、个人移动互联网设备及其他多媒体产品
迅为iTOP-3576开发板采用瑞芯微RK3576高性能、低功耗的应用处理芯片,集成了4个Cortex-A72和4个Cortex-A53核心,以及独立的NEON协处理器。它适用于ARM PC、边缘计算、个人移动互联网设备及其他多媒体产品。 支持INT4/INT8/INT16/FP16/BF16/TF32混合运算&a…...
前沿分享|技术雷达202504月刊精华
本期雷达 ###技术部分 7. GraphRAG 试验 在上次关于 检索增强生成(RAG)的更新中,我们已经介绍了GraphRAG。它最初在微软的文章中被描述为一个两步的流程: (1)对文档进行分块,并使用基于大语言…...
[创业之路-380]:企业法务 - 企业经营中,企业为什么会虚开増值税发票?哪些是虚开増值税发票的行为?示例?风险?
一、动机与风险 1、企业虚开增值税发票的动机 利益驱动 骗抵税款:通过虚开发票虚增进项税额,减少应纳税额,降低税负。公司套取国家的利益。非法套现:虚构交易开具发票,将资金从公司账户转移至个人账户,用…...
嵌入式:ARM公司发展史与核心技术演进
一、发展历程:从Acorn到全球算力基石 1. 起源(1978-1990) 1978年:奥地利物理学家Hermann Hauser与工程师Chris Curry创立剑桥处理器公司(CPU Ltd.),后更名为**艾康电脑(Acor…...
ubuntu的各种工具配置
1.nfs:虚拟机桥接模式下,开发板和虚拟机保持在同一网段下,开发板不要直连电脑 挂载命令:mount -v -t nfs 192.168.110.154:/home/lhj /mnt -o nolock (1) 安装 NFS 服务器 sudo apt update sudo apt install nfs-kernel-server -y…...
Go 剥离 HTML 标签的三把「瑞士军刀」——从正则到 Bluemonday
1 为什么要「剥皮」? 安全:去掉潜在的 <script onload…> 等恶意标签,防止存储型 XSS。可读性:日志、消息队列、搜索索引里往往只需要纯文本。一致性:不同富文本编辑器生成的 HTML 五花八门,统一成「…...
【Java面试笔记:基础】6.动态代理是基于什么原理?
1. 反射机制 定义:反射是 Java 语言提供的一种基础功能,允许程序在运行时自省(introspect),直接操作类或对象。功能: 获取类定义、属性和方法。调用方法或构造对象。运行时修改类定义。 应用场景ÿ…...
docker容器中uv的使用
文章目录 TL;DRuv简介uv管理项目依赖step 1step 2WindowsLinux/Mac step 3依赖包恢复 在Docker容器中使用uv TL;DR 本文记录uv在docker容器中使用注意点, uv简介 uv是用rust编写的一个python包管理器,特点是速度快,且功能强大,目标是替代p…...
分部积分选取u、v的核心是什么?
分部积分选取u、v的核心是什么?是反对幂指三吗? 不全是,其实核心是:v要比u更容易积分,也就是更容易求得原函数,来看一道例题:...
Android Studio调试中的坑二
下载新的Android studio Meerkat后,打开发现始终无法更新对应的SDK,连Android 15的SDK也无法在SDK Manger中显示出来,但是Meerkat必须要使用新版本SDK。 Android studio下载地址 命令行工具 | Android Studio | Android Developers 解决…...
【Redis】缓存三剑客问题实践(上)
本篇对缓存三剑客问题进行介绍和解决方案说明,下篇将进行实践,有需要的同学可以跳转下篇查看实践篇:(待发布) 缓存三剑客是什么? 缓存三剑客指的是在分布式系统下使用缓存技术最常见的三类典型问题。它们分…...
2025年4月22日(平滑)
在学术和工程语境中,表达“平滑”需根据具体含义选择术语。以下是专业场景下的精准翻译及用法解析: 1. 数学/信号处理中的「平滑」(消除噪声) Smooth (verb/noun/adjective) “Apply a Gaussian filter to smooth the noisy signa…...
给vue-admin-template菜单栏 sidebar-item 添加消息提示
<el-badge :value"200" :max"99" class"item"><el-button size"small">评论</el-button> </el-badge> <!-- 在 SidebarItem.vue 中 --> <template><div v-if"!item.hidden" class&q…...
C++(初阶)(十二)——stack和queue
十二,stack和queue 十二,stack和queueStackQueuepriority_queue 简单使用模拟实现deque Stack 函数说明stack()构造空栈empty()判断栈是否为空size()返回栈的有效元素个数top()返会栈顶元素的引用push()将所给元素val压入栈中pop()将栈的尾部元素弹出 …...
数据采集:AI 发展的基石与驱动力
人工智能(AI)无疑是最具变革性的技术力量之一,正以惊人的速度重塑着各行各业的格局。从智能语音助手到自动驾驶汽车,从精准的医疗诊断到个性化的推荐系统,AI 的广泛应用已深刻融入人们的日常生活与工作的各个层面。而在…...
Kubernetes Docker 部署达梦8数据库
Kubernetes & Docker 部署达梦8数据库 一、达梦镜像获取 目前达梦官方暂未在公共镜像仓库提供Docker镜像,需通过达梦官网联系获取官方镜像包。 二、Kubernetes部署方案 部署配置文件示例 apiVersion: apps/v1 kind: Deployment metadata:labels:app: dm8na…...
宏碁笔记本电脑怎样开启/关闭触摸板
使用快捷键:大多数宏碁笔记本可以使用 “FnF7” 或 “FnF8” 组合键来开启或关闭触摸板,部分型号可能是 “FnF2”“FnF9” 等。如果不确定,可以查看键盘上的功能键图标,一般有触摸板图案的按键就是触摸板的快捷键。通过设备管理器…...
计算机组成与体系结构:缓存(Cache)
目录 为什么需要 Cache? 🧱 Cache 的分层设计 🔹 Level 1 Cache(L1 Cache)一级缓存 🔹 Level 2 Cache(L2 Cache)二级缓存 🔹 Level 3 Cache(L3 Cache&am…...
【VS Code】打开远程服务器Docker项目或文件夹
1、配置SSH连接 在VS Code中,按CtrlShiftP打开命令面板。 输入并选择Remote-SSH: Connect to Host...。 输入远程服务器的SSH地址(例如userhostname或userip_address)。 如果这是您第一次连接到该主机,VS Code可能会要求您配置…...
docker 常见命令
指定服务名查看日志 docker-compose logs -f doc-cleaning docker inspect id 启动所有服务 在docker-compose目录下 docker-compose up -d docker-compose down会删除容器和网络 docker compose stop redis rabbitmq docker compose stop可以快速停止服务,方…...
C#抽象类和虚方法的作用是什么?
抽象类 (abstract class): 不能直接实例化,只能被继承。 用来定义一套基础框架和规范,强制子类必须实现某些方法(抽象方法)。 可用来封装一些共通的逻辑,减少代码重复。 虚方法 (virtual): …...
redis数据类型-基数统计HyperLogLog
redis数据类型-基数统计HyperLogLog 文档 redis单机安装redis常用的五种数据类型redis数据类型-位图bitmap 说明 官网操作命令指南页面:https://redis.io/docs/latest/commands/?nameget&groupstringHyperLogLog介绍页面:https://redis.io/docs…...
音视频学习 - MP3格式
环境 JDK 13 IDEA Build #IC-243.26053.27, built on March 16, 2025 Demo MP3Parser MP3 MP3全称为MPEG Audio Layer 3,它是一种高效的计算机音频编码方案,它以较大的压缩比将音频文件转换成较小的扩展名为.mp3的文件,基本保持源文件的音…...
Oracle--PL/SQL编程
前言:本博客仅作记录学习使用,部分图片出自网络,如有侵犯您的权益,请联系删除 PL/SQL(Procedural Language/SQL)是Oracle数据库中的一种过程化编程语言,构建于SQL之上,允许编写包含S…...
【愚公系列】《Python网络爬虫从入门到精通》063-项目实战电商数据侦探(主窗体的数据展示)
🌟【技术大咖愚公搬代码:全栈专家的成长之路,你关注的宝藏博主在这里!】🌟 📣开发者圈持续输出高质量干货的"愚公精神"践行者——全网百万开发者都在追更的顶级技术博主! …...
DAPP(去中心化应用程序)开发全解析:构建去中心化应用的流程
去中心化应用(DApp)凭借其透明性、抗审查性和用户数据主权,正重塑金融、游戏、社交等领域。本文基于2025年最新开发实践,系统梳理DApp从需求规划到部署运维的全流程,并融入经济模型设计、安全加固等核心要点࿰…...
Spark与Hadoop之间有什么样的对比和联系
一、什么是Spark Spark 是一个快速、通用且可扩展的大数据处理框架,最初由加州大学伯克利分校的AMPLab于2009年开发,并于2010年开源。它在2013年成为Apache软件基金会的顶级项目,是大数据领域的重要工具之一。 Spark 的优势在于其速度和灵活…...
spark和Hadoop之间的对比和联系
Spark 诞生主要是为了解决 Hadoop MapReduce 在迭代计算以及交互式数据处理时面临的性能瓶颈问题。 一,spark的框架 Hadoop MR 框架 从数据源获取数据,经过分析计算后,将结果输出到指定位置,核心是一次计算,不适合迭…...
LeetCode 第 262 题全解析:从 SQL 到 Swift 的数据分析实战
文章目录 摘要描述题解答案(SQL)Swift 题解代码分析代码示例(可运行 Demo)示例测试及结果时间复杂度分析空间复杂度分析总结未来展望 摘要 在实际业务中,打车平台要监控行程的取消率,及时识别服务质量的问…...
“融合Python与机器学习的多光谱遥感技术:数据处理、智能分类及跨领域应用”
随着遥感技术的快速发展,多光谱数据凭借其多波段信息获取能力,成为地质、农业及环境监测等领域的重要工具。相较于高光谱数据,Landsat、哨兵-2号等免费中分辨率卫星数据具有长时间序列、广覆盖的优势,而无人机平台的兴起进一步补充…...
JavaScript的JSON处理Map的弊端
直接使用 Map 会遇到的问题及解决方案 直接使用 Map 会导致数据丢失,因为 JSON.stringify 无法序列化 Map。以下是详细分析及解决方法: 问题复现 // 示例代码 const myMap new Map(); myMap.set(user1, { name: Alice }); myMap.set(user2, { name: B…...
python的深拷贝浅拷贝(copy /deepcopy )
先说结论: 浅拷贝: 浅拷贝对在第一层的操作都是新建,不改变原对象。 浅拷贝对于原拷贝对象中的嵌套的可变对象是引用,对原拷贝对象中的嵌套的不可变对象是新建。 对新建的对象操作不会影响原被拷贝对象。 对引用对象操作会影…...
新能源汽车充电桩:多元化运营模式助力低碳出行
摘 要:以新能源汽车民用充电桩为研究对象,在分析充电桩建设运营的政府推动模式、电网企业推动模式、汽车厂商推动模式等三种模式利弊的基础上,结合我国的实际情况,提出我国现阶段应实行汽车厂商与电网企业联盟建设充电桩的模式。建立一个考虑…...
Python 设计模式:享元模式
1. 什么是享元模式? 享元模式是一种结构型设计模式,旨在通过共享对象来减少内存使用和提高性能。它特别适用于需要大量相似对象的场景,通过共享相同的对象来避免重复创建,从而节省内存和提高效率。 享元模式的核心思想是将对象的…...