多模态大语言模型arxiv论文略读(五十二)
M3D: Advancing 3D Medical Image Analysis with Multi-Modal Large Language Models
➡️ 论文标题:M3D: Advancing 3D Medical Image Analysis with Multi-Modal Large Language Models
➡️ 论文作者:Fan Bai, Yuxin Du, Tiejun Huang, Max Q. -H. Meng, Bo Zhao
➡️ 研究机构: Beijing Academy of Artificial Intelligence, The Chinese University of Hong Kong, Peking University, Southern University of Science and Technology
➡️ 问题背景:当前的多模态大语言模型(MLLMs)在2D医学图像分析中表现出色,但3D医学图像分析领域仍存在较大空白。3D医学图像如CT和MRI包含丰富的空间信息,但现有方法在处理这些图像时往往需要逐片分析,成本高昂且效果不佳。
➡️ 研究动机:为了填补3D医学图像分析的空白,研究团队致力于开发适用于3D医学图像的多模态大语言模型。通过构建大规模3D多模态医学数据集M3D-Data,提出3D多模态大语言模型M3D-LaMed,并创建3D多模态医学基准M3D-Bench,旨在提升3D医学图像分析的性能和应用范围。
➡️ 方法简介:研究团队构建了M3D-Data,包含120K图像-文本对和662K指令-响应对,涵盖多种3D医学任务。M3D-LaMed模型结合了3D视觉编码器和大型语言模型,能够处理图像-文本检索、报告生成、视觉问答、定位和分割等任务。3D视觉编码器通过CLIP-like策略预训练,3D空间池化感知器用于减少计算成本,同时保留空间信息。此外,研究团队还引入了可提示的分割模块,以实现3D医学图像的分割任务。
➡️ 实验设计:研究团队在M3D-Data上进行了全面的实验,包括图像-文本检索、报告生成、视觉问答、定位和分割等任务。实验结果表明,M3D-LaMed在3D医学图像分析中表现出色,显著优于现有方法。此外,研究团队还提出了M3D-Bench,这是一个涵盖8个任务的3D多模态医学基准,用于自动评估模型的性能。
A Survey on Multilingual Large Language Models: Corpora, Alignment, and Bias
➡️ 论文标题:A Survey on Multilingual Large Language Models: Corpora, Alignment, and Bias
➡️ 论文作者:Yuemei Xu, Ling Hu, Jiayi Zhao, Zihan Qiu, Kexin XU, Yuqi Ye, Hanwen Gu
➡️ 研究机构: 北京外国语大学信息科学技术学院
➡️ 问题背景:大规模语言模型(LLMs)的发展带来了自然语言处理(NLP)领域的范式转变。基于LLMs,多语言大规模语言模型(MLLMs)被开发出来,旨在解决多语言自然语言处理中的挑战,尤其是实现从高资源语言到低资源语言的知识迁移。然而,MLLMs仍面临语言不平衡、多语言对齐和固有偏见等显著问题。
➡️ 研究动机:尽管MLLMs取得了成功,但它们在多语言数据集的使用、多语言表示学习以及偏见问题上仍存在诸多挑战。本文旨在提供对MLLMs的全面分析,深入探讨这些关键问题,为未来的多语言模型研究提供有价值的见解。
➡️ 方法简介:研究团队首先概述了MLLMs的发展历程、关键技术及其多语言能力。接着,探讨了MLLMs的多语言训练语料库和面向下游任务的多语言数据集,这些对于增强MLLMs的跨语言能力至关重要。随后,调查了多语言表示的最新研究,分析了当前MLLMs是否能够学习到通用的语言表示。最后,讨论了MLLMs中的偏见问题,包括偏见的类型、评估指标和去偏技术。
➡️ 实验设计:本文并未设计具体的实验,而是通过文献综述的方式,系统地分析了MLLMs在多语言语料库、多语言对齐和偏见问题上的现状和挑战。研究团队总结了现有MLLMs的多语言训练语料库,探讨了多语言表示的最新进展,并对MLLMs中的偏见问题进行了深入分析。
A Survey on Large Language Model-Based Game Agents
➡️ 论文标题:A Survey on Large Language Model-Based Game Agents
➡️ 论文作者:Sihao Hu, Tiansheng Huang, Fatih Ilhan, Selim Tekin, Gaowen Liu, Ramana Kompella, Ling Liu
➡️ 研究机构: Georgia Institute of Technology, Cisco Research
➡️ 问题背景:大型语言模型(LLMs)及其多模态版本(MLLMs)的发展为游戏代理(game agents)的进化提供了前所未有的机会,使这些代理能够在复杂的计算机游戏环境中展现出类似人类的决策能力。然而,现有的LLM代理(LLMAs)与人类智能之间仍存在显著差异,主要体现在LLMAs依赖于从预训练数据中解码和泛化已有的知识,而人类智能则能够通过实验和经验在现实世界中发现和学习新知识。
➡️ 研究动机:为了弥合这一差距,研究团队对基于LLM的游戏代理(LLMGAs)进行了全面的综述,旨在提供一个统一的参考框架,涵盖LLMGAs的六个核心功能组件:感知、记忆、思考、角色扮演、行动和学习。此外,研究还对现有文献进行了分类,探讨了不同游戏类型的技术挑战、支持的游戏环境及常用的优化策略,并展望了未来的研究方向。
➡️ 方法简介:研究团队提出了一个概念架构,描述了LLMGAs的六个核心功能组件及其工作流程。此外,研究还引入了一个分类法,将现有文献分为六类游戏:冒险、通信、竞争、合作、模拟和创造与探索。对于每类游戏,研究描述了技术挑战、支持的游戏环境及常用的优化策略。
➡️ 实验设计:虽然本文主要是一个综述,但研究团队通过分析现有文献,系统地评估了不同LLMGAs在各种游戏类型中的表现,包括冒险、通信、竞争、合作、模拟和创造与探索游戏。研究特别关注了LLMGAs在感知、记忆、思考、角色扮演、行动和学习模块中的具体实现和技术挑战。
VIAssist: Adapting Multi-modal Large Language Models for Users with Visual Impairments
➡️ 论文标题:VIAssist: Adapting Multi-modal Large Language Models for Users with Visual Impairments
➡️ 论文作者:Bufang Yang, Lixing He, Kaiwei Liu, Zhenyu Yan
➡️ 研究机构: The Chinese University of Hong Kong, Hong Kong SAR, China
➡️ 问题背景:全球约有22亿人受到视觉障碍的影响,这些障碍包括部分或完全的视觉感知困难。近年来,多模态大型语言模型(MLLMs)在多个领域展现了卓越的能力,尤其是视觉理解和推理方面。然而,视觉障碍者(VI)在使用MLLMs时面临挑战,主要是因为他们在捕捉图像时难以确保图像质量,导致MLLMs生成的响应不可靠。
➡️ 研究动机:尽管MLLMs在视觉理解和推理方面表现出色,但视觉障碍者在使用这些模型时遇到的主要问题是图像质量低下。为了提高MLLMs对视觉障碍者的适应性和实用性,研究团队设计了VIAssist,一个专门为视觉障碍者优化的MLLM。VIAssist能够识别低质量图像并提供详细的重新拍摄建议,从而提高模型对用户查询的响应质量。
➡️ 方法简介:研究团队首先收集了一个包含视觉障碍者特定问题和图像的指令数据集,用于微调MLLM。数据集中的每个样本格式为:<问题,图像,响应>。通过这个数据集,研究团队使用LoRA技术对基于LLaVA的模型进行了参数高效的微调,以增强模型在处理视觉障碍者查询时的性能。
➡️ 实验设计:研究团队在两个数据集上进行了实验,包括标准的视觉问答(VQA)数据集VQAv2和针对视觉障碍者的VQA数据集VizWiz。实验评估了VIAssist在不同条件下的表现,包括图像质量评估、重新拍摄建议的详细程度以及响应的相关性和准确性。实验结果表明,VIAssist在BERTScore和ROUGE评分上分别比基线模型高出0.21和0.31,显示出其在提高视觉障碍者查询响应质量方面的显著优势。
➡️ 论文标题:JailBreakV: A Benchmark for Assessing the Robustness of MultiModal Large Language Models against Jailbreak Attacks
➡️ 论文作者:Weidi Luo, Siyuan Ma, Xiaogeng Liu, Xiaoyu Guo, Chaowei Xiao
➡️ 研究机构: The Ohio State University、Peking University、University of Wisconsin-Madison
➡️ 问题背景:随着多模态大语言模型(MLLMs)的快速发展,确保这些模型在面对恶意输入时的安全性,并使其与人类价值观保持一致,已成为一个关键挑战。当前的研究主要集中在图像输入的越狱攻击上,但尚未探索用于越狱大语言模型(LLMs)的技术是否同样适用于MLLMs。
➡️ 研究动机:研究团队旨在通过引入JailBreakV-28K基准,评估LLMs越狱技术向MLLMs的转移性,以及MLLMs对各种越狱攻击的鲁棒性和安全性。研究发现,从LLMs转移过来的越狱攻击在MLLMs上具有显著的攻击成功率(ASR),这突显了未来研究中需要解决的文本和图像输入对齐漏洞问题。
➡️ 方法简介:研究团队构建了一个包含28,000个越狱测试案例的综合数据集JailBreakV-28K,涵盖了广泛的恶意查询和攻击策略。该数据集包括20,000个基于文本的LLM转移越狱攻击和8,000个基于图像的MLLM越狱攻击。通过这个数据集,研究团队评估了10个开源MLLMs的鲁棒性和安全性。
➡️ 实验设计:实验在10个最先进的开源MLLMs上进行,使用JailBreakV-28K基准评估模型对越狱攻击的响应。实验设计包括评估不同类型的攻击(如逻辑、说服、模板等)在不同模型上的效果,以及不同类型的图像输入(如空白图像、随机噪声图像、自然图像等)对攻击成功率的影响。实验结果表明,从LLMs转移过来的越狱攻击在MLLMs上具有显著的攻击成功率,强调了未来研究中需要解决的对齐漏洞问题。
相关文章:
多模态大语言模型arxiv论文略读(五十二)
M3D: Advancing 3D Medical Image Analysis with Multi-Modal Large Language Models ➡️ 论文标题:M3D: Advancing 3D Medical Image Analysis with Multi-Modal Large Language Models ➡️ 论文作者:Fan Bai, Yuxin Du, Tiejun Huang, Max Q. -H. M…...
REST API、FastAPI与Flask API的对比分析
以下是关于REST API、FastAPI与Flask API的对比分析,涵盖架构设计、性能表现、开发效率等核心维度: 一、核心定位与架构差异 REST API 本质:一种基于HTTP协议的架构风格,强调资源化操作(通过URI定位资源)、…...
【论文阅读26】贝叶斯-滑坡预测-不确定性
📖 这篇论文主要说了什么? 📌 背景: 滑坡预测里,预测失稳时间(Slope Failure Time, SFT) 很关键,但它受两方面不确定性影响: 观测不确定性(监测数据本身的…...
【笔记】深度学习模型训练的 GPU 内存优化之旅④:内存交换与重计算的联合优化篇
开设此专题,目的一是梳理文献,目的二是分享知识。因为笔者读研期间的研究方向是单卡上的显存优化,所以最初思考的专题名称是“显存突围:深度学习模型训练的 GPU 内存优化之旅”,英文缩写是 “MLSys_GPU_Memory_Opt”。…...
边缘计算革命:大模型轻量化部署全栈实战指南
当ResNet-152模型能在树莓派4B上实现每秒27帧实时推理时,边缘智能时代真正到来。本文解析从模型压缩到硬件加速的完整技术栈,实测Transformer类模型在移动端的部署时延可压缩至16ms,揭示ARM芯片实现INT4量化的工程秘诀与十种典型场景优化方案…...
LangChain4j +DeepSeek大模型应用开发——7 项目实战 创建硅谷小鹿
这部分我们实现硅谷小鹿的基本聊天功能,包含聊天记忆、聊天记忆持久化、提示词 1. 创建硅谷小鹿 创建XiaoLuAgent package com.ai.langchain4j.assistant;import dev.langchain4j.service.*; import dev.langchain4j.service.spring.AiService;import static dev…...
python自动化测试
Python自动化测试指南 Python是自动化测试领域的首选语言之一,凭借其简洁的语法、丰富的库和强大的生态系统,能够高效地实现各种测试需求。本文将详细介绍Python在自动化测试中的应用,涵盖Web测试、API测试、单元测试、GUI测试等多个方面。 1. 自动化测试基础 测试金字塔…...
49、【OS】【Nuttx】【OSTest】参数解析:测试项
背景 接之前 blog 48、【OS】【Nuttx】【OSTest】内存监控:分配释放推演 解析完内存监控,继续看下一个测试项 getopt_test 测试项 getopt_test 如下 getopt,getopt_long,getopt_long_only getopt() 用来解析命令行短选项&am…...
String StringBuilder StringBuffer
文章目录 StringStringBuilderStringBuffer StringStringBuilderStringBuffer可变性不可变可变可变线程安全安全(天然不可变)不安全安全(同步方法)性能低(频繁操作生成新对象)高中(同步开销&…...
[FPGA 官方 IP] Binary Counter
Xilinx Binary Counter IP (PG121) 详细介绍 概述 Xilinx Binary Counter IP(二进制计数器 IP)是 AMD Xilinx 提供的 LogiCORE™ IP 核,用于在 FPGA 中实现高性能、面积高效的二进制计数器。该 IP 核支持上行计数器、下行计数器以及上/下计…...
【大模型实战篇】华为信创环境采用vllm部署QwQ-32B模型
1. 背景 本文分享在华为昇腾机器上部署QwQ-32B模型的实践。 首先华为自己是提供了一套在信创机器(NPU)上部署模型的方案【1】,但是部署之后,测试发现会有输出截断的现象。QwQ-32B本身是支持128k的最大上下文长度,定位…...
优雅关闭服务:深入理解 SIGINT / SIGTERM 信号处理机制
目录 为什么需要优雅关闭? 什么是 SIGINT 和 SIGTERM? 如何实现优雅关闭(以 C 为例) 示例代码(gRPC 服务 Boost 信号监听): 优雅关闭时的清理内容通常包括: 与 SIGKILL 的区别…...
2025五一杯数学建模竞赛选题建议+初步分析
完整内容请看文章最下面的推广群 2025五一杯数学建模竞赛选题建议初步分析 提示:C君认为的难度和开放度评级如下: 难度:B题 > A题 > C题,开放度:B题 > C题 > A题。综合来看:A题目标明确,数据…...
自动剪辑批量混剪视频过原创软件工具视频帧级处理技术实践批量截图解析
一、引言:视频素材精细化处理的技术需求 在视频内容生产与分析场景中,高效的帧级处理是素材解构的核心环节。本文结合实战经验,解析基于智能帧截取算法、参数化配置系统、多线程并行处理的批量帧处理技术方案,构建可复用的工程化…...
GD32F407单片机开发入门(二十五)HC-SR04超声波模块测距实战含源码
文章目录 一.概要二.HC-SR04主要参数1.模块引脚定义2.模块电气参数3.模块通讯时序4.模块原理图 三.GD32单片机超声波模块测距实验四.工程源代码下载五.小结 一.概要 HC-SR04超声波模块常用于机器人避障、物体测距、液位检测、公共安防、停车场检测等场所。HC-SR04超声波模块主…...
C++11新特性_Lambda 表达式
Lambda 表达式是 C11 引入的一项重要特性,它允许你在代码中创建匿名函数对象。Lambda 表达式为编写简洁、灵活的代码提供了便利,尤其适用于函数式编程和需要传递简短回调函数的场景。下面从基本语法、捕获列表、使用场景等方面详细介绍 Lambda 表达式。 …...
vue中$set原理
Vue 中的 $set 方法(Vue.set)主要用于 向响应式对象中添加一个新的属性,并确保这个新属性是响应式的,能够触发视图更新。 📌 背景问题:为什么需要 $set? 在 Vue 2 中,直接给对象新增…...
【C++重载操作符与转换】输入和输出操作符
目录 一、输入输出操作符概述 二、输入输出操作符重载的原理 2.1 为什么需要重载? 2.2 重载的限制 2.3 重载的方式 三、输入输出操作符重载的实现 3.1 输出操作符 << 的重载 3.2 输入操作符 >> 的重载 四、输入输出操作符重载的注意事项 4.1 …...
Vue 生命周期全解析:理解组件从创建到销毁的全过程
Vue 生命周期全解析:理解组件从创建到销毁的全过程 Vue.js 是一个流行的前端框架,它通过“组件化开发”提升了代码组织效率。要真正掌握 Vue,生命周期(Lifecycle) 是一个必须深入理解的核心概念。生命周期不仅决定了组…...
MySQL零基础入门:Ubuntu环境安装与操作精解
知识点1【数据库】 数据的存储方式,我们之前学的,从变量,数组,链表,最后到文件,文件之上,便是数据库,而我们要介绍的MySQL就是数据库的关系数据库中的其中一种。 1、数据库 本质&…...
【计算机视觉】语义分割:Mask2Former:统一分割框架的技术突破与实战指南
深度解析Mask2Former:统一分割框架的技术突破与实战指南 技术架构与创新设计核心设计理念关键技术组件 环境配置与安装指南硬件要求安装步骤预训练模型下载 实战全流程解析1. 数据准备2. 配置文件定制3. 训练流程4. 推理与可视化 核心技术深度解析1. 掩膜注意力机制…...
Qt二维码demo
使用QZXing库生成的二维码demo 运行结果 实现代码 c文件 #include "mainwindow.h" #include "ui_mainwindow.h" #include "src/myqrcodeheader.h"MainWindow::MainWindow(QWidget *parent) :QMainWindow(parent),ui(new Ui::MainWindow) {ui-&…...
Java 基础--数组(Array):存储数据的“排排坐”
作者:IvanCodes 发布时间:2025年5月1日🤓 专栏:Java教程 大家好!👋 咱们在编程时,经常需要处理一批相同类型的数据,比如班级里所有同学的成绩 💯、一周每天的最高气温 …...
OpenGL-ES 学习(10) ---- OpenGL-ES Shader语言语法
目录 Shader 举例Shader 语法版本规范声明变量和定法方法向量构造方法矩阵构造方法结构,数组,函数定义结构数组函数 内建函数条件语句和运算符统一变量统一变量块Shader 输入输出插值限定符预处理命令精度限定符不变性 Shader 举例 一个典型的简单的 Sh…...
Unity SpriteAtlas (精灵图集)
🏆 个人愚见,没事写写笔记 🏆《博客内容》:Unity3D开发内容 🏆🎉欢迎 👍点赞✍评论⭐收藏 🔎为什么要打图集? 💡打图集的目的就是减少DrawCall 提高性能 &a…...
(33)VTK C++开发示例 ---图片转3D
文章目录 1. 概述2. CMake链接VTK3. main.cpp文件4. 演示效果 更多精彩内容👉内容导航 👈👉VTK开发 👈 1. 概述 这是 VTK 测试 clipArt.tcl 的改编版本。 提供带有 2D 剪贴画的 jpg 文件,该示例将创建 3D 多边形数据模…...
RAG工程-基于LangChain 实现 Advanced RAG(预检索-查询优化)(上)
Enrich 完善问题 完善问题流程概述 问题转述 在典型RAG架构中,用户问题的质量直接影响检索系统的表现。研究表明,未经优化的自然语言查询会导致: 关键实体识别缺失 语义漂移导致召回偏离 长尾问题检索失败率升高 大多数用户并非提示词工程…...
交我算使用保姆教程:在计算中心利用singularity容器训练深度学习模型
文章目录 准备工作步骤如何封装和使用容器安装创建 Singularity 容器编写 def 文件构建容器查看构建容器的 python 版本本地测试挂载数据集和代码 如何上传数据windows 系统Linux 系统 如何设置作业任务脚本的结构常用的 Slurm 参数一份完整的 slurm 作业示例 如何在 debug 队列…...
CMake中强制启用option定义变量的方法
在CMake中,若要在另一个CMake文件中强制启用由option()定义的变量,可使用set(... FORCE)覆盖缓存变量。具体步骤如下: 使用set命令强制覆盖缓存: 在需要强制启用选项的CMake文件中,使用set命令并指定CACHE和FORCE参数。…...
图解 Git 工作流:理解 Rebase、Merge 与 Pull Request 的区别
图解 Git 工作流:理解 Rebase、Merge 与 Pull Request 的区别 在多人协作开发中,选择合适的 Git 分支管理策略至关重要。Merge、Rebase 和 Pull Request 是最常见的三种方式,它们本质不同,使用场景也不同。 本文将通过流程图&am…...
图与网络模型
目录 图的基本概念 例题:比赛的安排 MATLAB作图 最短路径模型 Dijkstra算法步骤 最短路径的Dijkstra算法示例 Dijkstra算法的Matlab函数 最短路径的Floyd算法模型 最短路径的Floyd算法步骤 Floyd算法的Matlab函数 图的基本概念 图G是一个二重组: …...
连接linux虚拟机并运行C++【从0开始】
连接linux虚拟机并运行C【从0开始】 NetSarang安装后两个,其实更加常用的 安装VMware安装Ubuntu 的 ISO 镜像VMWare--TipsUbuntu快捷键,可以在设置里面修改 连接Linux运行cwhy剪不断,理还乱操作 因为好多判题系统,后台都是Linux环…...
多线程系列二:Thread类
Thread类是jvm用来管理线程的一个类,换句话说,每个线程都有一个唯一的Thread对象与之关联 1.Thread常见构造方法 Thread():创建线程对象Thread(Runnable target):使用Runnable对象创建线程对象Thread(String name):创…...
2025五一杯数学建模C题:社交媒体平台用户分析问题,完整第一问模型与求解+代码
完整代码模型请见文末名片 • 问题1分析: – 来龙去脉和与其他问题的内在联系: • 来龙去脉:社交媒体平台为了评估博主的价值,合理分配资源和优化内容推荐,需要准确预测博主的新增关注数。新增关注数是衡量博主影响…...
开源飞控软件:推动无人机技术进步的引擎
在过去的二十年里,众多开源自动驾驶仪项目极大地推动了无人机技术的发展。像 MatrixPilot、Baseflight、TauLabs、OpenPilot、Cleanflight、MultiWii 和 dRonin 等一些开源自动驾驶仪项目已经停止开发,然而,Ardupilot/APM、Pixhawk/PX4、Papa…...
Pinia: vue3状态管理
一、Pinia 的相关介绍 1. 什么是 Pinia Pinia 是一个专门配合 vue.js 使用的状态管理, 从而实现跨组建通信或实现多个组件共享数据的一种技术 2. 使用 Pinia 的目的 我们的vuejs有俩个特性: 1> 数据驱动视图. 2> 组件化开发 基于这俩个特性, 我们引出pinia的使用目的 …...
初学Vue之记事本案例
初学Vue之记事本案例 案例功能需求相关Vue知识案例实现1.实现方法及代码2.演示 案例收获与总结 案例功能需求 基于Vue实现记事功能(不通过原生JS实现) 1.点击保存按钮将文本框的内容显示在特定位置,且清空文本框内容 2.点击清空按钮&#x…...
中国发布Web3计划:区块链列为核心基础技术,不排除发展加密资产应用!
在全球数字化浪潮汹涌、Web3概念方兴未艾之际,中国政府再次展现了其在区块链技术领域的雄心与布局。近日,北京市多个核心政府部门联合发布了一项名为《北京市区块链创新应用发展行动计划(2025–2027年)》的重要政策文件࿰…...
并发设计模式实战系列(11):两阶段终止(Two-Phase Termination)
🌟 大家好,我是摘星! 🌟 今天为大家带来的是并发设计模式实战系列,第十一章两阶段终止(Two-Phase Termination),废话不多说直接开始~ 目录 一、核心原理深度拆解 1. 两阶段终止流…...
科学养生,解锁健康生活密码
健康是生命的基石,养生并非高深的学问,而是通过科学的生活方式,为身体构筑持久的健康防线。在现代快节奏生活中,掌握正确的养生方法,能有效提升生活质量,预防疾病侵袭。 均衡饮食是养生的核心。日常饮食应遵…...
计算机视觉——基于树莓派的YOLO11模型优化与实时目标检测、跟踪及计数的实践
概述 设想一下,你在多地拥有多个仓库,要同时监控每个仓库的实时状况,这对于时间和精力而言,都构成了一项艰巨挑战。从成本和可靠性的层面考量,大规模部署计算设备也并非可行之策。一方面,大量计算设备的购…...
初识 Java
文章目录 一、背景知识二、技术体系 一、背景知识 Java 是美国 sun(Stanford University Network)公司(2009 年被 Oracle 公司收购)在 1995 年推出的一门计算机高级编程语言 二、技术体系 Java SE(Java Standard Edition):标准版,Java 技术的核心和基…...
彩带飘落效果
文章目录 彩带效果适应场景HTML版本Vue3版本 彩带效果 彩带特效组件 适应场景 完成小结、版本升级等场景。提供HTM、Vue3版本。 HTML版本 <!doctype html> <html lang"zh-CN"><head><meta charset"UTF-8" /><meta name"…...
统计模式识别理论与方法
我们在前文《模式识别的基本概念与理论体系》中就已经提及“模式分类”。 具体内容看我的CSDN文章:模式识别的基本概念与理论体系-CSDN博客 模式的识别方法主要有统计模式识别方法和结构模式识别方法两大类。统计模式识别方法提出得较早,理论也较成熟…...
Ubuntu 安装 Cursor
Cursor 目前只有 Windows 和 Mac 版本,那么如何在 Ubuntu 上运行呢? 本质上是一个如何在 Ubuntu 运行 .appimage 的问题。 1. 下载 Cursor Linux 首先找到 Cursor 官网,下载 x64 安装包,如果你是 arm 架构,就下载 ar…...
前端八股 7
垃圾回收机制 系统周期性地找出暂时不再使用的变量的机制,释放其内存的机制 方法:古老引用计数法 创建一张引用表记录各种资源被引用的次数,当引用次数为0就回收 问题:当有两个对象互相引用时会造成内存泄漏 比如:…...
二、HTML
2.1 介绍 HTML(HyperText Markup Language,超文本标记语言) HTML是网页的骨架,用于定义网页的结构和内容。通过各种标签(如<div>、<p>、<a>、<img>等)来组织文本、图片、表格、表…...
EBO的使用
EBO 其实就是个索引,绑定在相应的VAO中,用来描述绘制顺序。比如在OpenGL绘制三角形的时候,假设有四个顶点,我称他们分别为1,2,3,4号顶点,常规绘制三角形函数是按三个点为一组&#x…...
AI大模型基础设施:NVIDIA的用于AI大语言模型训练和推理的几款主流显卡
英伟达(NVIDIA)在AI大语言模型(LLM)的训练和推理领域占据主导地位,其GPU因强大的并行计算能力和专为深度学习优化的架构而广受青睐。以下介绍几款主流的NVIDIA GPU,适用于AI大语言模型的训练和推理…...
面试手撕——迭代法中序遍历二叉树
思路 访问顺序和处理顺序不一致导致迭代法难写,体现在总要先遍历根节点,才能访问左右孩子,用null标记,null标记的节点表示已经访问过了,下一次可以处理,所以在当前栈顶节点不是null的时候,都要…...