多模态大语言模型arxiv论文略读(八十二)
Emotion-LLaMA: Multimodal Emotion Recognition and Reasoning with Instruction Tuning
➡️ 论文标题:Emotion-LLaMA: Multimodal Emotion Recognition and Reasoning with Instruction Tuning
➡️ 论文作者:Zebang Cheng, Zhi-Qi Cheng, Jun-Yan He, Jingdong Sun, Kai Wang, Yuxiang Lin, Zheng Lian, Xiaojiang Peng, Alexander Hauptmann
➡️ 研究机构: 深圳技术大学、卡内基梅隆大学、阿里巴巴集团、新加坡国立大学、中国科学院自动化研究所
➡️ 问题背景:准确的情感感知对于人机交互、教育辅助和心理咨询等应用至关重要。然而,传统的单模态方法往往无法捕捉到现实世界情感表达的复杂性,这些表达本质上是多模态的。此外,现有的多模态大语言模型(MLLMs)在整合音频和识别细微的面部微表情方面面临挑战。
➡️ 研究动机:研究团队认为,缺乏专门的多模态情感指令数据集是限制MLLMs有效性的主要因素。这些模型在处理音频输入和识别细微面部微表情方面的能力不足,导致在现实世界场景中的表现不佳。为了解决这些问题,研究团队构建了MERR数据集,并提出了Emotion-LLaMA模型,旨在提高情感识别和推理的能力。
➡️ 方法简介:研究团队构建了MERR数据集,包含28,618个粗粒度和4,487个细粒度标注样本,涵盖了多种情感类别。Emotion-LLaMA模型通过情感特定编码器整合音频、视觉和文本输入,并通过指令调优(instruction tuning)方法增强情感识别和推理能力。模型通过将多模态特征对齐到共享空间,并使用修改后的LLaMA模型,显著提高了情感识别和推理的准确性。
➡️ 实验设计:研究团队在四个公开数据集上进行了实验,包括MER2023、MER2024、DFEW和EMER。实验设计了不同任务,如情感识别和情感推理,以全面评估Emotion-LLaMA在多模态情感任务中的表现。实验结果表明,Emotion-LLaMA在多个数据集上显著优于其他MLLMs,特别是在Clue Overlap(7.83)和Label Overlap(6.25)等指标上取得了最高分。此外,Emotion-LLaMA在MER2023-SEMI挑战中取得了0.9036的F1分数,在DFEW数据集的零样本评估中也表现优异,UAR为45.59%,WAR为59.37%。
MMNeuron: Discovering Neuron-Level Domain-Specific Interpretation in Multimodal Large Language Model
➡️ 论文标题:MMNeuron: Discovering Neuron-Level Domain-Specific Interpretation in Multimodal Large Language Model
➡️ 论文作者:Jiahao Huo, Yibo Yan, Boren Hu, Yutao Yue, Xuming Hu
➡️ 研究机构: The Hong Kong University of Science and Technology (Guangzhou), The Hong Kong University of Science and Technology, Tongji University
➡️ 问题背景:多模态大语言模型(Multimodal Large Language Models, MLLMs)通过将视觉特征投影到词嵌入空间,实现了视觉和语言的融合。然而,这些模型的内部机制尚未完全探索,特别是关于如何处理来自不同领域的特征。研究团队发现,MLLMs在处理特定领域的信息时,可能并未充分利用这些信息,这影响了模型在特定任务上的表现。
➡️ 研究动机:为了深入理解MLLMs如何处理不同领域的特征,研究团队识别了MLLMs中的领域特定神经元(Domain-Specific Neurons, DSNs),并分析了这些神经元的分布和激活模式。研究旨在揭示MLLMs在处理多模态特征时的内部机制,为未来模型的改进提供理论支持。
➡️ 方法简介:研究团队提出了一种基于领域激活概率熵(Domain Activation Probability Entropy, DAPE)的方法,用于识别MLLMs中的DSNs。通过分析不同领域数据集上的模型表现,研究团队构建了一个三层框架,描述了MLLMs在处理投影图像特征时的机制。此外,研究团队还使用logit lens技术,解码模型中间层的隐藏状态,以可视化特征转换过程。
➡️ 实验设计:研究在五个不同领域的数据集上进行了实验,包括VQAv2(通用场景)、PMC-VQA(医学领域)、DocVQA(文档领域)、LingoQA(自动驾驶领域)和RS-VQA(遥感领域)。实验设计了不同的评估指标,如准确率和平均归一化Levenshtein相似度(ANLS),以全面评估模型在不同领域的表现。通过对比激活和不激活领域特定神经元时的模型性能,研究团队验证了DSNs对模型表现的影响。
Hallucination Mitigation Prompts Long-term Video Understanding
➡️ 论文标题:Hallucination Mitigation Prompts Long-term Video Understanding
➡️ 论文作者:Yiwei Sun, Zhihang Liu, Chuanbin Liu, Bowei Pu, Zhihan Zhang, Hongtao Xie
➡️ 研究机构: 中国科学技术大学 (University of Science and Technology of China)
➡️ 问题背景:当前的多模态大型语言模型在视频理解任务中取得了显著进展,但在处理未经处理的长视频时能力有限,主要原因是难以支持巨大的内存开销。现有的方法通过聚合帧来平衡内存和信息,但不可避免地引入了严重的幻觉问题,包括错误引用和虚构内容。
➡️ 研究动机:为了缓解这些幻觉问题,研究团队基于现有的多模态大型语言模型(MLLMs)构建了一个全面的幻觉缓解管道。该管道通过使用CLIP Score指导基于问题的帧采样、将问题信息注入图像Q-former的查询中以获取更重要的视觉特征,以及在答案生成阶段利用链式思维和上下文学习技术来显式控制答案的生成,从而有效缓解了幻觉问题。
➡️ 方法简介:研究团队提出了一种系统的方法,通过构建一个全面的幻觉缓解管道,该管道包括CLIP Score指导的帧采样、问题引导的帧特征提取器以及链式思维和上下文学习技术。此外,对于断点模式,研究团队发现图像理解模型比视频理解模型表现更好,因此采用了一种比较机制来整合两种模型的答案。
➡️ 实验设计:在MovieChat数据集上进行了实验,实验设计了不同的组件(如链式思维、CLIP Score指导的帧采样、上下文学习)的变化,以及不同模式(全局模式和断点模式)的评估,以全面评估模型在不同条件下的表现。实验结果表明,该方法在全局模式和断点模式下分别达到了84.2%和62.9%的准确率,显著超越了官方基线模型。
Preserving Knowledge in Large Language Model with Model-Agnostic Self-Decompression
➡️ 论文标题:Preserving Knowledge in Large Language Model with Model-Agnostic Self-Decompression
➡️ 论文作者:Zilun Zhang, Yutao Sun, Tiancheng Zhao, Leigang Sha, Ruochen Xu, Kyusong Lee, Jianwei Yin
➡️ 研究机构: 浙江大学计算机科学与技术学院、浙江大学滨江研究院、Linker Technology Research Co. Ltd
➡️ 问题背景:大型语言模型(LLMs)和多模态大型语言模型(MLLMs)在特定领域的性能可能会下降,尤其是在进行领域特定的监督微调(SFT)时,模型可能会遭受灾难性遗忘,即在学习新知识的同时忘记旧知识。此外,MLLMs在语言基准测试中的表现通常不如其单模态对应模型。
➡️ 研究动机:为了应对LLMs和MLLMs在特定领域训练时的灾难性遗忘问题,研究团队提出了一种新的模型无关的自解压方法——树生成(Tree Generation, TG),该方法通过将LLMs中的知识解压到训练语料库中,以减少遗忘问题。研究旨在通过在SFT过程中加入解压数据,提醒并保持旧知识,从而提高模型的泛化能力。
➡️ 方法简介:研究团队设计了一种名为TG-SFT的方法,用于监督微调MLLMs。TG-SFT通过构建结构化的对话序列,生成多样且准确的对话语料库,以供模型训练。该方法基于树状扩展策略,从一个通用的系统提示开始,逐步生成问题和回答,形成完整的对话路径。
➡️ 实验设计:实验在多个数据集上进行,包括视觉-语言基准测试(如GQA、MMBench等)和纯语言基准测试(如ARC、HellaSwag等)。实验比较了不同方法(如LLaVA Full-Param、LLaVA LoRA、Human ShareGPT、TG-SFT Wide-Tree和TG-SFT Balance-Tree)在SFT过程中的表现,评估了不同树结构配置和对话轮数对模型性能的影响。实验结果表明,TG-SFT方法在减少灾难性遗忘方面表现出色,尤其是在使用知识引导的TG-SFT Balance-Tree方法时,模型在语言基准测试中的表现接近甚至超过了使用人类生成数据的模型。
AIC MLLM: Autonomous Interactive Correction MLLM for Robust Robotic Manipulation
➡️ 论文标题:AIC MLLM: Autonomous Interactive Correction MLLM for Robust Robotic Manipulation
➡️ 论文作者:Chuyan Xiong, Chengyu Shen, Xiaoqi Li, Kaichen Zhou, Jeremy Liu, Ruiping Wang, Hao Dong
➡️ 研究机构: 北京大学计算机学院、中国科学院计算技术研究所
➡️ 问题背景:在现实世界中,机器人系统与物体的稳定交互需要具备反思和纠正失败的能力。尽管多模态大语言模型(MLLMs)在理解、分析和解释失败方面表现出色,但现有的方法主要集中在使用额外的MLLM进行高层次任务规划的纠正,而对低层次接触姿态的纠正利用不足,特别是在处理关节物体时。
➡️ 研究动机:为了填补这一空白,研究团队提出了一种自主交互纠正(AIC)MLLM框架,该框架利用先前的低层次交互经验来纠正关节物体操作的SE(3)姿态预测。研究旨在通过学习失败样本来提高机器人的低层次动作生成能力,从而增强其操作稳定性。
➡️ 方法简介:研究团队设计了视觉和文本提示来指导位置和旋转的纠正,并引入了一个反馈信息提取模块,以根据识别出的失败原因自适应地纠正姿态预测。此外,还实现了一个测试时适应(TTA)策略,以增强模型对当前场景配置的适应性。
➡️ 实验设计:在模拟和真实环境中进行了广泛的实验,以评估所提出方法的有效性。实验包括了不同类型的关节物体,通过测试AIC MLLM在不同条件下的表现,验证了其在纠正失败样本方面的效率。
相关文章:
多模态大语言模型arxiv论文略读(八十二)
Emotion-LLaMA: Multimodal Emotion Recognition and Reasoning with Instruction Tuning ➡️ 论文标题:Emotion-LLaMA: Multimodal Emotion Recognition and Reasoning with Instruction Tuning ➡️ 论文作者:Zebang Cheng, Zhi-Qi Cheng, Jun-Yan H…...
常见排序算法整理(Java实现)
1.冒泡排序(Bubble Sort) 原理 重复遍历数组,比较相邻元素,若顺序错误则交换。每趟将最大元素"冒泡"到末尾。 每次遍历保证了最大元素被放在最后,所以内层循环不需要遍历到最后的位置。 代码实现 public …...
c++字符串常用语法特性查询示例文档(二)
在 C中,除了std::string和std::string_view,还有其他一些与字符串相关的类型,它们各自针对不同的场景进行了优化。以下是一些常见的字符串类型及其使用方式和适用场景的汇总。 紧接上篇 c字符串常用语法特性查询示例文档(一&#…...
10.14 Function Calling与Tool Calling终极解析:大模型工具调用的5大核心差异与实战优化
Function Calling vs Tool Calling:大模型工具调用机制深度解析 关键词:Function Calling 原理, Tool Calling 实现, @tool 装饰器, ToolMessage 机制, 工具调用优化 1. 核心概念对比分析 #mermaid-svg-uDxSPB1CoQrHDxrT {font-family:"trebuchet ms",verdana,ari…...
opencascade如何保存选中的面到本地
环境:occ 7.6 需求场景:用户点击了一个TopoDS_Shape,还选中了其中一个面,这时候他点了保存。用户下次打开模型文件时,我们的viewer窗口要恢复上次的选中状态。 核心问题:如何把用户选中的面保存,…...
CSS 单位详解:px、rem、em、vw/vh 的区别与使用场景
CSS 单位详解:px、rem、em、vw/vh 的区别与使用场景 在 CSS 中,各种单位有不同的特性和适用场景,理解它们的区别对实现响应式布局至关重要。 1. 绝对单位 px 特点: 像素(Pixel)是绝对长度单位1px 对应屏…...
YOLO模型predict(预测/推理)的参数设置
上一章描述了预测初体验,基本可以使用现有的yolo模型进行预测/推理。本次我们了解一下这个过程中的参数的作用。 1.参数示例 conf=0.68 :表示模型识别这个东西是车的概率为68% 。一般默认的情况下,概率小于25%的就不显示了。 1)调整一下python的代码的参数如下,可以预测图…...
MATLAB中NLP工具箱支持聚类算法
文章目录 前言一、层次聚类(Hierarchical Clustering)二、DBSCAN(基于密度的空间聚类)三、高斯混合模型(GMM)四、谱聚类(Spectral Clustering)五、模糊 C 均值(Fuzzy C-M…...
甘特图工具怎么选?免费/付费项目管理工具对比测评(2025最新版)
2025年甘特图工具的全面指南 在项目管理领域,甘特图作为最直观的任务规划和进度追踪工具,已成为团队协作和项目执行的核心手段。随着数字化技术的快速发展,2025年的甘特图工具市场呈现出前所未有的多元化和智能化趋势。从开源软件到云端协作…...
Google设置app-ads.txt
问题: 应用上架后admob后台显示应用广告投放量受限,需要设置app-ads.txt才行。 如何解决: 官方教程: 看了下感觉不难,创建一个txt,将第二条的代码复制进行就得到app-ads.txt了。 然后就是要把这个txt放到哪才可以…...
Swift 二分查找实战:精准定位第一个“Bug版本”(LeetCode 278)
文章目录 摘要描述示例 题解答案(Swift)题解代码分析示例测试及结果输出结果: 时间复杂度分析空间复杂度分析总结 摘要 在版本迭代频繁的项目开发中,定位引入 bug 的第一个版本是一项高频任务。LeetCode 第278题“第一个错误的版…...
《AI革命重塑未来五年:医疗诊断精准度翻倍、自动驾驶事故锐减90%,全球科技版图加速变革》
1. 显著突破领域:AI 引发医疗与自动驾驶的范式变革 医疗领域的突破: AI正深刻改变医学研发和临床诊疗模式。在新药研发现代生物学中,DeepMind公司推出的 AlphaFold AI 模型在蛋白质折叠预测上取得了重大突破,被视为解决了困扰科学…...
【盈达科技】AICC™系统:重新定义生成式AI时代的内容竞争力
盈达科技AICC™系统:重新定义生成式AI时代的内容竞争力 ——全球首款AI免疫化内容中台的技术革命与商业实践 一、技术破局:AICC™系统如何重构AI内容生态 1. 技术架构:四大引擎构建闭环护城河 盈达科技AICC™(AI-Immunized Con…...
芯驰科技与安波福联合举办技术研讨会,深化智能汽车领域合作交流
5月15日,芯驰科技与全球移动出行技术解决方案供应商安波福(Aptiv)在上海联合举办以“芯智融合,共赢未来”为主题的技术研讨会。会上,双方聚焦智能座舱与智能车控的发展趋势,展开深入交流与探讨,…...
开发 前端搭建npm v11.4.0 is known not to run on Node.js v14.18.1.
错误nodejs 和npm 版本不一致 ERROR: npm v11.4.0 is known not to run on Node.js v14.18.1. This version of npm supports the following node versions: ^20.17.0 || >22.9.0. You can find the latest version at https://nodejs.org/. ERROR: D:\softTool\node-v14…...
关于systemverilog中在task中使用force语句的注意事项
先看下面的代码 module top(data);logic clk; inout data; logic temp; logic sampale_data; logic [7:0] data_rec;task send_data(input [7:0] da);begin(posedge clk);#1;force datada[7];$display(data);(posedge clk);#1;force datada[6]; $display(data); (posed…...
国产 iPaaS 与国外 iPaaS 产品相比如何?以谷云科技为例
iPaaS(Integration Platform as a Service)作为企业集成的关键技术,受到了广泛关注。国产 iPaaS 产品与国外 iPaaS 产品存在诸多差异,以下将从多个方面进行分析探讨。 一、技术架构与创新 国外 iPaaS 产品往往技术架构成熟且先进…...
低功耗:XILINX FPGA如何优化功耗?
优化Xilinx FPGA及其外围电路的功耗需要从硬件设计、软件配置和系统级优化三个层面综合考虑。以下是具体的优化策略,涵盖硬件和软件方面: 一、硬件层面的功耗优化 选择低功耗FPGA型号 选择Xilinx低功耗系列芯片,如7系列中的Artix-7ÿ…...
从纸质契约到智能契约:AI如何改写信任规则与商业效率?——从智能合约到监管科技,一场颠覆传统商业逻辑的技术革命
一、传统合同的“低效困境”:耗时、昂贵、风险失控 近年来,全球商业环境加速向数字化转型,但合同管理却成为企业效率的“阿喀琉斯之踵”。据国际商会(International Chamber of Commerce)数据显示,全球企业…...
在金融发展领域,嵌入式主板有什么优点?
在金融发展领域,嵌入式主板能够有力推动金融行业的智能化与高效化进程。主板的强大计算能力可以保障业务高效运行。例如在银行的高频交易场景下,其强大计算能力可确保系统在高负荷下依然保持流畅稳定,快速响应用户需求,大大提升金…...
打卡Day30
导入官方库的三种手段 方法一:直接导入整个模块 import math print(math.sqrt(16)) # 输出: 4.0方法二:从模块中导入特定函数或类 from datetime import datetime now datetime.now() print(now) # 输出当前日期和时间方法三:使用别名简…...
AI量化交易是什么?它是如何重塑金融世界的?
第一章:证券交易的进化之路 1.1 从喊价到代码:交易方式的革命性转变 在电子交易普及之前,证券交易依赖于交易所内的公开喊价系统。交易员通过手势、喊话甚至身体语言传递买卖信息,这种模式虽然直观,但效率低下且容易…...
AIGC与数字金融:人工智能金融创新的新纪元
AIGC与数字金融:人工智能金融创新的新纪元 引言 人工智能生成内容(AIGC)在数字金融领域发挥着关键作用,从金融内容生成到智能风控,从个性化服务到投资决策,AIGC正在重塑金融的方式和效果。本文将深入探讨A…...
芯片生态链深度解析(四):芯片制造篇——纳米尺度上的精密艺术
开篇:芯片制造——现代工业的"皇冠明珠" 在芯片生态链的版图中,芯片制造是连接设计与封测的核心枢纽,堪称现代工业的“皇冠明珠”。如果说芯片设计是人类对微观世界的构想,那么制造便是将这种构想转化为现实的终极工程…...
黄金批次在流程和离散行业的概念解析
流程行业 概念 流程行业中: “黄金批次”:通常指生产过程中质量最优、性能最稳定、符合甚至超越所有关键指标的特定批次产品。这类批次在流程行业中具有标杆意义,常用于质量控制、工艺优化和客户交付。 核心特征 在流程行业中,“黄金批次”的核心特征包括: 1、质量一…...
Transformer实战——循环神经网络详解
Transformer实战——循环神经网络详解 0. 前言1. 基本循环神经网络单元1.1 循环神经网络工作原理1.2 时间反向传播1.3 梯度消失和梯度爆炸问题 2. RNN 单元变体2.1 长短期记忆2.2 门控循环单元2.3 Peephole LSTM 3. RNN 变体3.1 双向 RNN3.2 状态 RNN 4. RNN 拓扑结构小结 0. 前…...
基于Qt的app开发第九天
写在前面 笔者的课设截止时间已经越来越近了,还有不少地方的功能没有完成,所以重构一事还是放到做完整个项目、学完设计模式再考虑。目前就是继续往屎山堆屎。 需求分析 笔者的学长要做多线程,传数据的时候涉及到互斥锁之类的内容࿰…...
Baklib内容中台驱动资源管理创新
内容中台驱动智能整合 现代企业数字化进程中,内容中台通过结构化数据治理与智能算法协同,有效解决跨系统内容孤岛问题。以Baklib为例,其核心功能通过多语言支持与API接口集成能力,实现营销素材、产品文档等异构资源的统一索引与动…...
项目记录:「五秒反应挑战」小游戏的开发全过程
我正在参加CodeBuddy「首席试玩官」内容创作大赛,本文所使用的 CodeBuddy 免费下载链接:腾讯云代码助手 CodeBuddy - AI 时代的智能编程伙伴 灵感来源与目标设定 最近我突然有个小想法:想做一个简洁但富有科技感的小型游戏,最好能…...
Git本地使用小Tips
要将本地仓库 d:\test 的更新推送到另一个本地仓库 e:\test,可以使用 Git 的远程仓库功能。以下是具体步骤: 在 e:\test 中添加 d:\test 作为远程仓库 在 e:\test 目录中打开 Git Bash 或命令行,执行以下命令: git remo…...
【AWS入门】AWS身份验证和访问管理(IAM)
【AWS入门】AWS身份验证和访问管理(IAM) [AWS Essentials] AWS Identity and Access Management (IAM) By JacksonML 众所周知,AWS亚马逊云科技位列全球云计算服务第一位,并且持续为广大客户提供安全、稳定的各类云产品和服务。…...
【NLP】36. 从指令微调到人类偏好:构建更有用的大语言模型
从指令微调到人类偏好:构建更有用的大语言模型 大语言模型(LLMs)已经成为现代自然语言处理系统的核心,但单纯依赖传统语言建模目标,往往难以满足实际应用的“人类意图”。从 Instruction Tuning(指令微调&…...
蓝桥杯1447 砝码称重
问题描述 你有一架天平和 N 个砝码,这 N 个砝码重量依次是 W1,W2,⋅⋅⋅,WN。 请你计算一共可以称出多少种不同的重量? 注意砝码可以放在天平两边。 输入格式 输入的第一行包含一个整数 N。 第二行包含 N 个整数:W1,W2,W3,⋅⋅⋅,WN…...
每日c/c++题 备战蓝桥杯(洛谷P4715 【深基16.例1】淘汰赛 题解)
洛谷P4715 【深基16.例1】淘汰赛 题解 题目大意 有 (2^n) 名选手进行淘汰赛,每场比赛两人对决,能力值高者胜出;若能力值相同,则编号较小者胜出。最终决出冠军,要求输出亚军的编号。 解题思路 关键观察:…...
基于深度学习的电力负荷预测研究
一、深度学习模型框架 在当今数字化时代,基于深度学习的电力负荷预测研究正成为保障电力系统稳定、高效运行的关键领域。其模型构建是一个复杂而精妙的过程,涉及多学科知识与前沿技术的融合应用。首先,要明确电力负荷预测的目标,…...
没有 Mac,我如何用 Appuploader 完成 iOS App 上架
没有 Mac,我如何用 Appuploader 完成 iOS App 上架|一个跨平台开发者的实战笔记 在做移动开发这些年里,唯一让我频繁想砸电脑的时刻,大概就是每次要把 iOS App 上传到 App Store。 作为一个主要在 Windows 和 Linux 开发的程序员…...
卓力达手撕垫片:精密制造的创新解决方案与多领域应用
目录 引言 一、手撕垫片的技术特性与核心功能 二、手撕垫片的多领域应用 三、南通卓力达手撕垫片的核心优势 四、未来技术展望 结语 引言 手撕垫片作为一种创新型精密金属部件,凭借其“可分层剥离、快速安装”的特性,在工业制造、电子通信、航空航天等…...
[[春秋云境] Privilege仿真场景
文章目录 靶标介绍:知识点卷影拷贝(VSS) 外网任意文件读取Jenkins管理员后台rdp远程登录Gitlab apiToken 内网搭建代理 Oracle RCESeRestorePrivilege提权mimikatzspn卷影拷贝提取SAM 参考文章 靶标介绍: 在这个靶场中,您将扮演一名资深黑客…...
【工具推荐】--Git详解
本文讲诉,git命令环境的安装和git命令的介绍 Git 是一个非常流行的分布式版本控制系统,它帮助开发者管理和跟踪项目中的代码变化。通俗地说,可以认为 Git 就像是一个代码的时间机器,它记录了项目从开始到结束的每一次代码变动。 …...
在linux里上传本地项目到github中
首先先安装git,安装完git后,输入如下操作指令: 输入自己的用户名和邮箱(为注册GITHUB账号时的用户名和邮箱): git config --global user.name "111"git config --global user.email "121…...
【基础】Windows开发设置入门8:Windows 子系统 (WSL)操作入门
前言 大家熟悉的docker、Python,但对于Windows上有一套开配合开发的相对底层的环境设置,包括powershell、winget、WSL、还有开发驱动器什么的,我准备系统学一下,不然地基不牢,也盖不起冲天高楼~ 本节,介绍…...
服务器上的Nano 编辑器进行git合并
使用git pull拉取后,出现如下部分: GNU nano 2.9.3 /data/zhouy24Files/embody/DSLab-embodied-intelligence/.git/MERGE_MSG Merge branch …...
【idea 报错:java: 非法字符: ‘\ufeff‘】
执行main方法报错:: ‘\ufeff’?package cn.com 截图如下:任何一个mian都不能执行,都报这个 写出来希望大家都能快速解决这种少见的问题,还不好弄。 我是参考这篇文章就好了:idea 报错:java: 非法字符: …...
BM25(Best Matching 25)介绍与使用
BM25(Best Matching 25)是一种基于概率检索框架的改进算法,主要用于信息检索中的相关性评分。它通过引入词频饱和函数、文档长度归一化等机制,克服了传统TF-IDF算法的局限性。 一、BM25的核心原理 1. 改进TF-IDF的三大维度 词频…...
.NET 函数:检测 SQL 注入风险
以下是一个用 C# 编写的 .NET 函数,用于检测用户输入是否存在潜在的 SQL 注入风险: using System; using System.Text.RegularExpressions;public class SqlInjectionChecker {// 常见 SQL 注入关键词和模式private static readonly string[] SqlKeywor…...
远程数据采集智能网关支持下的雨洪资源分布式监测网络搭建实践
一、项目背景 随着城市化进程的加快以及气候变化的影响,雨洪水管理成为了城市基础设施建设中的重要课题。传统的雨洪水监测手段主要依赖人工巡查和固定站点监测,存在数据获取不及时、不全面,以及在恶劣天气条件下人员安全隐患等诸多问题。为…...
LinuxYUM下载笔记
在基于RPM的Linux发行版(如CentOS、RHEL、Fedora等)中,YUM(Yellowdog Updater Modified)是默认的包管理工具,用于简化软件的安装、更新和依赖管理。以下是YUM的使用指南: 一、检查YUM是否安装 …...
研读论文《Attention Is All You Need》(7)
原文 14 3.2 Attention An attention function can be described as mapping a query and a set of key-value pairs to an output, where the query, keys, values, and output are all vectors. The output is computed as a weighted sum of the values, where the weight…...
使用excel 工具做数据清洗
数据分析中有个很重要的预处理步骤,叫做「数据清洗」。 简单来说就是把数据中「脏脏的 」部分 —— 缺失的、重复的、错误的等等,给它清除掉,剩下「干净的」数据。 1、缺失数据 如果某处缺了一两个数据,最简单的方法就是 —— …...
LeetCode 217.存在重复元素
目录 题目: 题目描述: 题目链接: 思路: 思路一详解(排序): 思路二详解(Set): 思路三详解(Map): 代码: …...