当前位置: 首页 > news >正文

防范Java应用中的恶意文件上传:确保服务器的安全性

防范Java应用中的恶意文件上传:确保服务器的安全性

在当今数字化时代,Java 应用无处不在,而文件上传功能作为许多应用的核心组件,却潜藏着巨大的安全隐患。恶意文件上传可能导致服务器被入侵、数据泄露甚至服务瘫痪,因此我们必须采取全面且有效的防范措施来保护 Java 应用的安全。

恶意文件上传的潜在风险

恶意文件上传攻击者可能通过上传包含恶意代码的文件(如脚本文件、可执行文件等),在服务器上执行未授权的操作,比如获取敏感数据、控制服务器资源、发起进一步的网络攻击等。这不仅会破坏应用的正常运行,还会对企业的声誉和用户信任造成严重影响。

常见的恶意文件上传手段

  • 文件类型伪装 :攻击者可能篡改文件扩展名,将木马程序伪装成图片、文档等看似无害的文件类型上传。
  • MIME 类型欺骗 :修改文件的 MIME 类型,使服务器误以为接收到的是安全的文件类型。
  • 路径遍历攻击 :利用特殊字符(如 “…/”)在文件路径中,试图访问或覆盖服务器上的敏感文件或目录。

防范恶意文件上传的关键策略

严格验证文件类型

  • 黑白名单验证 :仅允许上传已明确列出的白名单文件类型,如常见的图片格式(.jpg、.png)、文档格式(.doc、.pdf)等。避免使用黑名单验证,因为攻击者可能会找到新的文件类型进行攻击。
  • 代码示例:文件类型验证
import org.springframework.web.multipart.MultipartFile;public class FileUploadUtil {private static final Set<String> ALLOWED_IMAGE_EXTENSIONS = new HashSet<>(Arrays.asList("jpg", "jpeg", "png", "gif"));public static boolean isAllowedImageFile(MultipartFile file) {if (file == null || file.isEmpty()) {return false;}String fileExtension = getFileExtension(file.getOriginalFilename());return ALLOWED_IMAGE_EXTENSIONS.contains(fileExtension.toLowerCase());}private static String getFileExtension(String fileName) {if (fileName == null || fileName.isEmpty()) {return "";}int lastDotIndex = fileName.lastIndexOf('.');if (lastDotIndex == -1 || lastDotIndex == fileName.length() - 1) {return "";}return fileName.substring(lastDotIndex + 1);}
}

检查文件内容

  • 使用文件签名检查 :通过检查文件的二进制签名(也称为文件头),验证文件的实际内容是否与声明的文件类型一致。例如,JPEG 文件的签名通常以 FF D8 FF 开头。
  • 代码示例:基于 Apache Tika 的文件类型检测
import org.apache.tika.detect Detector;
import org.apache.tika.metadata Metadata;
import org.apache.tika.mime MimeTypeException;
import org.apache.tika.mime MimeTypes;
import org.springframework.web.multipart.MultipartFile;import java.io.IOException;
import java.io.InputStream;public class FileContentTypeValidator {private static final MimeTypes MIME_TYPES = MimeTypes.getDefaultMimeTypes();private static final Set<String> ALLOWED_MIME_TYPES = new HashSet<>(Arrays.asList("image/jpeg", "image/png", "application/pdf"));public static boolean isValidContentType(MultipartFile file) {try (InputStream inputStream = file.getInputStream()) {Detector detector = new MimeTypesDetector(MIME_TYPES);Metadata metadata = new Metadata();String mimeType = detector.detect(inputStream, metadata).toString();return ALLOWED_MIME_TYPES.contains(mimeType.toLowerCase());} catch (IOException | MimeTypeException e) {return false;}}
}

控制文件存储路径

  • 避免使用用户输入的文件名 :对上传的文件进行重命名,使用 UUID 或其他随机生成的文件名,以防止路径遍历攻击和文件名冲突。
  • 代码示例:安全的文件存储
import java.io.File;
import java.io.IOException;
import java.util.UUID;
import java.nio.file.Files;
import java.nio.file.Path;
import java.nio.file.Paths;
import java.nio.file.StandardCopyOption;
import org.springframework.web.multipart.MultipartFile;public class FileStorageService {private static final Path UPLOAD_DIR = Paths.get("uploads");public static Path storeFile(MultipartFile file) throws IOException {if (!Files.exists(UPLOAD_DIR)) {Files.createDirectories(UPLOAD_DIR);}String originalFilename = file.getOriginalFilename();if (originalFilename == null || originalFilename.isEmpty()) {return null;}String fileExtension = getFileExtension(originalFilename);String newFilename = UUID.randomUUID().toString() + "." + fileExtension;Path filePath = UPLOAD_DIR.resolve(newFilename);Files.copy(file.getInputStream(), filePath, StandardCopyOption.REPLACE_EXISTING);return filePath;}private static String getFileExtension(String fileName) {// 与之前示例中的 getFileExtension 方法类似}
}

限制文件大小

  • 设置合理的上传文件大小限制 :防止攻击者上传过大的文件,占用服务器存储空间或导致拒绝服务攻击(DoS)。
// 在 Spring Boot 应用中,可在 application.properties 文件中进行配置
spring.servlet.multipart.max-file-size=10MB
spring.servlet.multipart.max-request-size=10MB

服务器端安全策略

  • 禁用危险的 HTTP 方法 :如 PUT、DELETE 等,如果应用不需要这些方法,应将其禁用,以减少攻击面。
  • 设置安全的 MIME 类型 :确保服务器返回正确的 MIME 类型,避免浏览器对文件进行不安全的解析。
  • 代码示例:在 Spring Boot 中配置安全策略
import org.springframework.context.annotation.Configuration;
import org.springframework.web.servlet.config.annotation.WebMvcConfigurer;
import org.springframework.web.servlet.config.annotation.CorsRegistry;
import org.springframework.security.config.annotation.web.builders.HttpSecurity;
import org.springframework.security.web.SecurityFilterChain;@Configuration
public class SecurityConfig implements WebMvcConfigurer {@Overridepublic void addCorsMappings(CorsRegistry registry) {registry.addMapping("/**").allowedMethods("GET", "POST", "OPTIONS").allowedOrigins("*");}@Beanpublic SecurityFilterChain securityFilterChain(HttpSecurity http) throws Exception {http.csrf().disable().authorizeRequests().antMatchers("/api/file/upload").permitAll().anyRequest().authenticated().and().httpBasic();return http.build();}
}

总结与展望

防范 Java 应用中的恶意文件上传是一个需要持续关注和改进的过程。通过综合运用多种策略,包括严格验证文件类型、检查文件内容、控制文件存储路径、限制文件大小以及实施服务器端安全策略,我们可以大大降低恶意文件上传的风险,保护 Java 应用和服务器的安全。在未来,随着技术的不断发展和新攻击手段的出现,我们需要保持警惕,并及时更新和强化安全措施,以应对不断变化的安全挑战。

在这里插入图片描述

相关文章:

防范Java应用中的恶意文件上传:确保服务器的安全性

防范Java应用中的恶意文件上传&#xff1a;确保服务器的安全性 在当今数字化时代&#xff0c;Java 应用无处不在&#xff0c;而文件上传功能作为许多应用的核心组件&#xff0c;却潜藏着巨大的安全隐患。恶意文件上传可能导致服务器被入侵、数据泄露甚至服务瘫痪&#xff0c;因…...

CSS- 4.2 相对定位(position: relative)

本系列可作为前端学习系列的笔记&#xff0c;代码的运行环境是在HBuilder中&#xff0c;小编会将代码复制下来&#xff0c;大家复制下来就可以练习了&#xff0c;方便大家学习。 HTML系列文章 已经收录在前端专栏&#xff0c;有需要的宝宝们可以点击前端专栏查看&#xff01; 点…...

Face Over 84.0| 利用AI技术交换照片或视频中的面孔,制作有趣内容

Face Over是一款充满创造力和乐趣的应用程序&#xff0c;它利用AI技术帮助用户交换照片或视频中的面孔&#xff0c;预测未来宝宝的模样&#xff0c;并将照片制作成动画。无论您是想制作有趣的模因、口型同步视频还是探索未来家庭成员的模样&#xff0c;这款应用程序都能满足您的…...

怎么在excel单元格1-5行中在原来内容前面加上固定一个字?

环境&#xff1a; WPS 2024 问题描述&#xff1a; 怎么在excel单元格1-5行中在原来内容前面加上固定一个字&#xff1f; 解决方案&#xff1a; 1.在Excel中&#xff0c;如果您想在单元格的内容前面添加一个固定的字&#xff0c;可以通过以下几种方法实现&#xff1a; 方法…...

AI:人形机器人一定是人的形状吗?

本文将从技术角度分析人形机器人是否必须是人的形状&#xff0c;以及人形与非人形机器人在适用场合、优缺点上的差异。以下是详细解答&#xff1a; 人形机器人一定是人的形状吗&#xff1f; 不&#xff0c;人形机器人&#xff08;Humanoid Robot&#xff09;在技术上通常指外…...

26、思维链Chain-of-Thought(CoT)论文笔记

思维链Chain-of-Thought&#xff08;CoT&#xff09; **1、研究背景与核心目标****2、思维链提示的方法设计**2.1 COT方法2.2 传统方法 3、实验设计与关键数据集3.1 算术推理3.2 常识推理3.3 符号推理 4、关键实验结果1. 算术推理&#xff1a;思维链提示显著提升多步问题解决率…...

golang中的反射示例

文章目录 前言一、通过反射获取底层类型 reflect.typeOf()二、反射获取底层的值 reflect.ValueOf()三、通过反射设置底层值四 、进阶结构体反射示例 前言 反射就像是给程序装上了显微镜&#xff0c;运行时随时查看底层类型以及底层值&#xff0c;根据需要动态读写或调用方法。…...

NX二次开发——设置对象的密度(UF_MODL_set_body_density)

在前几篇博客中我们已经探讨了如何设置实体的密度。在装配环境中&#xff0c;同样可以为组件设置密度。虽然不能直接对组件进行密度设置&#xff0c;但可以通过一种间接方式实现&#xff1a;在装配环境下&#xff0c;利用 UF_ASSEM_set_work_part_quietly() 函数以静默方式将组…...

基于朴素贝叶斯与 LSTM 的假新闻检测模型对比分析

一、引言 在信息爆炸的时代&#xff0c;假新闻的传播对社会产生了诸多负面影响。如何快速、准确地识别假新闻成为了重要的研究课题。本文将对比传统机器学习算法&#xff08;朴素贝叶斯&#xff09;与深度学习模型&#xff08;LSTM&#xff09;在假新闻检测任务中的性能表现&am…...

共享内存【Linux操作系统】

文章目录 共享内存共享内存的原理共享内存相关函数和系统调用--systemV系统调用&#xff1a;shmget系统调用&#xff1a;shmctl系统调用&#xff1a;shmat系统调用&#xff1a;shmdt系统调用&#xff1a;ftok 共享内存相关函数和系统调用--POSIXshm_open-- 创建或打开共享内存对…...

Android核心系统服务:AMS、WMS、PMS 与 system_server 进程解析

1. 引言 在 Android 系统中&#xff0c;ActivityManagerService (AMS)、WindowManagerService (WMS) 和 PackageManagerService (PMS) 是三个最核心的系统服务&#xff0c;它们分别管理着应用的生命周期、窗口显示和应用包管理。 但你是否知道&#xff0c;这些服务并不是独立…...

arduino平台读取鼠标光电传感器

鼠标坏掉了&#xff0c;大抵是修不好了。&#xff08;全剧终—&#xff09; 但是爱动手的小明不会浪费这个鼠标&#xff0c;确认外观没有明显烧毁痕迹后&#xff0c;尝试从电路板上利用光电传感器进行位移的测量&#xff0c;光电传感器&#xff08;型号&#xff1a;FCT3065&am…...

EXO分布式部署deepseek r1

EXO 是一个支持分布式 AI 计算的框架&#xff0c;可以用于在多个设备&#xff08;包括 Mac Studio&#xff09;上运行大语言模型&#xff08;LLM&#xff09;。以下是联调 Mac Studio 512GB 的步骤&#xff1a; 安装 EXO • 从 EXO GitHub 仓库 下载源码或使用 git clone 获取…...

机器学习 KNN算法

KNN算法 1. sklearn机器学习概述2. KNN算法-分类1 样本距离判断2 KNN 算法原理3 KNN缺点4 API5 sklearn 实现KNN示例6 模型保存与加载葡萄酒(load_wine)数据集KNN算法(1)wine.feature_names:(2)wine.target_names(3)KNN算法实现 1. sklearn机器学习概述 获取数据、数据处理、特…...

强化学习赋能医疗大模型:构建闭环检索-反馈-优化系统提升推理能力

引言 人工智能技术在医疗领域的应用正经历前所未有的发展,特别是在大型语言模型(LLMs)技术的推动下,医疗大模型(Medical Large Models)展现出巨大的潜力。这些模型不仅能够理解复杂的医学术语和概念,还能通过自然语言与用户交互,为医疗专业人士和患者提供有价值的信息和建…...

深入解析Spring Boot与JUnit 5的集成测试实践

深入解析Spring Boot与JUnit 5的集成测试实践 引言 在现代软件开发中&#xff0c;测试是确保代码质量和功能正确性的关键环节。Spring Boot作为目前最流行的Java Web框架之一&#xff0c;提供了强大的支持来简化测试流程。而JUnit 5作为最新的JUnit版本&#xff0c;引入了许多…...

哈希的原理、实现

目录 引言 一、哈希概念 二、哈希函数 三、哈希冲突解决方法 四、unordered系列关联式容器&#xff08;以unordered_map为例&#xff09; 五、哈希的应用 完整代码 六、总结 引言 在计算机科学领域&#xff0c;哈希是一种非常重要的数据结构和算法思想&#xff0c;广…...

端口443在git bash向github推送时的步骤

端口443在git bash向github推送时的步骤 你的环境可能因防火墙限制无法使用默认的 SSH 端口&#xff08;22&#xff09;&#xff0c;因此需要改用 SSH over HTTPS&#xff08;端口 443&#xff09; 进行 Git 推送。 github与git bash绑定问题详见博主先前写过的参考博文&#…...

Ankr:Web3基础设施的革新者

在Web3技术蓬勃发展的今天&#xff0c;去中心化基础设施的重要性日益凸显。Ankr作为这一领域的佼佼者&#xff0c;凭借其强大的分布式云计算能力和创新的技术解决方案&#xff0c;正在成为推动Web3发展的关键力量。本文将深入探讨Ankr的技术亮点、应用场景以及其在区块链生态中…...

配置git从公网能访问-基于frp

git从公网能访问 一个小小的疏忽带来了一下午上午的工作量起因与上下文与结论主要收获1。公网主机的防火墙需要至少三条3。gitlab的http端口和ssh端口&#xff0c;需要分为两个3。不要用nginx来解析二级域名 测试指令最终的成功的指令是&#xff1a; 用到的指令ssh1. 生成 SSH …...

HarmonyOS:重构万物互联时代的操作系统范式

HarmonyOS&#xff1a;重构万物互联时代的操作系统范式 引言&#xff1a;操作系统的新纪元 在数字化转型的深水区&#xff0c;操作系统作为数字世界的基石正在经历前所未有的变革。当全球科技巨头还在移动终端操作系统领域激烈角逐时&#xff0c;华为推出的HarmonyOS以分布式…...

告别“知识孤岛”:RAG赋能网络安全运营

一、背景 在网络安全运营工作中&#xff0c;我们积累了大量的内部知识内容&#xff0c;涵盖了威胁情报、事件响应流程、安全策略、合规性要求等多个方面。然而&#xff0c;这些知识虽然数量庞大、内容丰富&#xff0c;却因形式多样、结构分散&#xff0c;难以让每一位成员真正…...

A级、B级弱电机房数据中心建设运营汇报方案

该方案围绕A 级、B 级弱电机房数据中心建设与运营展开,依据《数据中心设计规范》等标准,施工范围涵盖 10 类机房及配套设施,采用专业化施工团队与物资调配体系,强调标签规范、线缆隐藏等细节管理。运营阶段建立三方协同运维模式,针对三级故障制定30 分钟至 1 小时响应机制…...

C 语言学习笔记(数组)

C 语言基础&#xff1a;第 08天笔记 内容提要 数组 排序算法&#xff1a;冒泡排序二维数组字符数组 数组 冒泡排序 排序思想&#xff08;向前冒泡&#xff09;&#xff1a; 一次排好一个数&#xff0c;针对n个数&#xff0c;最差情况需要n - 1次就可以排好每次排序假定第一…...

jvm安全点(二)openjdk17 c++源码垃圾回收安全点信号函数处理线程阻塞

1. 信号处理与桩代码&#xff08;Stub&#xff09;​​ 当线程访问安全点轮询页&#xff08;Polling Page&#xff09;时&#xff1a; ​​触发 SIGSEGV 信号​​&#xff1a;访问只读的轮询页会引发 SIGSEGV 异常。​​信号处理函数​​&#xff1a;pd_hotspot_signal_handl…...

uni-app 开发HarmonyOS的鸿蒙影视项目分享:从实战案例到开源后台

最近&#xff0c;HBuilderX 新版本发布&#xff0c;带来了令人兴奋的消息——uni-app 现在支持 Harmony Next 平台的 App 开发。这对于开发者来说无疑是一个巨大的福音&#xff0c;意味着使用熟悉的 Vue 3 语法和开发框架&#xff0c;就可以为鸿蒙生态贡献自己的力量。 前言 作…...

【赵渝强老师】在PostgreSQL中访问Oracle

在PostgreSQL数据库中&#xff0c;oracle_fdw是PostgreSQL数据库支持的外部扩展。通过使用oracle_fdw扩展可以读取到Oracle数据库中的数据。它是一种非常方便且常见的PostgreSQL与Oracle的同步数据的方法。使用oracle_fdw扩展需要依赖Oracle的Instance Client环境。 视频讲解如…...

板凳-------Mysql cookbook学习 (二)

生成一个包含cookbook数据库中的表备份的名为backup.sql的dump文件。 sql C:\Users\lenovo>mysqldump -u root -p --default-character-setutf8mb4 cookbook > D:\sql\Mysql_learning\backup.sql mysqldump 不是内部或外部命令&#xff0c;也不是可运行的程序 或批处理文…...

sudo apt update是什么意思呢?

非常好的问题&#xff01; ✅ sudo apt update 是什么意思&#xff1f; 它的作用是&#xff1a; 更新你的 Ubuntu 系统中软件列表的信息&#xff08;但不安装软件&#xff09; 就像你每天先去超市了解今天上架了哪些新商品&#xff08;只是“查看”而不是“买”&#xff09;&a…...

.NET Core 中 Swagger 配置详解:常用配置与实战技巧

随着微服务架构和 RESTful API 的广泛应用&#xff0c;API 文档的管理和自动化生成成为了开发中的重要部分。Swagger&#xff08;现为 OpenAPI&#xff09;是一款功能强大的工具&#xff0c;它可以自动生成 API 文档&#xff0c;并提供交互式 UI&#xff0c;帮助开发者、测试人…...

spring cache使用指南

Spring cache Spring Cache 是一个框架&#xff0c;实现了基于注解的缓存功能&#xff0c;只需要简单地加一个注解&#xff0c;就能实现缓存功能。 Spring Cache 提供了一层抽象&#xff0c;底层可以切换不同的缓存实现。 例如:EHCache&#xff0c;Caffeine&#xff0c;Redi…...

9.DMA

目录 DMA —为 CPU 减负 DMA 的简介和使用场景 DMA 的例子讲解 STM32 的 DMA 框图和主要特性 ​编辑 DMA 的通道的对应通道外设 – DMA 和哪些外设使用 ​编辑​编辑ADC_DR 寄存器地址的计算 常见的数据滤波方法 ADCDMA 的编程 DMA —为 CPU 减负 DMA 的简介和使用场…...

Python自学笔记3 常见运算符

常用运算符 加减法 python的自动数据类型转换 整形转为浮点型 实数转为复数 数字类型不能和浮点数类型相加减 乘除法 数据转换基本同加减法&#xff0c; 但字符串可以和整数相加减&#xff0c;作用是字符串的自我复制 反斜杠 成员运算符 判断一个元素是不是一个序列的成员…...

【C/C++】C++中constexpr与const的深度对比

文章目录 C中constexpr与const的深度对比1. 编译期确定性2. 更严格的优化保证3. 适用范围更广4. 类型安全与错误检查5. 现代 C 的演进方向何时使用 const&#xff1f;constexpr应用场景1. 配置常量与全局参数2. 数据验证与业务规则检查3. 数学计算与业务逻辑优化4. 模板元编程与…...

劳特巴赫trace32负载率测试

按照下图步骤点击即可...

牛客OJ在线编程常见输入输出练习--Java版

目录 一、链接 二、题目 一、链接 牛客输入输出链接&#xff1a;牛客网 - 找工作神器|笔试题库|面试经验|实习招聘内推&#xff0c;求职就业一站解决_牛客网 二、题目 1.只有输出 public class Main {public static void main(String[] args) {System.out.println("H…...

STM32 | FreeRTOS 递归信号量

递归信号量 一、概述 互斥量的使用比较单一&#xff0c;因为它是信号量的一种&#xff0c;并且它是以锁的形式存在。在初始化的时候&#xff0c;互斥量处于开锁的状态&#xff0c;而被任务持有的时候则立刻转为闭锁的状态。 递归类型的互斥量可以被拥有者重复获取。拥有互斥量…...

STM32 | 软件定时器

01 一、概述 软件定时器是用程序模拟出来的定时器&#xff0c;可以由一个硬件定时器模拟出成千上万个软件定时器&#xff0c;这样程序在需要使用较多定时器的时候就不会受限于硬件资源的不足&#xff0c;这是软件定时器的一个优点&#xff0c;即数量不受限制。但由于软件定…...

2025年EB SCI2区TOP,多策略改进黑翅鸢算法MBKA+空调系统RC参数辨识与负载聚合分析,深度解析+性能实测

目录 1.摘要2.黑翅鸢优化算法BKA原理3.改进策略4.结果展示5.参考文献6.代码获取7.读者交流 1.摘要 随着空调负载在电力系统中所占比例的不断上升&#xff0c;其作为需求响应资源的潜力日益凸显。然而&#xff0c;由于建筑环境和用户行为的变化&#xff0c;空调负载具有异质性和…...

互联网大厂Java面试:从Spring到微服务的全面探讨

文章简述 本文模拟了一个互联网大厂Java求职者的面试场景&#xff0c;涵盖了Java核心语言与平台、构建工具、Web框架、微服务与云原生等多个技术栈。通过面试问答的形式&#xff0c;展示了在真实业务场景下如何应用这些技术点&#xff0c;帮助初学者理解和学习。 场景介绍 在…...

Python爬虫之路(14)--playwright浏览器自动化

playwright 前言 ​ 你有没有在用 Selenium 抓网页的时候&#xff0c;体验过那种「明明点了按钮&#xff0c;它却装死不动」的痛苦&#xff1f;或者那种「刚加载完页面&#xff0c;它又刷新了」的抓狂&#xff1f;别担心&#xff0c;你不是一个人——那是 Selenium 在和现代前…...

Elasticsearch Fetch阶段面试题

Elasticsearch Fetch阶段面试题 🚀 目录 基础原理性能优化错误排查场景设计底层机制总结基础原理 🔍 面试题1:基础原理 题目: 请描述Elasticsearch分布式搜索中Query阶段和Fetch阶段的工作流程,为什么需要将搜索过程拆分为这两个阶段? 👉 点击查看答案 查询流程…...

RAGFlow Arbitrary Account Takeover Vulnerability

文章目录 RAGFlowVulnerability Description[1]Vulnerability Steps[2]Vulnerability Steps[3]Vulnerability Steps RAGFlow RAGFlow is an open-source RAG (Retrieval-Augmented Generation) engine developed by Infiniflow, focused on deep document understanding and d…...

框架之下再看HTTP请求对接后端method

在当今的软件开发领域&#xff0c;各类框架涌现&#xff0c;极大地提升了开发效率。以 Java 开发为例&#xff0c;Spring 框架不断演进&#xff0c;Spring Boot 更是简化到只需引入 Maven 包&#xff0c;添加诸如SpringBootApplication、RestController等注解&#xff0c;就能轻…...

机器学习中的过拟合及示例

文章目录 机器学习中的过拟合及示例1. 过拟合的定义2. 过拟合的常见例子例1&#xff1a;图像分类中的过拟合例2&#xff1a;回归任务中的过拟合例3&#xff1a;自然语言处理&#xff08;NLP&#xff09;中的过拟合 3. Python代码示例&#xff1a;过拟合的直观演示示例1&#xf…...

机器学习-人与机器生数据的区分模型测试 -数据筛选

内容继续机器学习-人与机器生数据的区分模型测试 使用随机森林的弱学习树来筛选相对稳定的特征数据 # 随机森林筛选特征 X data.drop([city, target], axis1) # 去除修改前的城市名称列和目标变量列 y data[target] X_train, X_test, y_train, y_test train_test_split(X…...

第9讲、深入理解Scaled Dot-Product Attention

Scaled Dot-Product Attention是Transformer架构的核心组件&#xff0c;也是现代深度学习中最重要的注意力机制之一。本文将从原理、实现和应用三个方面深入剖析这一机制。 1. 基本原理 Scaled Dot-Product Attention的本质是一种加权求和机制&#xff0c;通过计算查询(Query…...

无监督学习在医疗AI领域的前沿:多模态整合、疾病亚型发现与异常检测

引言 人工智能技术在医疗领域的应用正经历着从辅助决策向深度赋能的转变。无监督学习作为人工智能的核心范式之一,因其无需大量标注数据、能够自动发现数据内在规律的特性,在医疗AI领域展现出独特优势。尤其在2025年,无监督学习技术在医疗AI应用中呈现出多模态整合、疾病亚…...

PostgreSQL内幕剖析——结构与架构

大家好&#xff0c;这里是失踪人口bang__bang_&#xff0c;从今天开始持续更新PostgreSQL内幕相关内容&#xff0c;让我们一起了解学习吧✊&#xff01; 目录 1️⃣ DB集群、数据库、表 &#x1f359; 数据库集群的逻辑结构 &#x1f359; 数据库集群的物理结构 &am…...

架构师论文《论模型驱动架构软件开发方法及其应用》

摘要 在当前的软件开发领域&#xff0c;模型驱动架构&#xff08;MDA&#xff09;作为一种重要的开发方法&#xff0c;强调通过抽象化模型指导系统设计与实现&#xff0c;能够有效提升开发效率并降低复杂性。本文结合笔者参与的某医疗信息管理系统的开发实践&#xff0c;探讨MD…...