DeepSeek开源周Day5压轴登场:3FS与Smallpond,能否终结AI数据瓶颈之争?
2025年2月28日,DeepSeek开源周迎来了第五天,也是本次活动的收官之日。自2月24日启动以来,DeepSeek团队以每天一个开源项目的节奏,陆续向全球开发者展示了他们在人工智能基础设施领域的最新成果。今天,他们发布了Fire-Flyer File System(简称3FS)和配套的数据处理框架Smallpond。这两项工具专注于解决AI训练与推理中的数据访问和处理难题,以卓越的性能和简洁的设计,为开发者提供了一套经过生产环境验证的解决方案。
开源周回顾:五天五项成果
DeepSeek开源周从2月24日開始,每日推出一项新工具,逐步构建起一个覆盖AI开发核心环节的技术链条。以下是前四天的简要回顾:
-
Day 1:FlashMLA - FlashMLA是一个专为Hopper GPU优化的高效MLA解码内核,针对变长序列处理进行了深度优化。它支持BF16数据格式,配备分页KV缓存(块大小64),在H800上的性能表现尤为突出:内存绑定场景下达到3000 GB/s,计算绑定场景下达到580 TFLOPS。这一工具为需要快速解码的AI模型提供了强有力的支持。
-
Day 2:DeepEP - DeepEP是首个开源的EP通信库,专为MoE(Mixture of Experts)模型的训练和推理设计。它支持高效的全对全通信,覆盖节点内(通过NVLink)和节点间(通过RDMA)场景,提供了高吞吐量内核用于训练和推理预填充、低延迟内核用于推理解码,以及原生FP8分派支持。此外,DeepEP还具备灵活的GPU资源控制功能,可优化计算与通信的重叠,提升大规模分布式训练的效率。
-
Day 3:DeepGEMM - DeepGEMM是一个FP8 GEMM(通用矩阵乘法)库,支持密集和MoE两种GEMM计算,广泛应用于V3/R1模型的训练和推理。它的性能在Hopper GPU上可达1350+ FP8 TFLOPS,核心逻辑仅约300行代码,采用即时编译(JIT)技术,无需复杂依赖。这种简洁而高效的设计使其在多种矩阵规模下超越了专家调优的内核。
-
Day 4:优化并行策略 - 第四天发布了三项工具:DualPipe、EPLB和性能分析数据集。DualPipe是一种双向管道并行算法,优化了V3/R1训练中的计算-通信重叠;EPLB是一个专家并行负载均衡器,针对MoE模型提升资源利用率;配套的分析工具则提供了V3/R1训练中的计算-通信重叠数据。这些工具共同助力大规模模型训练的效率提升。
这四天的成果从GPU计算优化到通信效率,再到并行策略,展现了DeepSeek在AI基础设施领域的全面布局。而今天发布的3FS和Smallpond则将焦点转向数据存储与处理,完成了这一技术拼图的最后一块。
3FS:分布式文件系统的性能标杆
Fire-Flyer File System(3FS)是一个专为AI工作负载设计的高性能分布式文件系统。它充分利用现代SSD的高速存储能力和RDMA网络的低延迟特性,构建了一个兼具高吞吐量与强一致性的共享存储层。这一系统的核心目标是为分布式应用的开发提供简洁、高效的数据访问支持,解决AI开发中数据密集型任务的瓶颈。
设计与特性
3FS的设计围绕三大特点展开:
-
解耦架构:通过将存储与计算分离,3FS允许存储节点和计算节点独立扩展。这种设计结合了数千个SSD的吞吐量和数百个存储节点的网络带宽,使得应用程序可以以无视数据位置的方式访问存储资源。
-
强一致性:3FS采用CRAQ(Chain Replication with Apportioned Queries)机制,通过链式复制和分担查询确保数据在所有节点间保持一致。这种强一致性让开发者无需担心数据同步问题,简化了应用逻辑的编写。
-
标准文件接口:基于事务型键值存储(例如FoundationDB),3FS提供了无状态的元数据服务,支持标准的文件系统接口。开发者无需学习复杂的专用API,就能像操作本地文件系统一样使用3FS。
支持的工作负载
3FS能够无缝支持AI开发中的多种场景:
- 数据准备:高效组织和管理数据分析管道的输出,支持大规模中间数据的存储与访问。
- 数据加载:通过随机访问功能,允许多个计算节点并行加载训练样本,无需额外的预取或洗牌操作。
- 检查点管理:提供高吞吐量的并行检查点保存和加载功能,满足大规模训练的需求。
- KVCache推理:作为DRAM的成本效益替代方案,3FS为推理中的键值缓存(KVCache)提供高吞吐量和大容量支持,显著降低硬件成本。
性能表现
3FS的性能数据令人印象深刻:
-
在一个由180个存储节点组成的集群中,每个节点配备2个200Gbps InfiniBand网卡和16个14TiB NVMe SSD,3FS实现了6.6 TiB/s的聚合读取吞吐量。这一测试是在500多个客户端节点(每个配备1个200Gbps网卡)的压力下完成的,同时还承载了训练任务的背景流量。
-
在25节点集群的GraySort基准测试中,3FS支持110.5 TiB数据的排序任务,耗时30分14秒,平均吞吐量达到3.66 TiB/min。这一测试展示了其在大规模数据处理中的稳定性。
-
对于推理中的KVCache查找,单个客户端节点的峰值吞吐量可达40 GiB/s,配合高效的垃圾回收机制,确保了持续的高性能。
获取与使用
开发者可以通过3FS GitHub仓库获取源代码,仓库中包含详细的设计文档、部署指南和API参考。安装依赖包括libfuse、FoundationDB和Rust工具链,构建过程支持Ubuntu 20.04和22.04,具体步骤可在文档中找到。
Smallpond:轻量级数据处理框架
与3FS配套发布的是Smallpond,一个基于DuckDB和3FS构建的轻量级数据处理框架。它的目标是为PB级数据集提供高效、简便的处理工具,同时保持无长运行服务的设计理念,降低使用和维护的复杂性。
功能与优势
Smallpond结合了DuckDB的强大SQL查询能力和3FS的高性能存储,具备以下特点:
- 高性能处理:利用DuckDB的列式存储和向量化查询引擎,确保数据处理的高效性。
- 可扩展性:支持跨节点处理超大规模数据集,轻松应对AI训练所需的PB级数据。
- 易用性:提供类似pandas的Python API,开发者只需几行代码即可完成复杂的数据操作。
使用示例
Smallpond的简单性体现在其使用方式上。以下是一个典型的工作流程:
# 下载示例数据
wget https://duckdb.org/data/prices.parquet
import smallpond# 初始化会话
sp = smallpond.init()# 加载数据
df = sp.read_parquet("prices.parquet")# 数据分区与处理
df = df.repartition(3, hash_by="ticker")
df = sp.partial_sql("SELECT ticker, min(price), max(price) FROM {0} GROUP BY ticker", df)# 保存与查看结果
df.write_parquet("output/")
print(df.to_pandas())
这段代码展示了从数据加载、分区、SQL查询到结果输出的完整过程,整个操作无需手动管理分布式环境,极大降低了开发门槛。
性能表现
Smallpond的性能同样经过严格测试。在GraySort基准测试中,它与3FS协作,在50个计算节点和25个存储节点的集群上,成功在30分14秒内完成了110.5 TiB数据的排序,平均吞吐量达到3.66 TiB/min。这一结果不仅验证了Smallpond的高效性,也展示了其与3FS无缝集成的能力。
获取与使用
Smallpond支持Python 3.8至3.12版本,安装只需运行pip install smallpond
。开发者可通过Smallpond GitHub仓库获取源代码,并在文档中找到详细的入门指南和API参考。此外,Smallpond还提供了开发支持,例如单元测试和文档构建指南,方便社区参与改进。
2024 AI基础设施论文补充
除了本次开源周的成果,DeepSeek团队在2024年的SC24会议上发表了论文《Fire-Flyer AI-HPC: A Cost-Effective Software-Hardware Co-Design for Deep Learning》,详细阐述了他们的软硬件协同设计理念。论文可在ACM链接或Arxiv链接查看,其中包含了对3FS等技术的理论分析和实现细节,为理解今日发布内容提供了更深的背景。
五天成果总结
DeepSeek开源周的五项发布共同构成了一个完整的AI基础设施生态:
- FlashMLA:高效的GPU解码内核,为变长序列处理提供极致性能。
- DeepEP:MoE模型通信库,优化分布式训练和推理的通信效率。
- DeepGEMM:高性能FP8 GEMM库,加速核心矩阵计算。
- 优化并行策略(DualPipe/EPLB):提升大规模模型训练的并行效率与负载均衡。
- 3FS与Smallpond:解决数据存储与处理的瓶颈,提供高吞吐量与易用性。
从计算优化到数据管理,这五项工具覆盖了AI开发的关键环节,每一项都经过生产环境验证,确保了实用性与可靠性。开发者可以通过各项目的GitHub仓库下载代码,亲自体验这些工具的强大功能。
结语
随着Day 5的发布,DeepSeek开源周画上了圆满的句号。3FS和Smallpond的亮相,不仅展示了DeepSeek在数据访问领域的深入探索,也为AI社区提供了一套高效实用的解决方案。如果你对这些项目感兴趣,不妨访问它们的GitHub仓库,下载代码,动手尝试。让我们共同见证AI技术的未来发展。
- https://mp.weixin.qq.com/s/ZHY8zEjaDQa9f5fEzFYDLw
相关文章:
DeepSeek开源周Day5压轴登场:3FS与Smallpond,能否终结AI数据瓶颈之争?
2025年2月28日,DeepSeek开源周迎来了第五天,也是本次活动的收官之日。自2月24日启动以来,DeepSeek团队以每天一个开源项目的节奏,陆续向全球开发者展示了他们在人工智能基础设施领域的最新成果。今天,他们发布了Fire-F…...
Linux:进程替换
目录 进程程序替换 替换原理 进程替换相关函数 环境变量与进程替换函数 命令行解释器(my_xshell) 进程程序替换 上一篇进程控制讲到,父进程创建子进程就是为了让子进程去做一些另外的事情,但是不管怎么说,子进程的部分代码也还是父进程…...
CSS 日常开发常用属性总结
文章目录 CSS 日常开发常用属性总结一、 常用 CSS 属性1、布局相关(1)display:(2)position:(3)float:(4)clear: 2、尺寸与溢出&#x…...
Python 绘制迷宫游戏,自带最优解路线
1、需要安装pygame 2、上下左右移动,空格实现物体所在位置到终点的路线,会有虚线绘制。 import pygame import random import math# 迷宫单元格类 class Cell:def __init__(self, x, y):self.x xself.y yself.walls {top: True, right: True, botto…...
了解Java集合的概念和体系:Collection<T>、Collections与Stream的使用
学习目标 本文知识是对集合层级的介绍,应用开发中实际使用的是他们的子级,感兴趣的小伙伴或者想深入了解有关Java集合知识的朋友可以选择阅读! Stream的方法使用使用部分代码块内大多有两种实现方式,是为了更好的理解方法底层的代…...
扫描局域网可用端口
site: https://mengplus.top #SiliconFlow : 在Linux系统,你可以使用一个简单的Bash脚本来扫描局域网中可用的端口。这个脚本可以使用nmap工具来实现。nmap是一个强大的网络扫描工具,可以用来探测网络中的主机和端口。 以下是一个简单的Bash脚本&#…...
算法分析 —— 《栈》
文章目录 删除字符串中的所有相邻重复项题目描述:代码实现:代码解析: 比较含退格的字符串题目描述:代码实现:代码解析: [基本计算器 II](https://leetcode.cn/problems/remove-all-adjacent-duplicates-in-…...
693. 交替位二进制数
交替位二进制数 题目描述尝试做法推荐做法 题目描述 给定一个正整数,检查它的二进制表示是否总是 0、1 交替出现:换句话说,就是二进制表示中相邻两位的数字永不相同。 示例 1: 输入:n 5 输出:true 解释…...
uniapp中使用leaferui使用Canvas绘制复杂异形表格的实现方法
需求: 如下图,要实现左图的样式,先实现框架,文字到时候 往里填就行了,原来的解决方案是想用css,html来实现,发现实现起来蛮麻烦的。我也没找到合适的实现方法,最后换使用canvas来实现ÿ…...
Java 反射(Reflection)的原理和应用
反射(Reflection)是 Java 语言的一项强大功能,它允许程序在运行时动态地获取类的信息,并且可以操作这些信息,如创建对象、调用方法、访问字段等。反射机制的核心在于 Java 的 类加载机制 和 动态类型检查,使…...
Linux top 常用参数记录
top命令经常用来监控linux的系统状况,能实时显示系统中各个进程、线程的资源占用情况,是常用的性能分析工具。 一些常用参数记录 top的使用方式 top [-d number] | top [-bnp] # 5s 更新一次 top -d 5# 进行2次top命令的输出结果 top -n 2# 查看进程的…...
hive之LEAD 函数详解
1. 函数概述 LEAD 是 Hive 中的窗口函数,用于获取当前行之后指定偏移量处的行的值。常用于分析时间序列数据、计算相邻记录的差异或预测趋势。 2. 语法 LEAD(column, offset, default) OVER ([PARTITION BY partition_column] [ORDER BY order_column [ASC|DESC]…...
Element Plus中el-tree点击的节点字体变色加粗
el-tree标签设置 <el-tree class"tree":data"treeData":default-expand-all"true":highlight-current"true"node-click"onTreeNodeClick"><!-- 自定义节点内容,点击的节点字体变色加粗 --><!-- 动…...
.gitignore 设置后不见效的解决方法中,方案一就可以了
遇到的问题:你的 .gitignore 文件中包含了 unpackage/ 目录,但它不起作用的原因可能有以下几个: 1. 文件或目录已经被 Git 跟踪 .gitignore 只能忽略 未被 Git 追踪 的文件或目录。如果 unpackage/ 目录已经被提交到 Git 版本库中ÿ…...
git提交管理
git提交管理 scoop install nodejs # windows npm install --save-dev commitlint/config-conventional commitlint/cli # non-windows npm install --save-dev commitlint/{cli,config-conventional} # windows将commitlint.config.js修改为utf8编码, 默认utf16编码 echo &qu…...
DeepSeek八大组合软件,效率加倍
DeepSeek王炸组合:开启2025年高效工作与创意新时代 在科技飞速发展的2025年,人工智能和各类工具的融合正不断重塑我们的工作与生活方式。DeepSeek作为一款强大的工具,与众多应用组成的王炸组合,展现出了令人瞩目的能力。今天&…...
TCP和UDP比较
以下是 TCP(传输控制协议) 和 UDP(用户数据报协议) 的详细对比,涵盖核心特性、应用场景及技术差异: 1. 核心特性对比 特性TCPUDP连接方式面向连接(需三次握手建立连接)无连接&#…...
【实战篇】【深度解析DeepSeek:从机器学习到深度学习的全场景落地指南】
一、机器学习模型:DeepSeek的降维打击 1.1 监督学习与无监督学习的"左右互搏" 监督学习就像学霸刷题——给标注数据(参考答案)训练模型。DeepSeek在信贷风控场景中,用逻辑回归模型分析百万级用户数据,通过特征工程挖掘出"凌晨3点频繁申请贷款"这类魔…...
Postgresql高可用之Pacemaker+Corosync
简介 Pacemaker 是 ClusterLabs 开源高可用性集群堆栈的资源管理器。它协调配置、启动、监控和跨所有集群节点恢复相互关联的服务。在这套高可用架构用会用到Pacemaker、Corosync以下是对其功能作用的说明。 Corosync :主要负责 集群通信和成员管理,它用…...
智能成绩表
智能成绩表 真题目录: 点击去查看 E 卷 100分题型 题目描述 小明来到学校当老师,需要将学生按考试总分或单科分数进行排名,你能帮帮他吗? 输入描述 第 1 行输入两个整数,学生人数 n 和科目数量 m。 0 < n < 1000 < m < 10第 2 行输入 m 个科目名称,彼此之…...
制作安装win10系统U盘详细步骤
https://www.microsoft.com/zh-cn/software-download/windows10 ①微软官方链接,下载工具 ②下载之后,点击鼠标右键用管理员身份运行 ③等待几分钟 ④出现许可条款点击接受 ⑤点击为另一台电脑安装介质,然后下一步 ⑥根据需要选择版本。 体系…...
【RAG】Embeding 和 Rerank学习笔记
Q: 现在主流Embeding模型架构 在RAG(Retrieval-Augmented Generation)系统中,嵌入模型(Embedding Model) 是检索阶段的核心组件,负责将查询(Query)和文档(Document&#…...
华为 Open Gauss 数据库在 Spring Boot 中使用 Flyway
db-migration:Flyway、Liquibase 扩展支持达梦(DM)、南大通用(GBase 8s)、OpenGauss 等国产数据库。部分数据库直接支持 Flowable 工作流。 开源代码仓库 Github:https://github.com/mengweijin/db-migrat…...
B/B+树与mysql索引
数据结构操作网站:https://www.cs.usfca.edu/~galles/visualization/Algorithms.html B树 算法平均最差空间O(n)O(n)搜索O(log n)O(log n)插入O(log n)O(log n)删除O(log n)O(log n) B树 算法平均最差空间O(n)O(n)搜索O(log n)O(log n)插入O(log n)O(log n)删除O(…...
心智模式与企业瓶颈突破
“是环境限制了你,还是你的心智模式?” 当企业发展遇到瓶颈,我们习惯于找外部原因:经济不好、竞争加剧、资源不够、市场环境变化快 可现实是,在同样的市场环境下,总有企业逆势增长,而有些企业只…...
介绍微信小程序中页面的生命周期函数和组件的生命周期函数
1.1 页面生命周期函数 这些函数主要用于管理页面的显示和隐藏。 onLoad(options): 页面加载时触发,options 是页面路由参数,可以在这里初始化数据。每当用户进入该页面时都会调用这个函数。 onShow(): 页面显示时触发。每当页面从后台切换到前台时都会…...
网络运维学习笔记(DeepSeek优化版)009网工初级(HCIA-Datacom与CCNA-EI)路由理论基础与静态路由
文章目录 路由理论基础核心概念路由表六要素路由选路原则加表规则选路优先级 协议与参数常见协议号路由协议优先级对比 网络架构基础AS(autonomous system,自治系统)路由分类 静态路由(static routing)实验拓扑思科配置示例华为配置示例 典型…...
基于微信小程序的疫情互助平台(源码+lw+部署文档+讲解),源码可白嫖!
摘要 时代在飞速进步,每个行业都在努力发展现在先进技术,通过这些先进的技术来提高自己的水平和优势,从2019年底新型冠状肺炎疫情的爆发以来,使很多工作的管理工作难度再上一层楼。为了在疫情期间能更好的维护信息管理࿰…...
【SRC实战】小游戏漏洞强制挑战
小游戏业务分析: 1、挑战成功加分,失败减分,存在段位机制,段位影响榜单排名 2、随机推荐挑战对象,随着等级升高不再推荐低等级玩家 3、玩家等级需要培养,培养需要道具,道具需要看广告/完成任务/付费 4、…...
阿里云轻量级服务器通过宝塔安装PgVector要点
设置环境变量: export PG_HOME/www/server/pgsql export LD_LIBRARY_PATH$LD_LIBRARY_PATH:/www/server/pgsql/lib export PG_CONFIG/www/server/pgsql/bin/pg_config export PGDATA/www/server/pgsql/data PATH$PATH:$HOME/.local/bin:$HOME/bin:$PG_HOME/bin ali…...
安装 Windows Docker Desktop - WSL问题
一、关联文章: 1、Docker Desktop 安装使用教程 2、家庭版 Windows 安装 Docker 没有 Hyper-V 问题 3、打开 Windows Docker Desktop 出现 Docker Engine Stopped 问题 二、问题解析 打开 Docker Desktop 出现问题,如下: Docker Desktop - WSL update failed An error o…...
基于SpringBoot和PostGIS的省域“地理难抵点(最纵深处)”检索及可视化实践
目录 前言 1、研究背景 2、研究意义 一、研究目标 1、“地理难抵点”的概念 二、“难抵点”空间检索实现 1、数据获取与处理 2、计算流程 3、难抵点计算 4、WebGIS可视化 三、成果展示 1、华东地区 2、华南地区 3、华中地区 4、华北地区 5、西北地区 6、西南地…...
神经网络之RNN和LSTM(基于pytorch-api)
1.RNN 1.1简介 RNN用于处理序列数据。在传统的神经网络模型中,是从输入层到隐含层再到输出层,层与层之间是全连接的,每层之间的节点是无连接的。但是这种普通的神经网络对于很多问题却无能无力。例如,你要预测句子的下一个单词是…...
16.3 LangChain Runnable 协议精要:构建高效大模型应用的核心基石
LangChain Runnable 协议精要:构建高效大模型应用的核心基石 关键词:LCEL Runnable 协议、LangChain 链式开发、自定义组件集成、流式处理优化、生产级应用设计 1. Runnable 协议设计哲学与核心接口 1.1 协议定义与类结构 #mermaid-svg-PlmvpSDrEUrUGv2p {font-family:&quo…...
[操作系统] 文件的软链接和硬链接
文章目录 引言硬链接(Hard Link)什么是硬链接?硬链接的特性硬链接的用途 软链接(Symbolic Link)什么是软链接?软链接的特性软链接的用途 软硬链接对比文件的时间戳实际应用示例使用硬链接节省备份空间用软链…...
【Python · PyTorch】循环神经网络 RNN(基础应用)
【Python PyTorch】循环神经网络 RNN(简单应用) 1. 简介2. 模拟客流预测(数据集转化Tensor)3.1 数据集介绍3.2 训练过程 3. 模拟股票预测(DataLoader加载数据集)3.1 IBM 数据集3.1.2 数据集介绍3.1.3 训练…...
Spring Boot 项目开发流程全解析
目录 引言 一、开发环境准备 二、创建项目 三、项目结构 四、开发业务逻辑 1.创建实体类: 2.创建数据访问层(DAO): 3.创建服务层(Service): 4.创建控制器层(Controller&…...
基于互联网协议的诊断通信(DoIP)
1、ISO 13400标准和其他汽车网络协议标准有何不同? ISO 13400 标准即 DoIP 协议标准,与其他常见汽车网络协议标准(如 CAN、LIN、FlexRay 等)有以下不同: 通信基础与适用场景 ISO 13400:基于互联网协议&a…...
MacDroid for Mac v2.3 安卓手机文件传输助手 支持M、Intel芯片 4.7K
MacDroid 是Mac毒搜集到的一款安卓手机文件传输助手,在Mac和Android设备之间传输文件。您只需要将安卓手机使用 USB 连接到 Mac 电脑上即可将安卓设备挂载为本地磁盘,就像编辑mac磁盘上的文件一样编辑安卓设备上的文件,MacDroid支持所有 Andr…...
Skywalking介绍,Skywalking 9.4 安装,SpringBoot集成Skywalking
一.Skywalking介绍 Apache SkyWalking是一个开源的分布式追踪与性能监视平台,特别适用于微服务架构、云原生环境以及基于容器(如Docker、Kubernetes)的应用部署。该项目由吴晟发起,并已加入Apache软件基金会的孵化器,…...
基于POI的Excel下拉框自动搜索,包括数据验证的单列删除
目录 目标 例子 1.搜索下拉框页 2.数据源页 3.效果 代码以及注意事项 1.代码 2.注意事项 1.基于Excel的话,相当于加入了一个【数据验证】 2.代码中的一些方法说明 目标 期望在Excel利用代码创建具备自动搜索功能的下拉框 例子 1.搜索下拉框页 2.数据源…...
std::allocator_traits 能做但 std::allocator 不能的事情
🌟 std::allocator_traits 能做但 std::allocator 不能的事情 1️⃣ 适配自定义分配器 假设你要实现一个内存池 MyAllocator,而 STL 容器默认使用的是 std::allocator。 如果你希望 STL 容器可以使用你的 MyAllocator,你 不能直接用 std::a…...
深度解析Ant Design Pro 6开发实践
深度解析Ant Design Pro 6全栈开发实践:从架构设计到企业级应用落地 一、Ant Design Pro 6核心特性与生态定位(技术架构分析) 作为Ant Design生态体系的旗舰级企业应用中台框架,Ant Design Pro 6基于以下技术栈实现突破性升级&am…...
flutter 局部刷新控件Selector源码实现原理
Flutter 中的 Selector 组件是 provider 包提供的一个优化工具,用于在状态管理中仅选择所需数据片段,避免不必要的 Widget 重建。其实现原理基于以下几个关键点: 1. 核心设计目标 选择性重建:仅当特定数据变化时触发 Widget 重建&…...
Hadoop之01:HDFS分布式文件系统
HDFS分布式文件系统 1.目标 理解分布式思想学会使用HDFS的常用命令掌握如何使用java api操作HDFS能独立描述HDFS三大组件namenode、secondarynamenode、datanode的作用理解并独立描述HDFS读写流程HDFS如何解决大量小文件存储问题 2. HDFS 2.1 HDFS是什么 HDFS是Hadoop中的一…...
vite+react+ts如何集成redux状态管理工具,实现持久化缓存
1.安装插件 这里的redux-persist--进行数据的持久化缓存,确保页面刷新数据不会丢失 yarn add react-redux^9.2.0 redux-persist^6.0.0 reduxjs/toolkit^2.5.1 2.创建仓库文件夹 在项目的src文件夹下创建名为store的文件夹,里面的具体文件如下 featur…...
文字的力量
不知道以前的时代的年轻人有没有这样的感受。现在我觉得自己是不是出现了认知偏差,发现在很多描写现在的二十几岁年轻人的成长经历的文字下面都会出现很多共鸣,包括我自己也有,就让我有一个错觉:是不是中国所有的和我同龄的年轻人都是这样过来…...
网络空间安全(4)web应用程序安全要点
前言 Web应用程序安全是确保Web应用程序、服务和服务器免受网络攻击和威胁的关键环节。 一、编写安全的代码 输入验证与过滤:确保所有的用户输入都被正确验证和过滤,以防止注入攻击等安全漏洞。开发者应对URL、查询关键字、HTTP头、POST数据等进行严格的…...
openwebUI访问vllm加载deepseek微调过的本地大模型
文章目录 前言一、openwebui安装二、配置openwebui环境三、安装vllm四、启动vllm五、启动openwebui 前言 首先安装vllm,然后加载本地模型,会起一个端口好。 在安装openwebui,去访问这个端口号。下面具体步骤的演示。 一、openwebui安装 rootautodl-co…...
安全测试之五:SQL Server注入漏洞几个实例
示例 1:在 GET 请求中测试 SQL 注入 最简单且有时最有效的情况是针对登录页面进行测试。当登录页面请求用户输入用户名和密码时,攻击者可以尝试输入以下字符串 “ or 11”(不包含双引号): https://vulnerable.web.ap…...