阿里通义万相 Wan2.1-VACE:开启视频创作新境界
2025 年 5 月 14 日,阿里巴巴为视频创作领域带来了重磅惊喜 —— 开源通义万相 Wan2.1-VACE。这一模型堪称视频生成与编辑领域的集大成者,凭借其全面且强大的功能,为广大创作者、开发者以及企业用户开辟了全新的视频创作天地。它打破了以往视频创作中需依赖多种工具和模型的局限,以单一模型之力,将视频生成与编辑的众多关键环节整合,极大地简化了创作流程,提升了创作效率。接下来,让我们深入探索通义万相 Wan2.1-VACE 的神奇世界。
一、通义万相 Wan2.1-VACE 的卓越功能
(一)文生视频:文字瞬间化为生动影像
在通义万相 Wan2.1-VACE 的操作界面中,有一个简洁而强大的文本输入框。当你在其中输入一段充满想象力的文字描述,比如 “宁静的夜晚,古老的城堡被月光笼罩,城墙上的旗帜随风轻轻飘动,城堡前的花园里,萤火虫闪烁着微光,穿梭在花丛间”,并设置好期望的视频分辨率(如选择 1080P 以获得高清画质)和时长(假设设置为 10 秒)后,点击生成按钮,模型便迅速运转起来。它基于对文字的深度理解,从海量的知识储备中提取相关元素,构建场景,生成一段完全贴合你文字描述的视频。视频中,夜晚的黑暗氛围、城堡的神秘轮廓、月光的柔和洒下、旗帜的飘动细节以及萤火虫的灵动闪烁都栩栩如生,让文字在屏幕上鲜活地动起来。
(二)图像参考视频生成:赋予静态图片动态生命力
若你有一张极具故事感的静态图片,比如一张小女孩站在海边望向远方的照片,想要将其转化为动态视频。在通义万相 Wan2.1-VACE 中,你只需上传这张图片,还可以在旁边的文本框中补充描述,如 “小女孩开始奔跑,海风将她的头发吹起,海浪拍打着沙滩,溅起朵朵白色浪花”。模型会以图片中的小女孩为主体,根据你的描述,生成一段小女孩在海边动态活动的视频。她的奔跑动作流畅自然,头发随风飘动的姿态、海浪拍打沙滩的动态效果都与图片中的场景完美融合,仿佛原本静止的画面被注入了生命的活力,开启了一段新的故事。
(三)视频重绘:重塑视频风格与画质
对于已经存在的视频,通义万相 Wan2.1-VACE 的视频重绘功能可以对其进行全方位的改造。比如你有一段拍摄日常城市街道的普通视频,画面风格平淡无奇。通过上传该视频,在模型操作界面中,你可以选择将其重绘为复古风格,视频瞬间就像是从老电影中截取的片段,画面色调泛黄,带有颗粒质感,充满怀旧氛围;或者选择将其转化为卡通风格,街道和人物都以卡通形象呈现,线条简洁流畅,色彩鲜艳活泼,具有独特的艺术感。同时,若原视频画质模糊,模型还能通过智能算法提升画质,让视频中的细节更加清晰,如街道上的店铺招牌文字变得清晰可辨,人物的面部表情也更加细腻。
(四)视频局部编辑:精准雕琢视频细节
在视频局部编辑方面,通义万相 Wan2.1-VACE 展现出了极高的精准度。以一段热闹的集市视频为例,视频中有一位摊主在摊位前售卖水果,但摊位上有一个不太美观的杂物。你可以在模型操作界面中,通过鼠标精准地圈选这个杂物所在区域,选择 “删除” 操作,模型会自动识别该区域周围的场景元素,然后智能地填补删除杂物后的空白,使视频画面依然保持连贯自然,就好像这个杂物从未存在过一样。又或者,你想在视频中的某个摊位上添加一些鲜花作为装饰,选择 “添加” 操作,上传鲜花图片,模型会将鲜花自然地融入摊位场景中,调整鲜花的光影、角度等,使其与周围环境完美匹配,实现对视频局部细节的精准雕琢。
(五)视频背景延展:拓展视频场景空间
假设你有一段人物在室内演讲的视频,背景较为单调。使用通义万相 Wan2.1-VACE 的视频背景延展功能,你可以在操作界面中选择上下左右等方向进行背景扩展。比如选择向下扩展,并描述 “添加一个带有精美花纹的木质地板,地板上摆放着几盆绿色植物”。模型会根据你的要求,在视频下方生成符合描述的背景内容,扩展后的背景与原视频中的人物和前景元素融合自然,仿佛原本的室内空间得到了真实的延伸,极大地丰富了视频的场景空间和视觉效果。
(六)视频时长延展:丰富视频内容与情节
对于一段时长较短、内容略显单薄的产品介绍视频,通义万相 Wan2.1-VACE 的视频时长延展功能可以发挥重要作用。你可以在操作界面中选择在视频的开头、结尾或中间插入额外内容。例如,选择在视频结尾插入一段用户使用该产品后露出满意笑容并点赞的画面。通过输入详细描述,模型会生成相应内容并添加到视频中。新生成的视频不仅时长得到了延展,而且内容更加丰富完整,从产品展示到用户反馈,情节更加连贯,能够更好地吸引观众的注意力,传达产品信息。
二、通义万相 Wan2.1-VACE 的技术基石
(一)创新视频条件单元(VCU):多模态输入的核心枢纽
通义万相 Wan2.1-VACE 创新性地提出了视频条件单元 VCU,这是其实现强大功能的关键技术之一。VCU 就像是一个智能的多模态信息处理器,它将各种不同类型的输入,如文本、图像、视频、Mask 和控制信号等,进行统一的整合和处理。在输入形态上,它巧妙地将这些多模态信息归纳为文本、帧序列和 Mask 序列三大类,从而为文生视频、参考图生视频、视频生视频以及基于局部区域的视频生视频这 4 大类视频生成和编辑任务,提供了统一的输入形式基础。
在处理多模态信息时,VCU 对输入的 Frame 序列进行了独特的概念解耦。它如同一个精细的分类器,将 Frame 序列中的图像元素按性质精准拆分。对于那些需要保留原始视觉信息的 RGB 像素,它将其归类为不变帧序列;而对于承载着控制指令等需要重新生成的像素内容,则构建为可变帧序列。这种解耦方式,使得不同性质的元素能够在后续的处理中得到针对性的操作,为多模态输入的高效处理奠定了坚实基础。
(二)先进架构与技术融合:保障视频生成质量与效率
模型采用了先进的 DiT(Diffusion in Transformer)架构,这种架构在视频生成领域具有独特的优势。它能够有效地捕捉视频中不同元素在时空维度上的长时程依赖关系,使得生成的视频在时间上的动作衔接更加流畅自然,在空间上的场景布局更加合理协调,从而生成时空一致的高质量视频。
同时,结合 Full Attention 机制,DiT 架构能够更好地聚焦于视频中的关键信息,准确地理解和处理每个元素之间的关联。无论是复杂的人物动作,还是宏大的场景变化,Full Attention 机制都能确保模型不会遗漏任何重要细节,为生成细节丰富、逻辑连贯的视频提供了有力支持。
在提升计算效率方面,通义万相 Wan2.1-VACE 运用了 VAE 视频压缩技术。这一技术就像是一个高效的 “压缩大师”,在保证视频质量不受明显影响的前提下,对视频数据进行合理压缩,大大减少了模型运行时所需处理的数据量。这不仅节省了大量的计算时间,还降低了对硬件资源的需求,使得在一些配置相对普通的设备上,也能够较为流畅地运行该模型,让更多用户能够轻松享受到模型带来的便利。
(三)多模态信息输入与可控重绘:赋予创作者精准控制权
与传统仅依赖文本提示的视频生成模型不同,通义万相 Wan2.1-VACE 构建了一个极为丰富和强大的多模态信息输入系统。这个系统就像是一个多功能的创作工具箱,为创作者提供了丰富多样的创作工具和手段,使其能够对视频生成过程进行更加精准的控制。
在图像输入方面,模型可支持物体参考图或视频帧。这意味着创作者可以通过上传特定的物体图片或视频中的关键帧,引导模型在生成视频时,更好地把握物体的形态、颜色、纹理等特征,实现元素一致性生成。例如,在生成一个关于汽车的视频时,上传一张汽车的高清图片作为参考,模型生成的视频中汽车的外观细节将与参考图片高度一致。
对于视频输入,用户可以通过抹除、局部扩展等操作,使用模型重新生成视频。比如,对于一段舞蹈视频,用户可以选择抹除其中某个不太满意的舞蹈动作片段,然后通过输入新的描述,让模型重新生成这部分内容,实现对视频内容的个性化定制。
在局部区域编辑中,用户可以通过简单的 0/1 二值信号来指定编辑区域。这种直观的操作方式,使得创作者能够轻松地圈定视频中需要修改的局部区域,如人物的面部、物体的某个部分等,然后进行相应的元素替换、添加或删除操作,实现对视频细节的精细调整。
在控制信号方面,模型支持深度图、光流、布局、灰度、线稿和姿态等多种信号输入。以姿态控制为例,创作者可以通过输入人物的姿态信息,让模型生成的视频中人物的动作姿态符合预期,无论是优雅的舞蹈动作,还是激烈的运动场景,都能精准呈现。这种多模态信息输入与可控重绘机制,极大地满足了不同创作者对于视频内容和风格的多样化需求,让创作者的创意能够得到更充分的表达和实现。
三、通义万相 Wan2.1-VACE 的应用场景
(一)内容创作领域:激发无限创意灵感
- 影视制作:在影视制作的前期筹备阶段,导演和编剧可以利用通义万相 Wan2.1-VACE 快速生成各种创意分镜视频。比如,对于一个科幻电影中宇宙飞船穿越虫洞的场景,通过输入文字描述和相关的参考图片,模型能够迅速生成一段概念验证视频,帮助团队直观地感受场景效果,调整创意方向,节省大量手绘分镜和前期特效制作的时间和成本。在实际拍摄中,对于一些难以拍摄的场景,如远古恐龙时代的生态环境、未来世界的城市风貌等,模型可以生成逼真的虚拟背景视频,与实拍画面进行合成,丰富影片的视觉效果。在后期制作环节,模型的视频重绘和局部编辑功能可用于修复拍摄瑕疵,如去除演员脸上的小痘痘、调整场景中的光线不均匀等,还能为影片添加独特的艺术风格,提升影片的整体质量。
- 广告创意:广告公司在为客户制作广告时,面临着快速出创意、满足客户多样化需求的挑战。通义万相 Wan2.1-VACE 能够成为广告创意的强大助力。根据广告文案和产品特点,结合相关的参考图像,模型可以快速生成多个版本的广告视频创意方案。例如,为一款新上市的化妆品制作广告,通过输入产品的功效、目标受众等信息,以及一些时尚美妆的参考图片,模型可以生成不同风格的广告视频,如清新自然风、时尚炫酷风等,供客户选择。在确定创意方案后,利用模型的视频局部编辑和背景延展功能,可以进一步优化视频细节,突出产品特点,增强广告的吸引力和说服力。
- 游戏开发:游戏开发者在游戏开发过程中,需要制作大量的角色动画、场景过渡视频等内容。通义万相 Wan2.1-VACE 可以帮助开发者快速生成这些素材。比如,生成游戏角色的各种动作动画,如战斗中的攻击、防御、技能释放动作,以及角色在不同场景中的行走、奔跑、跳跃动画等。对于游戏场景的制作,模型可以根据游戏的世界观和美术风格,基于一些概念图生成动态的场景视频,如奇幻森林场景中树木随风摇曳、光影变化的视频,或者未来城市中高楼大厦、飞行载具穿梭的视频。这些生成的素材可以作为游戏开发的基础,大大缩短开发周期,降低开发成本,同时为游戏增添更多精彩的视觉元素。
(二)工业与教育领域:推动行业创新发展
- 虚拟助手与数字人:在电商客服场景中,虚拟助手往往以单调的文字回复用户问题,缺乏吸引力。通义万相 Wan2.1-VACE 可以为虚拟助手赋予生动的视频形象。通过输入不同的问题回复文本,模型生成相应的虚拟助手视频回复,助手的表情、动作与回答内容相匹配,如在介绍产品时,虚拟助手可以做出展示产品的动作,让用户更加直观地理解产品信息,提升用户体验和购物转化率。在在线教育领域,数字人教师可以借助该模型生成丰富多样的教学视频。例如,在讲解数学几何知识时,数字人教师可以结合模型生成的动态几何图形视频,更加生动形象地向学生展示图形的变化和推导过程,提高学生的学习兴趣和理解能力。
- 医疗和科研:在医疗培训中,通义万相 Wan2.1-VACE 可以生成手术模拟视频,帮助医学生更好地学习手术操作流程。通过输入手术步骤的文字描述和相关的人体解剖图,模型生成逼真的手术操作视频,展示手术器械的使用、组织的分离与缝合等细节,让医学生在虚拟环境中反复观看和学习,提高手术技能培训的效果。在科研领域,对于一些微观实验过程,如细胞分裂、分子反应等,科学家可以利用模型将复杂的数据转化为直观的视频展示。通过输入实验数据和相关的科学原理描述,模型生成动态视频,展示微观世界中的变化过程,帮助科研人员更好地理解实验现象,分析研究结果,推动医疗和科研领域的创新发展。
(三)个人用户领域:记录生活精彩瞬间
- 社交媒体:在社交媒体时代,用户希望分享的内容能够更加独特和吸引人。通义万相 Wan2.1-VACE 为个人用户提供了丰富的创作手段。用户可以将自己拍摄的照片制作成有趣的动态视频,比如将旅行中的风景照片,通过模型生成一段视频,添加一些动态效果,如风吹草动、水流潺潺等,再配上欢快的音乐,分享到社交媒体上,吸引更多朋友的关注和点赞。用户还可以利用模型的文生视频功能,将自己的心情、感悟等文字描述转化为视频,以一种更加生动的方式表达自己的情感和想法。
- 家庭娱乐:家庭用户可以利用通义万相 Wan2.1-VACE 将家庭照片制作成个性化的纪念视频。比如,将一家人在海边度假的照片,通过模型生成一段视频,视频中家人的照片逐渐切换,配上温馨的音乐和回忆性的文字旁白,成为一份珍贵的家庭回忆。在家庭聚会等场合,播放这样的视频,能够唤起大家美好的回忆,增进家庭成员之间的情感交流。用户还可以使用模型的视频局部编辑功能,为家庭视频添加一些有趣的元素,如为孩子的视频画面中添加卡通贴纸,让家庭视频更加有趣和温馨。
四、如何使用通义万相 Wan2.1-VACE
(一)下载与安装
- 版本选择与下载平台:本次开源的通义万相 Wan2.1-VACE 提供了 1.3B 和 14B 两个版本。1.3B 版本对硬件要求相对较低,仅需 8.2GB 显存就可以生成 480P 视频,非常适合在普通消费级显卡上运行,对于个人创作者和硬件配置有限的用户来说是一个不错的选择。14B 版本则具有更强大的性能,支持 480P 和 720P 分辨率,能够生成更高质量的视频,但对硬件要求也更高,适合专业的视频制作团队和拥有高性能硬件设备的用户。用户可以根据自己的硬件条件和使用需求,前往 GitHub、Huggingface 及魔搭社区等平台下载相应版本的模型。在 GitHub 上,你可以找到模型的官方代码仓库,获取最新的代码更新和技术文档;Huggingface 平台则提供了方便的模型下载和部署工具;魔搭社区不仅有模型下载资源,还汇聚了众多开发者的使用经验分享和案例展示,有助于用户更好地了解和使用模型。
- 安装步骤与环境配置:在下载完成后,接下来就是安装和配置运行环境。首先,确保你的计算机安装了 Python 环境,建议使用 Python 3.8 - 3.10 版本。如果尚未安装,可以从 Python 官方网站下载对应操作系统的安装包进行安装。安装完成后,为了避免不同项目之间的依赖冲突,推荐创建一个虚拟环境。在命令行中输入python -m venv myenv(其中myenv为虚拟环境名称,可自行修改),即可创建一个新的虚拟环境。对于 Windows 系统,激活虚拟环境的命令是myenv\Scripts\activate;对于 Linux 和 macOS 系统,命令为source myenv/bin/activate。激活虚拟环境后,进入模型下载目录,执行pip install -r requirements.txt命令,安装模型运行所需的各种依赖库。这些依赖库包括深度学习框架(如 torch、torchvision)、图像处理库(如 Pillow)等,它们是模型正常运行的基础。在安装过程中,如果遇到依赖库版本冲突等问题,可以参考各依赖库的官方文档,手动指定兼容版本进行安装,或者在相关技术论坛上
相关文章:
阿里通义万相 Wan2.1-VACE:开启视频创作新境界
2025 年 5 月 14 日,阿里巴巴为视频创作领域带来了重磅惊喜 —— 开源通义万相 Wan2.1-VACE。这一模型堪称视频生成与编辑领域的集大成者,凭借其全面且强大的功能,为广大创作者、开发者以及企业用户开辟了全新的视频创作天地。它打破了以往视…...
mAP、AP50、AR50:目标检测中的核心评价指标解析
在目标检测任务中,评价指标是衡量模型性能的核心工具。其中,mAP(mean Average Precision)、AP50(Average Precision at IoU0.5)和AR50(Average Recall at IoU0.5)是最常用的指标。本…...
Linux进程异常退出排查指南
在 Linux 中,如果进程无法正常终止(如 kill 命令无效)或异常退出,可以按照以下步骤排查和解决: 1. 常规终止进程 尝试普通终止(SIGTERM) kill PID # 发送 SIGTERM 信号(…...
深入解析:如何基于开源OpENer开发EtherNet/IP从站服务
一、EtherNet/IP协议概述 EtherNet/IP(Industrial Protocol)是一种基于以太网的工业自动化通信协议,它将CIP(Common Industrial Protocol)封装在标准以太网帧中,通过TCP/IP和UDP/IP实现工业设备间的通信。作为ODVA(Open DeviceNet Vendors Association)组织的核心协议…...
【Linux 学习计划】-- yum
目录 什么是yum Linux的生态讲解 yum相关操作 yum源 yum配置相关问题 结语 什么是yum 我们的手机上都有手机自带的软件商城,我们下载软件都可以在上面搜索,安装,下载 而我们的yum就是这么一个东西,他其实就是Linux下的安装…...
Qt 强大的窗口停靠浮动
1、左边: 示例代码: CDockManager::setConfigFlags(CDockManager::DefaultOpaqueConfig); CDockManager::setConfigFlag(CDockManager::FocusHighlighting, true); dockManager new CDockManager(this); // Disabling the Internal Style S…...
Flink 数据传输机制
在 Apache Flink 中,数据传输(Data Transmission)机制 是其分布式流处理能力的核心之一。Flink 通过高效的内部数据交换、网络通信和序列化机制,确保任务之间的数据能够高效、可靠地流动。 一、Flink 数据传输的基本流程 Source …...
数据库——SQL约束窗口函数介绍
4.SQL约束介绍 (1)主键约束 A、基本内容 基本内容 p r i m a r y primary primary k e y key key约束唯一表示数据库中的每条记录主键必须包含唯一的值(UNIQUE)主键不能包含NULL值(NOT NULL)每个表都应…...
第8讲、Multi-Head Attention 的核心机制与实现细节
🤔 为什么要有 Multi-Head Attention? 单个 Attention 机制虽然可以捕捉句子中不同词之间的关系,但它只能关注一种角度或模式。 Multi-Head 的作用是: 多个头 多个视角同时观察序列的不同关系。 例如: 一个头可能专…...
【发票提取表格】批量PDF电子发票提取明细保存到Excel表格,批量提取ODF电子发票明细,行程单明细,单据明细保存到表格,使用步骤、详细操作方法和注意事项
在日常办公中,我们常常会面临从大量 PDF 电子发票、ODF 电子发票、行程单及各类单据中提取明细,并整理到 Excel 表格的艰巨任务。手动操作不仅耗时费力,还极易出错。以下为您详细介绍其使用步骤、操作方法、注意事项及应用场景。 一、适用场…...
React中startTransition的使用
// 引入 React 的 Hook API:useState 管理状态、useTransition 处理非紧急更新、useMemo 缓存计算结果 import { useState, useTransition, useMemo } from react;/*** List 组件:* 根据输入的 query 动态渲染一个包含 10000 条数据的列表*/ function Li…...
Reactor (epoll实现基础)
Reactor 是什么? Reactor 网络模型是一种高性能的事件驱动模型,广泛应用于网络编程中。它通过 I/O 多路复用技术,实现了高效的事件处理和系统吞吐量的优化。 核心概念 Reactor 模型_的核心是事件驱动,即当 I/O 事件准备就绪时_…...
php fiber 应用
参考 基于 PHP Fiber(纤程)的游戏开发分析-腾讯云开发者社区-腾讯云PHP 8.1 引入的 Fibers 为游戏开发带来新机遇,能管理渲染、物理计算等任务且不阻塞主线程。它支持并发,提升效率,简单易用,但也有局限&a…...
前端扫盲HTML
文章目录 下载、安装、运行第一个代码(hello world)创建代码文件编辑代码(hello world)HTML常见标签注释标签标题标签段落标签换行标签格式化标签图片标签表格标签列表标签表单标签下拉菜单无语义标签 参考文档 下载、安装、运行第…...
RAG与微调:企业知识库落地的技术选型
从本质上看,RAG是"让模型查阅外部知识",而微调是"让模型学会并内化知识"。这一根本差异决定了它们在不同场景下的适用性。 技术选型的关键依据 场景RAG微调说明模型定制化需求❌✅微调更适合塑造特定风格、口吻和人格特征硬件资源…...
Linux安全篇 --firewalld
一、Firewalld 防火墙概述 1、Firewalld 简介 firewalld 的作用是为包过滤机制提供匹配规则(或称为策略),通过各种不同的规则告诉netfilter 对来自指定源、前往指定目的或具有某些协议特征的数据包采取何种处理方式为了更加方便地组织和管理防火墙,firewalld 提供…...
关于Android Studio for Platform的使用记录
文章目录 简单介绍如何使用配置导入aosp工程配置文件asfp-config.json 简单介绍 Android Studio for Platform是google最新开发,用来阅读aosp源码的工具 详细的资料介绍: https://developer.android.google.cn/studio/platform 将工具下载下来直接点击…...
搜索引擎工作原理|倒排索引|query改写|CTR点击率预估|爬虫
写在前面 使用搜索引擎是我们经常做的事情,搜索引擎的实现原理。 什么是搜索引擎 搜索引擎是一种在线搜索工具,当用户在搜索框输入关键词时,搜索引擎就会将与该关键词相关的内容展示给用户。比较大型的搜索引擎有谷歌,百度&…...
【找工作系列①】【大四毕业】【复习】巩固JavaScript,了解ES6。
文章目录 前言Tasks:复习笔记:JavaScript是什么?JavaScript有什么用或者换句话说 是做什么的?JavaScript由哪几部分组成?BOM?DOM?html文件中script标签放在哪里?🧩 1. **放在 ****<head>**** 中**✅ 优点&…...
Oracle 11.2.0.4 pre PSU Oct18 设置SSL连接
Oracle 11.2.0.4 pre PSU Oct18 设置SSL连接 1 说明2 客户端配置jdk环境3服务器检查oracle数据库补丁4设置ssla 服务器配置walletb 上传测试脚本和配置文件到客户端c 服务器修改数据库侦听和sqlnet.orad 修改客户端的sqlnet.ora和tnsnames.ora的连接符e 修改java代码的数据连接…...
本地部署开源网盘系统 kiftd 并实现外部访问(Linux 版本)
kiftd 是一款专为个人、团队及小型组织设计的开源网盘系统,兼具便捷性、跨平台兼容性与丰富的功能,成为替代传统文件共享工具的理想选择。 本文将详细介绍如何在 Linux 系统本地部署 kiftd 并结合路由侠实现外网访问本地部署的 kiftd 。 第一步&#x…...
ECS/GEM是半导体制造业的标准通信协议中host和equipment的区别是什么,在交互过程中,如何来定位角色谁为host,谁为equipment
文章目录 一、角色定义与核心区别1. Host(主机)2. Equipment(设备)3. Host与Equipment的核心区别 二、交互过程中的角色定位1. 交互方向2. 控制层级3. 交互过程中角色的定位方法3.1. 通信发起方向3.2. 协议功能与状态管理3.3. 物理…...
5000 字总结CSS 中的过渡、动画和变换详解
CSS 中的过渡、动画和变换详解 一、CSS 过渡(Transitions) 1. 基本概念 CSS 过渡是一种平滑改变 CSS 属性值的机制,允许属性值在一定时间内从一个值逐渐变化到另一个值,从而创建流畅的动画效果。过渡只能用于具有中间值的属性&…...
2025年渗透测试面试题总结-安恒[实习]安全工程师(题目+回答)
网络安全领域各种资源,学习文档,以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具,欢迎关注。 目录 安恒[实习]安全工程师 一面 1. 自我介绍 2. 前两段实习做了些什么 3. 中等难度的算法题 4. Java的C…...
WebXR教学 09 项目7 使用python从0搭建一个简易个人博客
WebXR教学 09 项目7 使用python从0搭建一个简易个人博客(1) 前期设计规划 功能 呈现个人博客文章 技术选型 HTMLCSSJSPythonFlask 环境准备 VS Code Python3.8 代码实现 包 # 创建虚拟环境(-m 会先将模块所在路径加入 sys.path,更适…...
c++从入门到精通(五)--异常处理,命名空间,多继承与虚继承
异常处理 栈展开过程: 栈展开过程沿着嵌套函数的调用链不断查找,直到找到了与异常匹配的catch子句为止;也可能一直没找到匹配的catch,则退出主函数后查找过程终止。栈展开过程中的对象被自动销毁。 在栈展开的过程中,…...
开源安全大模型Foundation-Sec-8B实操
一、兴奋时刻 此时此刻,晚上22点55分,从今天早上6点左右开始折腾,花费了接近10刀的环境使用费,1天的休息时间,总算是把Foundation-Sec-8B模型跑起来了,中间有两次胜利就在眼前,但却总在远程端口转发环节出问题,让人难受。直到晚上远程Jupyter访问成功那一刻,眉开眼笑,…...
现代优化算法全解析:禁忌搜索算法、模拟退火算法、遗传算法、蚁群优化算法、人工神经网络
现代优化算法全解析:禁忌搜索算法、模拟退火算法、遗传算法、蚁群优化算法、人工神经网络 引言:为什么需要优化算法? 在当今这个数据驱动的时代,优化算法已成为计算机科学、工程设计、人工智能等领域的核心工具。无论是训练神经…...
Docker常见命令解读
上图是对docker常见命令的一个图解,方便大家理解,下面,我将对这些命令做一些解释。 一、镜像生命周期管理 1. 镜像构建(Build) docker build -t my-image . # 根据Dockerfile构建镜像 Dockerfile:…...
为什么 Docker 建议关闭 Swap
在使用 Docker 时,关闭系统 Swap(交换分区) 是一个常见的推荐做法,尤其是在生产环境中。虽然 Docker 不强制要求禁用 Swap,但出于性能、稳定性、可控性和资源管理的目的,通常建议这样做。 为什么 Docker 建…...
TIFS2024 | CRFA | 基于关键区域特征攻击提升对抗样本迁移性
Improving Transferability of Adversarial Samples via Critical Region-Oriented Feature-Level Attack 摘要-Abstract引言-Introduction相关工作-Related Work提出的方法-Proposed Method问题分析-Problem Analysis扰动注意力感知加权-Perturbation Attention-Aware Weighti…...
WPS PPT设置默认文本框
被一个模板折磨了好久,每次输入文本框都是很丑的24号粗体还有行标,非常恶心,我甚至不知道如何描述自己的问题,非常憋屈,后来终于知道怎么修改文本框了。这种软件操作问题甚至不知道如何描述问题本身,非常烦…...
支持selenium的chrome driver更新到136.0.7103.94
最近chrome释放新版本:136.0.7103.94 如果运行selenium自动化测试出现以下问题,是需要升级chromedriver才可以解决的。 selenium.common.exceptions.SessionNotCreatedException: Message: session not created: This version of ChromeDriver only su…...
“下一辆车还买小米”
大家好,我是小悟。 就在5月13日,江西上饶德兴街头,一辆紫色小米SU7 Max停在路边,却遭遇了一场堪比灾难片的意外。 一辆满载货物的大货车因手刹故障溜坡,径直撞向SU7,两车从两米高的落差坠落,货…...
opencv4.11生成ArUco标记 ArUco Marker
从opencv4.7开始aruco有了一些变化 以下是opencv4.11生成ArUco标记的小例子 #include <iostream> #include <opencv2/opencv.hpp> #include <opencv2/objdetect/aruco_detector.hpp>int main() {cv::Mat markerImage;cv::aruco::Dictionary dictionary cv…...
从辅助到协作:GitHub Copilot的进化之路
如果说现代程序员的标配工具除了VS Code、Stack Overflow之外,还有谁能入选,那一定是GitHub Copilot。从2021年首次亮相,到如今深度集成进开发者日常流程,这个“AI编程助手”已经不只是写几行自动补全代码的小帮手了,而…...
QMK 宏(Macros)功能详解(实战部分)
QMK 宏(Macros)功能详解(实战部分) 一、宏的基本概念与作用 宏(Macros)是 QMK 固件中一项强大的功能,它允许您在按下单个按键时执行多个按键操作。通过宏,您可以: 输入常用短语或文本执行复杂的按键组合自动化重复性操作触发系统功能或快捷键🔔 安全提示:虽然可以…...
SVN 版本控制入门指南
SVN 版本控制系统详细入门指南 一、SVN 基础概念详解 1. 什么是版本控制? 版本控制是一种记录文件变化的系统,可以: 追踪文件的修改历史查看每次修改的内容恢复到任意历史版本协调多人协作开发 2. SVN 核心概念 2.1 仓库(Re…...
6to4、6over4的类比解释
本文由deepseek生成,特此声明 1. 6to4:自动的“快递中转站” 类比场景: 假设你住在一个偏远的小镇(IPv6网络),周围被大海(IPv4互联网)包围,你想给另一个偏远小镇&#…...
跨国应用程序的数据存储方案常见的解决方案
一、数据隐私与合规性 跨国数据存储方案必须遵守不同国家和地区的数据隐私法律和规定,例如: GDPR(欧盟一般数据保护条例)CCPA(加利福尼亚消费者隐私法案)各国的本地数据存储法规解决方案: 采用本地化存储:在不同国家或地区设立数据存储中心,以遵循当地的法律和隐私要…...
JSP链接MySQL8.0(Eclipse+Tomcat9.0+MySQL8.0)
所用环境 Eclipse Tomcat9.0 MySQL8.0.21(下载:MySQL Community Server 8.0.21 官方镜像源下载 | Renwole) mysql-connector-java-8.0.21(下载:MySQL :: Begin Your Download) .NET Framework 4.5.2(下…...
基于KAN+Transformer的专业领域建模方法论
一、专业领域KAN方法创新路径 1. 领域函数分解策略 数学建模:针对专业领域特性设计专用基函数组合 医学影像:采用小波变换基函数分解图像特征 class WaveletKAN(nn.Module): def __init__(self): self.wavelet_basis nn.Par…...
Go语言 Gin框架 使用指南
Gin 是一个用 Go (Golang) 编写的 Web 框架。 它具有类似 martini 的 API,性能要好得多,多亏了 httprouter,速度提高了 40 倍。 如果您需要性能和良好的生产力,您一定会喜欢 Gin。Gin 相比于 Iris 和 Beego 而言,更倾向…...
内容安全:使用开源框架Caffe实现上传图片进行敏感内容识别
上传图片进行敏感内容识别 预览效果 环境准备 Ubuntu 16.04python 2.7.12caffe 1.0.0 安装调试环境: sudo apt-get update sudo apt-get install -y --no-install-recommends build-essential cmake git wget libatlas-base-dev libboost-all-dev libgflags-dev sudo apt-g…...
缓慢变化维度(SCD)策略
缓慢变化维度(SCD)策略 缓慢变化维度(SCD)策略是数据仓库中处理维度属性随时间变化的核心技术,根据业务需求的不同,主要分为以下类型: 1. SCD Type 0(固定维度) 定义&a…...
【Mysql】详解InnoDB存储引擎以及binlog,redelog,undolog+MVCC
1.InnoDB存储引擎 在Mysql中,InnoDB存储引擎是默认的,也是我们最常用的一个存储引擎,其中分为内存结构和磁盘结构两大部分,整体架构图如下: 1.1Buffer Pool Buffer pool(缓存区)是Mysql内存的一个主要区域࿰…...
面向对象详解和JVM底层内存分析
神速熟悉面向对象 表格结构和类结构 我们在现实生活中,思考问题、发现问题、处理问题,往往都会用“表格”作为工具。实际上,“表格思维”就是一种典型的面向对象思维。 实际上,互联网上所有的数据本质上都是“表格”。我们在这里…...
C语言指针深入详解(一):内存和地址、指针变量和地址、指针变量类型的意义、指针运算
目录 一、内存和地址 (一)内存 (二)如何理解编址 二、指针变量和地址 (一)取地址操作符(&) (二)指针变量和解引用操作符(*)…...
MATLAB中进行深度学习网络训练的模型评估步骤
文章目录 前言环境配置一、基础性能评估二、高级评估指标三、模型解释与可视化四、交叉验证与模型选择五、部署前的优化 前言 在 MATLAB 中进行深度学习网络训练后的模型评估是确保模型性能和可靠性的关键环节。以下是详细的评估步骤和方法。 环境配置 MATLAB下载安装教程&…...
30、WebAssembly:古代魔法——React 19 性能优化
一、符文编译术(编译优化) 1. 语言选择与量子精简 // Rust编译优化 cargo build --target wasm32-wasi --release 魔法特性: • 选择低运行时开销语言(如Rust/C),编译后文件比Swift小4倍 • --rel…...