【论文阅读笔记】One Diffusion to Generate Them All
One Diffusion to Generate Them All
- 介绍
- 理解
- 引言
- 二、相关工作
- 三、方法
- 预备知识
- 训练
- 推理
- 实现细节
- 训练细节
- 数据集构建
- 实验分
- 结论
- 附录
介绍
Paper:https://arxiv.org/abs/2411.16318
Code:https://github.com/lehduong/onediffusion
Authors:Allen Institute for AI(AI2)\ 加州大学欧文分校 \ 华盛顿大学
理解
利用成组的序列数据通过Attention自身去完成其内部一致性的学习,多种任务同时训练又共同促进了模型的能力。
同类文章还有 GDT https://arxiv.org/pdf/2410.15027
引言
- LLMs 能作为通用模型,用于多种任务,并进行 zero-shot 泛化,作者团队试图寻求同样功能的扩散模型
- 现有的扩散模型往往需要 add-ons 来实现特定功能,比如条件控制、身份保持、多视图生成、姿态检测、深度提取、分割等
- 受基于序列数据的扩散模型启发,我们在训练期间将所有条件和目标图像建模为一系列具有不同噪声水平的“视图”。(本质上就是将对应任务的数据成组送入到模型,并使用不同的时间不 t 进行预测)
- 提出 OneGen 数据集,可用于训练不同任务
- 对多种特定任务起到了匹配特定模型的效果
二、相关工作
- 介绍了多种基于扩散模型的针对特定生成任务的方法,如 Controlnet、T2I、instruct pix2pix、IP-adapter、PuLiD等,多视图任务有syncdreamer、mvdream 等
- 介绍多种基于扩散模型的预测任务,如光流估计、开放语义分割等。这些研究表明,扩散模型不仅对生成图像有用,而且对计算机视觉中的各种预测任务也非常有效
- 介绍了相关的统一任务生成,如 unicontrolnet,OmniGen 等
三、方法
预备知识
flow matching: 通过学习在两个概率分布之间传输的时间相关向量场来训练连续时间生成模型的框架。
L C F M ( θ ) : = E t , q ( z ) , p t ( x ∣ z ) ∥ v θ ( t , x ) − u t ( x ∣ z ) ∥ 2 \mathcal{L}_{\mathrm{CFM}}(\theta):=\mathbb{E}_{t, q(z), p_{t}(x \mid z)}\left\|v_{\theta}(t, x)-u_{t}(x \mid z)\right\|^{2} LCFM(θ):=Et,q(z),pt(x∣z)∥vθ(t,x)−ut(x∣z)∥2
根据图 2,我们将多模态条件下的图像生成问题视为序列建模,将不同任务的训练数据编组。
训练
训练:采用 SD3 的时间采样方式 t ∈ L o g N o r m ( 0 , 1 ) t \in LogNorm(0,1) t∈LogNorm(0,1),为同一序列的输入进行单独采样构建加噪后的潜变量,然后遵循其去噪损失: L ( θ ) = E [ ∥ v θ ( t 1 , … , t N , x 1 , … , x N ) − u ∥ 2 ] \mathcal{L}(\theta)=\mathbb{E}\left[\left\|v_{\theta}\left(t_{1}, \ldots, t_{N}, \mathbf{x}_{1}, \ldots, \mathbf{x}_{N}\right)-u\right\|^{2}\right] L(θ)=E[∥vθ(t1,…,tN,x1,…,xN)−u∥2]
推理
推理阶段将条件的噪声强度设置为 0,想要输出的目标图像(可能是多个)使用相同的去噪时间步 t,可以遵循正常的去噪推理流程对 ODE求解。
实现细节
- 网络架构:采用 Next-DiT 架构;设计了一个支持多种输入的变量长度定义方式;使用 3D RoPE 来处理位置编码
- 任务设定
- 文本到图像(1 个视图)。仅使用单个“视图”,训练和推理遵循与标准文本到图像扩散模型相同的过程。我们将任务标签 [[text2image]]] 添加到标题中以指定任务。
- 图像到图像(2 个视图)。我们将第一个视图设置为目标图像,第二个视图设置为条件输入。在推理过程中,我们可以使用一个或两个视图来生成,并训练模型生成目标图像。对于边界框或语义图生成等任务,我们将十六进制颜色代码和类标签添加到提示中。例如,要用黄色掩码分割鼠标,提示为:[[semantic2image]] <#FF00 黄色掩码:鼠标>一张照片。
- ID定制(2-4个视图)。我们跨视图对同一个人的图像进行采样,为每个输入图像连接字幕并使用标记 [[[imgX]] 来表示每张图像。我们还将任务标签 [[faceid]]] 添加到标题中。在推理时,我们可以以任意数量的图像为条件并生成多个输出,从而产生更一致的结果。
- 多视图生成(4-12 个视图)。受Cat3D的启发,我们使用Pl̈ucker射线嵌入来表示相机姿势。对于每个图像补丁,我们使用其射线原点o和方向d计算Pl̈ucker坐标asr = (o × d, d)。结果嵌入的维度 H/8×W/8×6,匹配潜在空间大小,并跨通道复制以形成 16 个通道嵌入。与 [18] 不同,我们将光线嵌入视为图像潜在变量的独立“视图”作为一个统一的序列,而不是通过通道连接。这种设计允许灵活的去噪,支持以相机姿势或采样光线嵌入为条件的多视图图像生成,以从图像条件下预测姿势,类似于 RayDiffusion [67]。我们将射线嵌入缩放到具有单位方差,如[47]所示。与其他任务一样,我们将任务标签 [[多视图]] 添加到标题中。在推理过程中,我们可以将图像或Pl̈ucker射线嵌入替换为高斯噪声,分别用于多视图生成和摄像机姿态估计。
训练细节
我们的模型是使用流匹配目标从头开始训练的。与之前的工作类似,我们使用三个阶段的训练配方。在第一阶段,我们以 256(500K 步) 和 512(500K 步) 的分辨率预训练文本到图像模型。在第二阶段,我们继续对混合任务进行训练,T2I 使用 512,其他任务使用 256,总共 1M 步。最后,在最后阶段,我们以 (1024) 的高分辨率对模型进行微调,用于 T2I。对于 ID 定制微调,我们使用 2-5 个视图。对于更少的视图(2-3),我们应用 512 的分辨率,而对于更多视图,我们使用 256 分辨率。
在训练期间,我们在每个阶段使用批量采样策略,以相等的概率对任务(T2I、图像到图像、ID 定制和多视图生成)进行采样。噪声调度器的移位值设置为 3,如SD3中所建议的。我们使用学习率为 η = 0.0005 的 AdamW 优化器。在第一阶段以 256 的全局批量大小为 256 的 TPU v3-256 pod 进行训练,最后的微调阶段使用相同的配置在 64 H100 GPU 上完成。
数据集构建
Text-to-Image 我们利用公共和内部(合成)数据集。公共数据集包括:PixelPenrose [52]、Unsplash、Coyo [6]、JourneyDB [40]。此外,我们使用 10M 内部合成数据集,该数据集由使用 LLAVA-NeXT [31] 和 Molmo [11] 重新描述的图像组成。每个图像的文本描述长度从 100 到 150 个单词不等。当原始提示可用时,我们使用 LLM 生成的标题和原始标题。
图像到图像 对于更简单的任务,如去模糊、修复、从canny边缘生成图像或放大,我们使用合成数据的1M样本子集,并为每个图像应用相关的预处理器来创建输入条件。对于更复杂的任务,我们按照下面概述的过程从 Midjourney、Stable Diffusion [15] 和 Flux-dev 生成的输出创建一个合成数据集:
- 语义图和检测对于每个图像,我们使用 LLAAVA-NeXT 模型来识别实体或主题(例如,人、衬衫、狗、建筑物),每张图像最多有 10 个实体。基于 LlaVA-Next 的这些主题名称,我们使用 SAM 执行语义分割并提取边界框。每个类都从预定义的列表中分配一个随机颜色。该数据集包含 350K 三元组,由语义图、边界框和原始图像组成。
- 深度图我们通过将 DepthAnything-v2 应用于从各种数据集中采样的 500K 图像来生成深度数据集,包括真实图像和合成图像。此外,我们将 Hypersim 数据集 中的 40K 图像与 LLAVA-NeXT 的标题,并将它们合并到训练集中。
- 人体姿势我们收集了一个包含 50K 图像的不同子集,主要是人类进行姿势调节。我们使用YOLOv5检测感兴趣区域的边界框,并应用ViTPose进行位姿估计
ID定制 我们通过从公开可用的图像中从游戏和电影中收集名人和人物的数据集。在过滤以确保每个受试者至少有四个图像并删除NSFW内容后,数据集包括大约60K个受试者,总共130万张图像。我们使用 LLAAVA-NeXT 对这些图像进行字幕。
多视图生成 我们使用DL3DV-10K数据集[29]、Obj厌恶[10]、CO3D[45]。对于 Objverse 数据集,我们利用从 LGM [54] 过滤拆分的 80K 和 Cap3D [38] 提供的标题。在 DL3DV 数据集中,我们从每个场景中采样图像并使用 LLAVA-Next 对其进行标题。对于 CO3D,我们排除了字幕并仅包含文本输入中的任务标记。
实验分
-
Text2Image
文本到图像任务的OneDiffusion的定性结果如图3所示。由于我们的One-Gen数据集的多样性,该模型可以处理各种艺术风格,跨越艺术和逼真的设计。继之前的工作 [15] 之后,我们评估了我们的模型在 GenEval 基准 [20] 上的文本到图像能力。对于每个提示,我们使用具有 100 步的欧拉求解器和 5 的引导尺度生成 4 张图像。 OneDiffusion 的结果以及基线模型的结果如表 1 所示。与类似大小的基线相比,我们的模型表现出强大的性能,尽管在相对较小的数据集上进行训练,但在多任务能力方面表现出色。这一性能很大程度上归功于数据集的多样性和每个样本提供的综合字幕。 -
可控图像生成
文本到图像任务的OneDiffusion的定性结果如图3所示。由于我们的One-Gen数据集的多样性,该模型可以处理各种艺术风格,跨越艺术和逼真的设计。继之前的工作 [15] 之后,我们评估了我们的模型在 GenEval 基准 [20] 上的文本到图像能力。对于每个提示,我们使用具有 100 步的欧拉求解器和 5 的引导尺度生成 4 张图像。 OneDiffusion 的结果以及基线模型的结果如表 1 所示。与类似大小的基线相比,我们的模型表现出强大的性能,尽管在相对较小的数据集上进行训练,但在多任务能力方面表现出色。这一性能很大程度上归功于数据集的多样性和每个样本提供的综合字幕。
-
多视角生成
我们使用 **Google Scanned Object 数据集 [13] 评估我们方法的多视图生成能力。**表 2 显示了我们的方法与最先进的方法(包括 Zero123 [32]、Zero123-XL [12] 和 EscherNet [15])的比较。需要注意的是,这些模型是专门为多视图生成任务设计和训练的。相比之下,我们的模型支持可变数量的条件输入,由于其灵活的去噪框架,即使相机姿势未知,也可以合并额外的条件视图。如表2所示,OneDiffusion
图 5 展示了从单个前视图图像生成多视图的两个定性示例。我们的模型成功地在不同的方位角和仰角之间生成了一致的视图。有关额外的可视化,请参阅附录中的图 10 和 11。由于我们框架的灵活性,我们还可以直接执行文本到多视图,通过“屏蔽”所有图像,并且只输入相机姿势,如附录中的图 12 所示
-
ID 保持
我们进一步评估了 ID 定制任务的 OneDiffusion,该任务涉及使用一个或多个 ID 图像作为个性化生成的输入。为了评估性能,我们使用定性和定量分析与 STOA 方法(包括 InstantID [58]、PuLID [21] 和 PhotoMaker [27])进行了比较。我们的评估超出了标准基准(unsplash-50 [16])来测试 ID 定制任务的泛化,例如不同的表达式、视点甚至非人类图像。图 6 说明了改变面部表情和注视方向(第一行)、改变视点(第二行)和定制非人类 ID(第三行)的示例。
-
深度估计
对于图像理解任务,我们使用标准基准评估我们的模型在单目深度估计上的性能:NYUv2 [51] 和 DIODE [56]。我们在表4中报告了定量结果。定量结果如表4所示,与利用预先训练的文本到图像扩散模型(如Marigold[22])的基线相比,我们的模型获得了具有竞争力的性能。然而,如图 7 所示,我们的模型表现出比 Marigold 等基于扩散的深度估计器更强的鲁棒性。具体来说,它擅长处理开放世界图像,包括绘画、朦胧天气和非常规纹理。为了进一步定性比较,请参见图 15 和图 16。
-
相机姿态估计
我们使用 Google Scanned Object 数据集 [13] 在相机位姿估计上评估我们的模型。对于这项任务,我们使用每个合成对象的六个渲染图像,并通过去噪相应的射线嵌入来估计相机姿势。在RayDiffusion[67]之后,我们应用最小二乘优化来估计相机的中心和旋转。表 5 报告了以 0.3 阈值测量的相机中心精度。
图 8 提供了我们的模型和 RayDiffusion 之间的定性比较。由于训练数据的偏差,RayDiffusion 始终预测上半球的相机姿势,例如 CO3D,它主要具有上半球视图。相比之下,由于我们的大规模训练数据集的多样性,OneDiffusion 实现了更高的准确度并避免这个限制。 -
其他任务
由于直接从原始输出图像中提取掩码、边界框和关键点并不简单,我们在附录图17和图18中分别为COCO数据集上的人体姿态估计和语义分割提供了几个定性结果。由于我们的模型在训练期间不区分条件和图像的任务,因此其在理解任务上的性能作为模型的附加指标。我们将对这方面的进一步探索留给未来的工作。
结论
我们的实验表明,OneDiffusion 在各种任务中取得了令人印象深刻的结果,包括条件 T2I 生成、深度估计、开放词汇语义分割、姿势估计、多视图生成、ID 定制和相机位姿估计。我们相信这项工作提高了扩散模型的能力,提供了一种通用且可扩展的解决方案,可与大型语言模型提供的灵活性相媲美。这代表着朝着开发通用视觉模型迈出的重要一步,该模型可以作为各种应用的主干。
附录
数据分布:
更多的结果查看原文吧
相关文章:
【论文阅读笔记】One Diffusion to Generate Them All
One Diffusion to Generate Them All 介绍理解 引言二、相关工作三、方法预备知识训练推理实现细节训练细节 数据集构建实验分结论附录 介绍 Paper:https://arxiv.org/abs/2411.16318 Code:https://github.com/lehduong/onediffusion Authors࿱…...
基于Spring Boot的电影院订票信息管理系统
目录 前言 一、技术栈 二、系统功能介绍 三、核心代码 1、登录模块 2、文件上传模块 3、代码封装 前言 当今社会已经步入了科学技术进步和经济社会快速发展的新时期,国际信息和学术交流也不断加强,计算机技术对经济社会发展和人民生活改善的影响也…...
Easy-Mock前端+后端全解以及详细使用
前文 常见的mock方式 将模拟数据直接写在代码里利用 JavaScript 拦截请求利用 Charles、 Fiddler 等代理工具拦截请求 把模拟的数据写代码里,那是不是每次修改返回数据就要重新部署服务,那有没有不用部署也能改返回参数的东西呢?有&#x…...
【WSL】——wsl安装多个ubuntu
原因:一个库用了GLIBC_2.29,但是我的系统是ubuntu18.04,看样子需要升级glibc,但是升级之后好像会出现崩溃的问题。参考:ubuntu慎重升级glibc。所以那就再安装一个ubuntu22.04吧。 下面介绍通过wsl安装ubuntu18.04&…...
微信小程序从后端获取的图片,展示的时候上下没有完全拼接,有缝隙【已解决】
文章目录 1、index.wxml2、index.js3、detail.detail为什么 .rich-text-style 样式可以生效?1. <rich-text> 组件的特殊性2. 类选择器的作用范围3. 样式优先级4. line-height: 0 的作用5. 为什么直接使用 rich-text 选择器无效? 总结 上下两张图片…...
人工智能大模型LLM开源资源汇总(持续更新)
说明 目前是大范围整理阶段,所以存在大量机翻说明,后续会逐渐补充和完善资料,减少机翻并增加说明。 Github上的汇总资源(大部分英文) awesome-production-machine-learning 此存储库包含一系列精选的优秀开源库&am…...
第二十六章 Spring之假如让你来写事务——初稿篇
Spring源码阅读目录 第一部分——IOC篇 第一章 Spring之最熟悉的陌生人——IOC 第二章 Spring之假如让你来写IOC容器——加载资源篇 第三章 Spring之假如让你来写IOC容器——解析配置文件篇 第四章 Spring之假如让你来写IOC容器——XML配置文件篇 第五章 Spring之假如让你来写…...
介绍一下CSS中伪类和伪元素的概念
一、伪类(Pseudo - Classes) 1. 定义 伪类是添加到选择器的关键字,用于定义元素的特殊状态。这些状态不是由文档树中的结构或属性来表示,而是基于用户行为(如鼠标悬停)、元素状态(如被选中&am…...
Python字符串常用操作
Python字符串常用操作 一、字符串的切片 1.1、通过下标及下标范围取值 my_str myNameIsTaichi value1 my_str[2] # 正向 N value2 my_str[-5] # 反向 从 -1 开始 a字符串分割,语法:string[end: step] start:头下标,以0开…...
解决创建laravel项目,使用国外镜像超时,国内镜像缺包的问题
解决创建laravel项目,使用国外镜像超时,国内镜像缺包的问题 一、前言二、切换镜像三、创建最新版本四、创建指定版本 一、前言 最近想下载 laravel 框架看看,但也遇到了些麻烦,这里做个记录。 二、切换镜像 先查看镜像源&#…...
帝可得-运营管理App
运营管理App Android模拟器 本项目的App客户端部分已经由前端团队进行开发完成,并且以apk的方式提供出来,供我们测试使用,如果要运行apk,需要先安装安卓的模拟器。 可以选择国内的安卓模拟器产品,比如:网…...
印闪网络:阿里云数据库MongoDB版助力金融科技出海企业降本增效
客户背景 上海印闪网络科技有限公司,于2017年1月成立,投资方包括红杉资本等多家国际知名风投公司。公司业务聚焦东南亚普惠金融,常年稳居行业头部。创始团队来自腾讯,中国团队主要由运营、风控及产研人员组成,核心成员…...
c++的应用
整理思维导图周五剩下的三个笔试题利用函数重载,实现对整形数组的冒泡排序,对浮点型数组的冒泡排序整理课上内容在堆区申请一个数组的空间,并完成对该数组中数据的输入和输出,程序结束释放堆区空间 冒泡排序效果图: 代…...
linux网络编程 | c | select实现多路IO转接服务器
select实现多路IO转接服务器 基于该视频完成 15-select实现多路IO转接设计思路_哔哩哔哩_bilibili 通过响应式–多路IO转接实现 文章目录 select实现多路IO转接服务器1.思路&功能2.代码实现warp.hwarp.cmulti_select_sever.c运行图 3.代码解释(细节…...
在Scala中对隐式转换格式与作用
隐式对象 格式:implicit object 作用:给函数的默认参数提供隐式值 object Scala12______10 { // case class DataBase(driver: String, url: String) // // implicit object mySql extends DataBase("mysql", "localhost:300") //…...
贪心算法 - 学习笔记 【C++】
2024-12-09 - 第 38 篇 贪心算法 - 学习笔记 作者(Author): 郑龙浩 / 仟濹(CSND账号名) 贪心算法 学习课程: https://www.bilibili.com/video/BV1f84y1i7mv/?spm_id_from333.337.search-card.all.click&vd_source2683707f584c21c57616cc6ce8454e2b 一、基本…...
【深度学习】深刻理解ViT
ViT(Vision Transformer)是谷歌研究团队于2020年提出的一种新型图像识别模型,首次将Transformer架构成功应用于计算机视觉任务中。Transformer最初应用于自然语言处理(如BERT和GPT),而ViT展示了其在视觉任务…...
安卓低功耗蓝牙BLE官方开发例程(JAVA)翻译注释版
官方原文链接 https://developer.android.com/develop/connectivity/bluetooth/ble/ble-overview?hlzh-cn 目录 低功耗蓝牙 基础知识 关键术语和概念 角色和职责 查找 BLE 设备 连接到 GATT 服务器 设置绑定服务 设置 BluetoothAdapter 连接到设备 声明 GATT 回…...
C++ 异常处理机制与自定义异常体系
目录 1.C语言传统的处理错误的方式 ?? 1. 终止程序 2. 返回错误码 3.实际使用中的情况 2. C异常概念?? 2.1 C异常的基本概念 2.2异常的抛出和匹配原则 2.3?异常的重新抛出 2.4 异常安全 2.5 异常规范 3. 自定义异常体系 ??? 3.1??自定义异常类 3.2??自…...
【动态库.so | 头文件.hpp】基于CMake与CMakeList编写C++自定义库
前言 最近比较忙,其他系列教程得等到年后一起更!请大家多多包涵!!相信各位在配置C环境和各类库的时候一定经常看到如下小连招 git clone https://github.com/opencv/opencv.git cd opencv mkdir build && cd build cma…...
三、nginx实现lnmp+discuz论坛
lnmp l:linux操作系统 n:nginx前端页面 m:mysql数据库,账号密码,数据库等等都保存在这个数据库里面 p:php——nginx擅长处理的是静态页面,页面登录账户,需要请求到数据库&#…...
OpenCV相机标定与3D重建(15)计算给定图像点对应的极线(epipolar lines)函数computeCorrespondEpilines()的使用
操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 计算给定图像点对应的极线(epipolar lines)。 对于立体图像对中一个图像的点,计算这些点在另一个图像中对应的…...
【MySQL 进阶之路】了解 性能优化 与 设计原则
1.B树的优势 “矮胖”结构: 矮:B树的每个节点存储更多的关键字,从而减少了树的层级(最多三层),减少了磁盘I/O操作,提高了查询效率。胖:叶子节点存储实际的数据,并使用双…...
【银河麒麟高级服务器操作系统】修改容器中journal服务日志存储位置无效—分析及解决方案
了解更多银河麒麟操作系统全新产品,请点击访问 麒麟软件产品专区:https://product.kylinos.cn 开发者专区:https://developer.kylinos.cn 文档中心:https://documentkylinos.cn 服务器环境以及配置 【机型】 整机类型/架构&am…...
轻量级的 HTML 模板引擎
Mustache 简介:Mustache 是一个非常简单的逻辑少的模板引擎,支持 HTML 文件中的占位符替换。它不会执行复杂的逻辑,只支持简单的变量替换。 安装: npm install mustache示例: const Mustache require(mustache);c…...
SQL 查询秘籍:提升你数据库技能的实用指南
目录 一、常用表表达式(CTEs) (一)快速了解 (二)上手演练 练习一:使用 CTE 来分解一般查询逻辑 练习二:使用 CTE 来分解复杂的查询逻辑 二、递归CTEs (一…...
Unity背包道具拖拽(极简版实现)
(感觉Csdn代码页面可以再大一点或者加个放大功能 不然得划着看不太舒服) 1.关键接口,三个拖拽相关的 2.关键参数,PointerEventData 一直没仔细看过,其实有包含鼠标相关的很多参数,鼠标点击次数ÿ…...
Vins_Fusion_gpu中source setup.bash
文章目录 source setup.bashsetup.bashsetup.sh脚本的主要功能脚本的详细解释1. **初始化和检查**2. **检测操作系统**3. **设置环境变量**4. **记住 shell 类型**5. **调用 Python 脚本生成环境变量**6. **加载环境钩子**7. **清理** 总结 _setup_util.py_setup_util.py 的完整…...
appium学习之二:adb命令
1、查看设备 adb devices 2、连接 adb connect IP:端口 3、安装 adb install xxx.apk 4、卸载 adb uninstall 【包名】 5、把对应目录下的1.txt文件传到手机sdcard下 adb push 1.txt /sdcard 6、进入对应的设备里 adb shell 7、切入sdcard目录 cd /sdcard 8、ls 查…...
Docker 安装 sentinel
Docker 安装系列 1、拉取 [rootTseng ~]# docker pull bladex/sentinel-dashboard Using default tag: latest latest: Pulling from bladex/sentinel-dashboard 4abcf2066143: Pull complete 1ec1e81da383: Pull complete 56bccb36a894: Pull complete 7cc80011dc6f: Pull…...
selinux
项目使用: neverallow 报错: 改法:typeattribute system_server system_writes_mnt_vendor_violators; selinux目录: Android/lagvm/LINUX/android/device/qcom/sepolicy_vndr Android/lagvm/LINUX/android/vendor/jidu/sepoli…...
C++11新特性之线程std::atomic
C std::atomic C 中 std::atomic 的定义及功能 std::atomic 是 C 标准库中提供的一种模板类,主要用于实现 原子操作,以保证多线程环境下对共享变量的安全操作。它提供了一种无需使用互斥锁即可安全访问共享数据的机制,避免了竞争条件。 特…...
MySQL中的通配符
1. 百分号 % 内部工作原理: 代表零个、一个或多个任意字符。LIKE A%:MySQL会从索引(如果存在)中查找所有以 "A" 开头的记录。如果没有索引,则需要扫描整个表。MySQL解析器将模式转换为可执行的形式&#x…...
【ETCD】【源码阅读】stepWithWaitOption方法解析
在分布式系统中,ETCD 作为一个强一致性、高可用的 key-value 存储系统,广泛应用于服务发现、配置管理等场景。ETCD 在内部采用了 Raft 协议来保证集群的一致性,而日志预提案(log proposal)是 Raft 协议中至关重要的一部…...
F12抓包01:启动、面板功能介绍、语言设置、前端样式调试
浏览器检查工具通常用来作为浏览器web服务测试过程中,辅助测试、排查问题、定位缺陷的工具。 本文以mac系统下,当前比较常用的Chrome浏览器为例,讲解“检查”工具的常用功能操作方法。 一、打开方式 **1、****鼠标操作:**浏览器…...
用前端html如何实现2024烟花效果
用HTML、CSS和JavaScript编写的网页,主要用于展示“2024新年快乐!”的文字形式烟花效果。下面是对代码主要部分的分析: HTML结构 包含三个<canvas>元素,用于绘制动画。引入百度统计的脚本。 CSS样式 设置body的背景为黑…...
Maven学习(传统Jar包管理、Maven依赖管理(导入坐标)、快速下载指定jar包)
目录 一、传统Jar包管理。 (1)基本介绍。 (2)传统的Jar包导入方法。 1、手动寻找Jar包。并放置到指定目录下。 2、使用IDEA的库管理功能。 3、配置环境变量。 (3)传统的Jar包管理缺点。 二、Maven。 &#…...
mac电脑吧iso文件制作成u盘启动
1 查看u盘的具体路径 diskutil list 根据容量确认路径 /dev/disk2 2、卸载u盘 diskutil unmountDisk /dev/disk2 3、把iso文件写入u盘 sudo dd if/Users/dengjinshan/Downloads/Win11_24H2_Chinese_Simplified_x64.iso of/dev/disk2 bs1m 4、弹出u盘 diskutil eject /dev/dis…...
MySQL数据库的数据类型
个人主页:C忠实粉丝 欢迎 点赞👍 收藏✨ 留言✉ 加关注💓本文由 C忠实粉丝 原创 MySQL数据库的数据类型 收录于专栏[MySQL] 本专栏旨在分享学习MySQL的一点学习笔记,欢迎大家在评论区交流讨论💌 目录 数据类型分类 …...
【golang】匿名内部协程,值传递与参数传递
代码例子 下面代码的区别是直接调用循环变量,这里使用的就是这个变量的引用,而不是将参数的副本传递给协程执行 for task : range taskChan {wg.Add(1)go func() {defer wg.Done()task.Do() // 使用外部循环变量}() }func DistributeTasks(taskChan &…...
ByteByteGo-Top 9 HTTP Request Methods 9种HTTP请求方法
更详细准确的描述直接参考 https://developer.mozilla.org/zh-CN/docs/Web/HTTP/Methods/CONNECT 本片文章出自 EP85: Top 9 HTTP Request Methods - ByteByteGo Newsletter http request methods 1,GET 从服务器获取资源。 具有幂等性(idempo…...
vue3实际案例分析:展示Vue拖拽功能的实现和效果
在现代前端开发中,交互式的用户界面是提升用户体验的关键因素之一。Vue.js,作为一个渐进式JavaScript框架,提供了灵活的组件系统和响应式数据绑定,使得实现复杂的用户交互变得简单。拖拽功能是其中一个常见的交互模式,…...
EasyExcel使用管道流连接InputStream和OutputStream
前言 Java中的InputSteam 是程序从其中读取数据, OutputSteam是程序可以往里面写入数据。 如果我们有在项目中读取数据库的记录, 在转存成Excel文件, 再把文件转存到OSS中。 生成Excel使用的是阿里的EasyExcel 。 他支持Output的方式写出文件内容。 而…...
源码分析之Openlayers中的ZoomToExtent控件
概述 在 Openlayers 中,ZoomToExtent控件可能用的不是很多,它主要用于将地图视图缩放到指定范围,应用场景就是重置地图、恢复初始状态。但是一般情况下,重置地图可能还会有其它操作,比如清除地图上绘制的点线面或者显…...
Acwing 算法基础课 数学知识 线性筛
线性筛素数 也叫欧拉筛。 int pr[maxn]; bool flg[maxn]; int main() {for (int i 2; i < maxn; i) {if (!flg[i]) pr[pr[0]] i;for (int j 1; i * pr[j] < n && j < pr[0]; j) {flg[i * pr[j]] 1;if (i % pr[j] 0) break; // 重点}} }这样筛的话&…...
K8s驱逐阈值调整
要在 Kubernetes 中调整 kubelet 驱逐阈值,特别是针对 imagefs 和 nodefs 的大小阈值,你可以通过修改 kubelet 的启动参数来实现。这些参数定义了在触发 Pod 驱逐之前,节点上的资源使用情况必须满足的硬性条件。 根据你提供的文件内容&#…...
【密码学】BUUCTF Crypto 1 - 12 题 WriteUp
今天,我在 BUUCTF 网站的 crypto section 开启了一场充满挑战的密码学之旅。 这次我一口气完成了 12 个板块的任务,虽然耗时较长,但每一次解密成功的瞬间都让我无比满足,那种沉浸在密码世界里的感觉真的很棒。 接下来࿰…...
【文献阅读】使用深度语音后验改进独立于说话者的构音障碍可懂度分类
原文名称: IMPROVED SPEAKER INDEPENDENT DYSARTHRIA INTELLIGIBILITY CLASSIFICATION USING DEEPSPEECH POSTERIORS 本文探讨了利用DeepSpeech后验概率改进说话人无关的构音障碍可理解性分类方法。作者提出了一个基于DeepSpeech(一种端到端的语音转文本引擎)输出的新特征集…...
Image Stitching using OpenCV
文章目录 简介图像拼接管道特征检测和提取特征检测特征提取 特征匹配强力匹配FLANN(近似最近邻快速库)匹配 单应性估计扭曲和混合结论 使用opencv进行图像拼接 原为url: https://medium.com/paulsonpremsingh7/image-stitching-using-opencv-a-step-by-s…...
如何将CSDN的文章保存为PDF?
目录 1、打开CSDN文章2、按F12或者鼠标右键选择检查并进入控制台3、在控制台输入以下代码4、然后回车(Enter)如果纵向显示不全就横向 1、打开CSDN文章 2、按F12或者鼠标右键选择检查并进入控制台 3、在控制台输入以下代码 (function(){ $("#side&q…...