Social GAN(CVPR2018)
文章目录
- Abstract
- Introduction
- Related Work
- Human-Human Interaction
- RNNs for Sequence Prediction
- Generative Modeling
- Method
- Problem Definition
- Generative Adversarial Networks
- Socially-Aware GAN
- Pooling Module
- Encouraging Diverse Sample Generation
- Conclusion
paper
Abstract
理解人类的运动行为对于自主移动平台(如自动驾驶汽车和社交机器人)来说是至关重要的,如果它们要在以人为中心的环境中导航的话。这是具有挑战性的,因为人类的运动本质上是多模态的:考虑到人类运动路径的历史,有许多社会上合理的方式,人们可以在未来移动。我们通过结合序列预测和生成对抗网络的工具来解决这个问题:一个循环的序列到序列模型-服务于运动历史并预测未来行为,使用新的池化机制来聚合人们之间的信息。我们预测社会合理的未来,通过训练和普遍反对一个循环的鉴别器,并鼓励多样化的预测与一个新的多样性损失。通过对多个数据集的实验,我们证明了我们的方法在准确性、多样性、避免碰撞和计算复杂性方面优于先前的工作。
Introduction
预测行人的运动行为对于自动驾驶汽车或社交机器人等自动移动平台至关重要,因为它们将与人类共享相同的生态系统。人类可以有效地处理复杂的社会互动,这些机器应该也能做到这一点。为此目的,一个具体而重要的任务如下:给定观察到的行人的运动轨迹(例如过去的坐标3.2秒),预测所有可能的未来轨迹。
由于人类在拥挤场景中运动的固有特性,预测人类的行为是具有挑战性的:
人际关系:每个人的动作都取决于周围的人。在人群中穿行时,人类天生具有解读他人行为的能力。联合建模这些依赖关系是一个挑战
社会可以接受的:有些轨迹在物理上是可能的,但在社会上是不可接受的。行人受社会规范的约束,比如让行权或尊重个人空间。将它们形式化并非易事。
多模式的:考虑到部分历史,没有单一正确的未来预测。多种发展轨迹是可行的,也是社会可以接受的。
轨迹预测方面的开创性工作已经解决了上述一些挑战。人际关系方面已经通过基于手工特征的传统方法得到了详尽的解决[2,17,41,46]。最近,基于循环神经网络(RNNs)的数据驱动技术重新审视了社会可接受性[1,28,12,4]。最后,该问题的多模式方面已经在给定静态场景的路线选择背景下进行了研究(例如,在十字路口走哪条街道[28,24])。Robicquet等人的研究表明,在拥挤的场景中,行人有多种导航风格,分别是温和的导航风格和激进的导航风格。因此,预测任务需要输出不同的可能结果。
虽然现有的方法在应对特定挑战方面取得了很大的进步,但它们有两个局限性。首先,在进行预测时,他们对每个人周围的当地社区进行建模。因此,它们没有能力以计算效率高的方式模拟场景中所有人之间的交互。其次,他们倾向于学习“平均行为”,因为常用的损失函数最小化了真实值和预测输出之间的欧氏距离。相反,我们的目标是学习多种“良好行为”,即多种社会可接受的轨迹。
为了解决以往工作的局限性,我们建议利用生成模型的最新进展。生成对抗网络(generative Adversarial Networks, GANs)是近年来为了克服难以处理的概率计算和行为推断等问题而发展起来的。虽然它们已经被用来产生照片般的信号,如图像[34],但我们建议使用它们来生成多个社会可接受的轨迹,给定一个观察到的过去。一个网络(生成器)生成候选对象,另一个(鉴别器)评估它们。对抗性损失使我们的预测模型能够超越L2损失的限制,并有可能学习可以欺骗鉴别器的“好行为”的分布。在我们的工作中,这些行为被称为拥挤场景中社会接受的运动轨迹。
我们提出的GAN是一个RNN编码器-解码器生成器和一个基于RNN的编码器鉴别器,具有以下两个新颖之处:(i)我们引入了各种损失,这鼓励我们的GAN的生成网络扩展其分布并覆盖可能路径的空间,同时与观察到的输入一致。(ii)我们提出了一种新的池化机制,该机制学习了一个“全局”池化向量,该向量编码了场景中所有人的微妙线索。我们把我们的模型称为“社交GAN”。通过对几个公开可用的现实世界人群数据集的实验,我们展示了最先进的准确性和速度,并证明我们的模型有能力生成各种社会可接受的轨迹。
Related Work
预测人类行为的研究可以分为学习预测人与空间的相互作用或学习预测人与人的相互作用。前者学习特定场景的运动模式[3,9,18,21,24,33,49]。后者模拟场景的动态内容,即行人如何相互作用。我们的工作重点是后者:学习预测人与人之间的互动。我们讨论了该主题的现有工作,以及RNN用于序列预测和生成模型的相关工作。
Human-Human Interaction
人类行为在宏观模型中从群体角度进行了研究,在微观模型中从个体角度进行了研究(这是我们工作的重点)。微观模型的一个例子是Helbing和Molnar的社会力量模型,该模型用引导他们走向目标的吸引力和鼓励避免碰撞的排斥力来模拟行人的行为。在过去的几十年里,这种方法经常被重新审视[5,6,25,26,30,31,36,46]。经济学中流行的工具也被使用,如Antonini等人的离散选择框架。Treuille等人[42]使用连续统动力学,Wang等人[44],Tay等人[41]使用高斯过程。这些函数也被用于研究平稳群[35,47]。然而,所有这些方法都使用基于相对距离和特定规则的手工制作的能量势。相比之下,在过去两年中,基于rnn的数据驱动方法已经被用来超越上述传统方法。
RNNs for Sequence Prediction
递归神经网络是一类丰富的动态模型,它扩展了前馈网络在不同领域的序列生成,如语音识别[7,8,15]、机器翻译[8]和图像字幕[20,43,45,39]。然而,它们缺乏高层次和时空结构[29]。已经有几次尝试使用多个网络来捕获复杂的相互作用[1,10,40]。Alahi等人使用一个社会池化层来模拟附近的行人。在本文的其余部分中,我们证明了使用多层单ceptron (MLP)和最大池化在计算上更有效,并且与[1]的社会池化方法一样或更好。Lee等人介绍了一种使用变分自编码器(VAE)进行轨迹预测的RNN编码器-解码器框架。然而,他们并没有模拟拥挤场景中人与人之间的互动。
Generative Modeling
像变分自编码器[23]这样的生成模型是通过最大化训练数据似然的下界来训练的。Goodfellow等人提出了一种替代方法,生成广告对抗网络(GANs),其中训练过程是生成模型和判别模型之间的极大极小博弈;这克服了近似难以处理的概率计算的困难。生成模型在超分辨率[27]、图像到图像转换[19]和图像合成[16,34,48]等任务中显示出有希望的结果,这些任务对于给定的输入具有多个可能的输出。然而,它们在序列生成问题(如自然语言处理)中的应用滞后,因为从这些生成的输出中采样以馈给鉴别器是一个不可微的操作。
Method
人类拥有一种直觉能力,能够在人群中穿行,并考虑到周围的人。我们计划我们的路径,牢记我们的目标,同时也考虑到周围的人的运动,如他们的运动方向,速度等。然而,在这种情况下,通常存在多种可能的选择。我们需要的模型不仅能够理解这些复杂的人类相互作用,而且能够捕捉到各种各样的选择。目前的方法侧重于预测平均未来轨迹,这将使与地面真实未来轨迹的L2距离最小化,而我们想要预测多个“好”轨迹。
Problem Definition
我们的目标是共同推理和预测一个场景中所有智能体的未来轨迹。我们假设我们接收到一个场景中所有人的轨迹作为输入,X = X1,X2,…, Xn,并预测未来的轨迹Y´= Y´1,Y´2,…所有的人同时在一起。从时间步长t =1,…开始,人i的输入轨迹定义为Xi =(xti, yti)。, tobs和未来轨迹(地面真相)可以类似地定义为Yi =(xti, yti),从时间步长t = tobs +1,…, tpr。我们用i表示预测。
Generative Adversarial Networks
生成对抗网络(generative Adversarial Network, GAN)由两个相互对立训练的神经网络组成。两个对抗性训练模型是:捕获数据分布的生成模型G和估计样本来自训练数据而不是G的概率的判别原生模型D。生成器G将潜在变量z作为输入,并输出样本G(z)。鉴别器D以一个样本x作为输入,输出D(x)表示它是实数的概率。训练过程类似于二人最小最大博弈,目标函数如下:
GANs可以通过向生成器和鉴别器同时提供额外输入c来用于条件模型,从而产生G(z, c)和D(x, c)[13,32]。
Socially-Aware GAN
正如第1节所讨论的,轨迹预测是一个多模态问题。生成模型可以用时间序列数据来模拟可能的未来。我们利用这一见解设计了使用gan解决多模态问题的SGAN(见图2)。我们的模型由三个关键组件组成:生成器(G)、池化模块(PM)和鉴别器(D)。G基于编码器-解码器框架,我们通过PM将编码器和解码器的隐藏状态连接起来。G以Xi作为输入,输出预测轨迹yi。D输入包含输入轨迹Xi和未来预测Yi(或Yi)的整个序列,并将它们分类为“真实/虚假”。
系统概述。我们的模型由三个关键组件组成:生成器(G)、池化模块和鉴别器(D)。G将过去的轨迹Xi作为输入,并将人i的历史编码为Hit。池化模块将所有Htobs i作为输入,并为每个人输出一个池化向量Pi。解码器根据Htobs i和Pi生成未来的轨迹。D将Treal或Tfake作为输入,并将它们分类为社会可接受或不可接受(参见图3中的PM)。
Generator。我们首先使用单层MLP嵌入每个人的位置以获得固定长度的向量eti。这些嵌入被用作编码器在时刻t的LSTM单元的输入,引入以下递归式:
其中φ(·)为具有ReLU非线性的嵌入函数,Wee为嵌入权值。LSTM的权重(Wencoder)在一个场景中的所有人之间共享。
Na¨ıve每个人使用一个LSTM无法捕捉人与人之间的互动。编码器学习每个人的状态并存储他们的运动历史。然而,正如Alahi等人所表明的那样,我们需要一个紧凑的表示,它结合了来自不同编码器的信息,以有效地推断社会互动。在我们的方法中,我们通过池化模块(Pooling Module, PM)对人与人之间的交互进行建模。之后,我们汇总场景中所有人的隐藏状态,为每个人获得一个汇总的张量Pi。传统上,gan作为输入噪声并生成样本。我们的目标是创造与过去一致的未来情景。为了实现这一点,我们通过初始化解码器的隐藏状态来约束输出轨迹的生成:
其中γ(·)为具有ReLU非线性的多层感知器(MLP), Wc为嵌入权值
关于轨迹预测,我们在两个重要方面偏离了先前的工作:先前的工作[1]使用隐藏状态来预测二元高斯分布的参数。然而,这给不可微情况下通过采样反向传播的训练过程带来了困难。我们通过直接预测坐标(x_i, x_i)来避免这种情况。•“社交”上下文通常作为输入提供给LSTM单元[1,28]。相反,我们只提供一次池上下文作为解码器的输入。这也为我们提供了在特定时间步长选择池的能力,与S-LSTM[1]相比,速度提高了16倍(见表2)。在如上所述初始化解码器状态后,我们可以得到如下预测:
其中φ(·)是一个具有ReLU非线性的嵌入函数,以Wed为嵌入权值。LSTM的权重用Wdecoder表示,γ是一个MLP。
Discriminator:鉴别器由一个单独的编码器组成。具体来说,它将Treal =[Xi,Yi]或Tfake =[Xi,Y´i]作为输入,并将它们分类为真假。我们对编码器的最后一个隐藏状态应用aMLP来获得分类分数。理想情况下,鉴别器将学习微妙的社会互动规则,并将不被社会接受的轨迹分类为“假”。
Loss:除了对抗损失,我们还在预测轨迹上应用L2损失,它测量生成的样本与实际地面真相的距离。
Pooling Module
为了跨多人进行联合推理,我们需要一种跨lstm共享信息的机制。然而,有几个挑战,一个方法应该解决:
场景中可变且(可能)大量的人。我们需要一种紧凑的表达方式,把所有人的信息结合起来。
分散的人际互动。当地的信息并不总是充分的。远处的行人可能会互相碰撞。因此,网络需要对全局配置进行建模。
社会池化[1]通过提出基于网格的池化方案解决了第一个问题。然而,这种手工制作的解决方案很慢,无法捕捉全局上下文。Qi et al.[37]表明,可以通过对输入点集合的变换元素应用学习的对称函数来实现上述性质。如图2所示,这可以通过通过MLP传递输入坐标,然后通过对称函数(我们使用Max-Pooling)来实现。集合向量Pi需要总结一个人做出决定所需的所有信息。由于我们使用相对坐标来实现平移不变性,因此我们将每个人相对于人i的相对位置增加到池化模块的输入。
Encouraging Diverse Sample Generation
轨迹预测是具有挑战性的,因为给定有限的过去历史,一个模型必须对多种可能的结果进行推理。到目前为止所描述的方法产生了很好的预测,但是这些预测试图在可能有多个输出的情况下产生“平均”预测。此外,我们发现输出对噪声的变化不是很敏感,并且产生了非常相似的预测。我们提出了一个多样性损失函数,鼓励网络产生不同的样本。对于每个场景,我们通过从N(0,1)中随机抽样z并选择L2意义上的“最佳”预测作为我们的预测,生成k个可能的输出预测。k is a hyperparameter.
通过只考虑最佳轨迹,这种损失鼓励网络对冲其赌注,并覆盖符合过去轨迹的输出空间。这种损失在结构上类似于最小/ N (MoN)损失[11],但据我们所知,这还没有被用于gan的背景下,以鼓励生成样本的多样性。
Conclusion
在这项工作中,我们解决了人与人之间互动的建模问题,并共同预测场景中所有人的轨迹。我们提出了一种新的基于GAN的编码器-解码器框架,用于捕获未来预测问题的多模态。我们还提出了一种新的池化机制,使网络能够以纯数据驱动的方式学习社会规范。为了鼓励预测样本之间的多样性,我们提出了简单的多样性损失,它与池化层相结合,鼓励网络产生全局一致的、具有社会适应性的多样化样本。我们在几个必须遵守社会规范的复杂现实场景中展示了我们的方法的有效性。
相关文章:
Social GAN(CVPR2018)
文章目录 AbstractIntroductionRelated WorkHuman-Human InteractionRNNs for Sequence PredictionGenerative Modeling MethodProblem DefinitionGenerative Adversarial NetworksSocially-Aware GANPooling ModuleEncouraging Diverse Sample Generation Conclusion paper Ab…...
0201线性回归-机器学习-人工智能
文章目录 1 程序目标2 代码实现3 关键步骤解释4 示例输出5 注意事项结语 以下是一个使用 scikit-learn、pandas和 matplotlib 实现线性回归的完整程序示例。程序包含数据加载、模型训练、预测和可视化。 1 程序目标 加载数据(使用 pandas)数据预处理&am…...
2-Visual Studio 2022 NET开发Windows桌面软件并连接SQL Server数据库
引言 今天尝试Visual Studio 2022 NET开发一个NET桌面软件,并尝试连接SQL Server的数据库,此文章为开发笔记。 --------------------------------------------------------------------------------------------------------------------------------- …...
OpenGL学习笔记(简介、三角形、着色器、纹理、坐标系统、摄像机)
目录 简介核心模式与立即渲染模式状态机对象GLFW和GLAD Hello OpenGLTriangle 三角形顶点缓冲对象 VBO顶点数组对象 VAO元素缓冲对象 EBO/ 索引缓冲对象 IEO 着色器GLSL数据类型输入输出Uniform 纹理纹理过滤Mipmap 多级渐远纹理实际使用方式纹理单元 坐标系统裁剪空间 摄像机自…...
第二十九章:Python-mahotas库:图像处理的高效工具
一、mahotas库简介 mahotas是一个功能强大的Python图像处理库,提供了丰富的图像处理算法和工具,包括图像分割、特征提取、滤波、形态学操作等。它以简洁的API和高效的性能著称,特别适合处理大型图像。资源绑定附上完整资料供读者参考学习&…...
【网络安全】 防火墙技术
防火墙是网络安全防御的重要组成部分,它的主要任务是阻止或限制不安全的网络通信。在这篇文章中,我们将详细介绍防火墙的工作原理,类型以及如何配置和使用防火墙。我们将尽可能使用简单的语言和实例,以便于初学者理解。 一、什么…...
关于Linux系统安装和优化的教程
书籍教程 《Linux 就该这么学》:涵盖多种 Linux 发行版的安装知识,从安装前硬件检测(如硬盘容量需至少 10GB、内存至少 2GB )、软件源选择,到安装步骤(如镜像烧录、启动设置、分区操作 )都有详…...
还是主题混合程序设计
以下是针对您现有代码的完整主题化改造方案,实现跨QML/Qt Widgets的阴影主题系统: 一、主题管理系统核心 // thememanager.h #pragma once #include <QObject> #include <QColor> #include <QMap> #include <QQmlEngine>class…...
【FPGA开发】利用状态机思想点亮流水灯/初学hdlbitsFPGA教程网站
一、状态机思想介绍 状态机是一种用于描述系统行为的形式化模型,它将系统抽象为有限的状态,并通过状态转移来响应外部输入或事件。其核心思想是:系统在任何时刻只处于一个确定的状态,且在不同状态之间按规则切换。状态机是处理明…...
洛谷 P3214 [HNOI2011] 卡农
题目传送门 前言 再次败在 d p dp dp 手下,但是数据范围这么小应该是可以看出是 d p dp dp 的(毕竟对于其他组合数的问题数据范围都是 1 0 9 10^9 109 起步)。 思路 题意简化 现有 1 , 2 , 3 , . . . , n − 1 , n 1, 2, 3, ... , n -…...
智能体和RPA都需要程序思维,如何使用影刀的变量?
欢迎来到涛涛聊AI, 不管AI还是RPA,都需要用到编程思想才能完成批量工作。今天研究了下影刀的变量。 变量类型 根据变量值选择相应的类型,可选择任意一种影刀所支持的数据类型 变量值 指定变量中保存的值,会根据不同的类型设置…...
使用OpenFeign实现服务远程调用
在微服务架构中,由于业务功能的分工不同,我们把项目拆分为多个独立的服务,并常常将其部署在不同的服务器上,这个时候如果服务A的某个功能需要借助服务B来实现,那么这个时候如何去调用就成了问题,目前有一种…...
【移动计算】:AndroidStudio安装和项目搭建【2019:版本3.5.2】
文章目录 1. 下载安装包2. 安装包安装2.1 运行完exe进行安装选择Cancel: Unable SdkInstall Type选择Custom可以选择更新最新版本:这里不选择点击Next勾选 Android Sdk Platform API 虚拟设备选项显示已安装否则也需要勾选设置自定义安装地址:…...
泡棉压缩对显示模组漏光的定位分析及论述
■背景 液晶LCD受到外力或者挤压后,比较容易出现漏光现象即显示mura。一般从结构设计的角度会做如下措施进行整改 1>控制背光和上铁框平整度 ; 2>合理设计液晶模组的厚度和边框大小 ; 3>承载液晶面板的泡棉选取 ; 4>FPC单双层区的设计 ; 5>合理…...
当AI助理接管云计算-走向智能运维的新时代
目录 时代背景 AI在云计算运维上的帮助 新时代产物:WatchAlert 新时代思考 时代背景 代理人工智能:自主决策的未来--Gartner2025十大顶级科技预测第一名 Gartner将代理人工智能列为2025年的顶级技术趋势。该技术通过快速分析用于药物发现的海量数据…...
Day2:前端项目uniapp壁纸实战
先来做一个轮番图。 效果如下: common-style.css view,swiper,swiper-item{box-sizing: border-box; } index.vue <template><view class"homeLayout"><view class"banner"><swiper circular indicator-dots autoplay…...
使用人工智能大模型DeepSeek,如何进行论文润色和去重?
今天我们学习人工智能,如何协助我们进行论文润色和去重。手把手的学习视频地址请访问https://edu.csdn.net/learn/40402/666422 第一步在腾讯元宝对话框中输入如何协助老师做论文润色,通过提问,我们了解了老师写论文润色的步骤和建议。润色的…...
为招聘推荐系统进行相应修改的 Python 实现方案(含协同过滤推荐算法)
下面是为招聘推荐系统进行相应修改的 Python 实现方案。首先是创建数据分析看板,这里借助 Streamlit 库来实现可视化;其次是将协同过滤推荐算法和其他算法(这里采用基于内容的推荐算法)结合,以此提升推荐效果。 impor…...
Spring Boot中自定义注解的创建与使用
🌟 前言 欢迎来到我的技术小宇宙!🌌 这里不仅是我记录技术点滴的后花园,也是我分享学习心得和项目经验的乐园。📚 无论你是技术小白还是资深大牛,这里总有一些内容能触动你的好奇心。🔍 &#x…...
算法思想之双指针(二)
欢迎拜访:雾里看山-CSDN博客 本篇主题:算法思想之双指针二) 发布时间:2025.4.5 隶属专栏:算法 目录 双指针算法介绍对撞指针:快慢指针: 例题有效三角形的个数题目链接题目描述算法思路代码实现 查找总价格为…...
MySQL基础 [一] - 数据库基础
目录 什么是数据库 站在服务器角度理解 站在用户角度理解 为什么不直接使用文件存储呢? 主流数据库 MySQL的基本使用 数据库的使用样例 服务器管理 服务器数据库表之间的关系 MySQL的架构 MySQL语句分类 存储引擎 查看存储引擎 存储引擎对比 什么…...
智能合约的法律挑战与解决之道:技术与法律的交融
智能合约的法律挑战与解决之道:技术与法律的交融 智能合约的诞生,为区块链技术的应用打开了新的大门。从简单的自动化交易到复杂的去中心化自治组织(DAO),智能合约正在推动全球经济迈向去信任化的新时代。然而&#x…...
MySQL基础 [一] - Ubuntu版本安装
目录 预安装 先查看自己操作系统的版本 添加MySQL APT下载源 下载 安装 正式安装 查看MySQL状态 打开MySQL 预安装 先查看自己操作系统的版本 lsb_release -a 添加MySQL APT下载源 下载 下载发布包 下载地址 : https://dev.mysql.com/downloads/repo/apt/ 这里下…...
cursor机器码重置
1、下载vscode插件 cursor-fake-machine-0.0.2 2、将插件拖入拓展 3、彻底将cursor账号退出 setting -> Manage -> 退出账号 4、打开cursor,ctrlshiftp ,输入fake,点击确定...
深度学习的疑问--综合【2】:像CNN,GNN,transformer等这些模型都是用于提取特征,然后经过全连接层实现分类的吗?
总结: CNN,GNN,transformer等这些模型都是用于提取特征;FC、MLP等用于实现分类,MLP即是多个FC组成的。 是的,从高层次来看,CNN(卷积神经网络)、GNN(图神经网络…...
基于编程的运输设备管理系统设计(vue+springboot+ssm+mysql8.x)
基于编程的运输设备管理系统设计(vuespringbootssmmysql8.x) 运输设备信息管理系统是一个全面的设备管理平台,旨在优化设备管理流程,提高运输效率。系统提供登录入口,确保只有授权用户可以访问。个人中心让用户可以查…...
SpringBoot整合MyBatis
一、SpringBoot整合MyBatis 步骤1:创建新模块,选择Spring初始化,并配置模块相关基础信息 步骤2:选择当前模块需要使用的技术集(MyBatis、MySQL) 步骤3:设置数据源参数 spring:datasource:dr…...
kali——masscan
目录 前言 使用方法 前言 Masscan 是一款快速的端口扫描工具,在 Kali Linux 系统中常被用于网络安全评估和渗透测试。 使用方法 对单个IP进行端口扫描: masscan -p11-65535 192.168.238.131 扫描指定端口: masscan -p80,22 192.168.238.131…...
数字化转型中的开源AI智能客服与S2B2C商城小程序的融合创新
摘要 数字经济时代,企业需通过技术重构用户交互与供应链体系。本文以“开源AI智能客服”“AI智能名片”及“S2B2C商城小程序”为核心,研究三者如何通过技术协同与场景化应用实现企业营销、客户服务与供应链管理的智能化升级。通过案例分析、技术架构设…...
2-Docker常用命令
1. Docker 帮助启动类命令 1.1 启动 docker: systemctl start docker [rootlocalhost ~]# systemctl start docker1.2 停止 docker: systemctl stop docker [rootlocalhost ~]# systemctl stop docke1.3 重启 docker: systemctl restart d…...
理解OSPF 特殊区域NSSA和各类LSA特点
本文基于上文 理解OSPF Stub区域和各类LSA特点 在理解了Stub区域之后,我们再来理解一下NSSA区域,NSSA区域用于需要引入少量外部路由,同时又需要保持Stub区域特性的情况 一、 网络总拓扑图 我们在R1上配置黑洞路由,来模拟NSSA区域…...
Chapter01_绪论
文章目录 数字图像处理导论⭐图像的分类数字图像处理的概念(狭义)⭐数字图像处理的基本特征图像分析 ⭐数字图像处理的组成⭐数字图像处理研究的基本内容 数字图像处理导论 ⭐图像的分类 模拟图像:二维空间和亮度值都是连续(值&a…...
SDL显示YUV视频
文章目录 1. **宏定义和初始化**2. **全局变量**3. **refresh_video_timer 函数**4. **WinMain 函数**主要功能及工作流程:总结: 1. 宏定义和初始化 #define REFRESH_EVENT (SDL_USEREVENT 1) // 请求画面刷新事件 #define QUIT_EVENT (SDL…...
频域滤波函数 To 空域冲激响应函数
从频域滤波函数 H ( u , v ) H(u, v) H(u,v)到空域冲激响应函数 h ( x , y ) h(x, y) h(x,y)的变换。 不是冈萨雷斯这么简单的IDFT,有两次移位。这么费劲是因为DFT定义在第一象限。而且要求滤波器的尺寸为奇数,零的个数没有影响。 逆中心移位变换&…...
【C++】C++11<包装器没写>
文章目录 一、初始化列表的统一1.列表初始化2.initializer_list 二、声明1.auto2.decltype3.nullptr 三、范围for四、智能指针五、STL中的变化1.新容器arrayforward_list 2.接口 六、右值引用1.左值引用和右值引用2.右值引用的使用场景和意义3.左值引用和右值引用的价值和场景4…...
《如何避免虚无》速读笔记
文章目录 书籍信息概览躺派(出世)卷派(入世)虚无篇:直面虚无自我篇:认识自我孤独篇:应对孤独幸福篇:追寻幸福超越篇:超越自我 书籍信息 书名:《如何避免虚无…...
【微机及接口技术】- 第四章 内部存储器及其接口(中)
文章目录 第三节 半导体存储器与CPU的连接一、存储芯片与CPU连接中应关注的问题二、存储器扩展1. 位扩展:2. 字扩展3. 字位扩展 三、实现片选控制的方法1. 全译码法2. 部分译码法3. 线选法 第三节 半导体存储器与CPU的连接 一、存储芯片与CPU连接中应关注的问题 C…...
Mysql 数据库下载安装
安装准备 步骤1:输入WindowsMysql下载地址:https://dev.mysql.com/downloads/,选择MySQL Installer for Windows。 步骤2:下载MySQL安装文件 mysql-install-community-8.0.22.0.msi 步骤3:登录MySQL, 如…...
蓝桥杯刷题笔记
奇怪的捐赠 #include <cstdio> #include <iostream> #include <cmath> using namespace std; int main(){// 初始化变量num为1000000,代表总金额为100万元int num 1000000;// 初始化变量cnt为0,用于记录最终划分的份数int cnt 0;//…...
数仓开发团队日常1
第一章:数据的召唤 2005年7月18日,星期一,上午8:30 城市商业银行总行大楼 盛夏的阳光透过高耸的银行大楼玻璃幕墙,在大理石地面上投下斑驳的光影。李明远站在城市商业银行总行大厦前,抬头望着这座在城市金融区并不算高的建筑,却感到一种莫名的压迫感。他整了整领带,深…...
Pgvector的安装
Pgvector的安装 向量化数据的存储,可以为 PostgreSQL 安装 vector 扩展来存储向量化数据 注意:在安装vector扩展之前,请先安装Postgres数据库 vector 扩展的步骤 1、下载vs_BuildTools 下载地址: https://visualstudio.microso…...
学习笔记—C++—入门基础()
目录 C介绍 参考文档 C第一个程序 命名空间namespace namespace的价值 namespace的定义 namespace使用 指定命名空间访问 using将命名空间中某个成员展开 展开命名空间中全部成员 输入和输出 缺省参数 函数重载 引用 引用的概念 应用 const引用 指针和引用的关…...
Pytorch实现之利用深度残差GAN做运动图像的去模糊
简介 简介:采用类似U-Net的解码编码的结构,结合10层的残差连接结构作为生成器,改进PatchGAN得到更大的感受野来作为鉴别器。生成器的损失为内容损失,鉴别器的损失为WGAN-GP损失。大家可以尝试这个模型来解决运动图像的去模糊化。 论文题目:基于深度残差生成对抗网络的运…...
[Windows] XHS-Downloader V2.4 | 小红书无水印下载工具 支持多平台批量采集
[Windows] XHS-Downloader 链接:https://pan.xunlei.com/s/VON4ygFN1JcyzLJJIOqIpqodA1?pwdsinu# XHS-Downloader 是一款开源免费的小红书内容下载工具,支持无水印视频 / 图文提取、多链接批量处理及账号作品采集。其核心优势包括: 全平台…...
从零构建大语言模型全栈开发指南:附录与资源-2.数据集大全-公开语料库、多模态数据集与领域专用数据源
👉 点击关注不迷路 👉 点击关注不迷路 👉 点击关注不迷路 文章大纲 附录与资源-2. 数据集大全:公开语料库、多模态数据集与领域专用数据源一、公开语料库:通用语言模型的基石1.1 主流文本语料库1.2 预处理工具与策略二、多模态数据集:跨模态理解的桥梁2.1 视觉-语言数…...
SDL多线程编程
文章目录 1. SDL 线程基础2. 线程同步3. 线程池4. 注意事项5. 示例:在多个线程中进行图形渲染和输入处理总结在 SDL(Simple DirectMedia Layer)中,多线程编程通常用于提高应用程序的响应性和性能,尤其是在需要同时处理多个任务的场景中,例如渲染、输入处理和音频等。SDL …...
LINUX 4 tar -zcvf -jcvf -Jcvf -tf -uf
cp -r mv: 1.移动文件到目录 2.文件改名 3.目录改名 s 上面是打包 下面是打包并压缩...
STL剖析
1. vector 是一个封装了动态大小数组的顺序容器;数组内容器严格按照线性顺序排序,支持随机访问,因此提供随机访问指针,例如vector::iterator ivite; 并且为了降低空间配置得速度成本,vector实际分配大小要比需求大一点…...
【数据集】Romanov数据集
1. 数据集背景 名称:Romanov 单细胞转录组数据集 来源:Romanov et al., Cell Reports, 2017 原始论文标题: "Molecular interrogation of hypothalamic organization reveals distinct dopamine neuronal subtypes" GEO Accession…...
Baklib企业CMS的核心要素是什么?
企业CMS工作流协同创新 现代企业内容管理的核心挑战在于多角色协作效率与流程可视化的平衡。以Baklib为代表的协同型CMS,通过动态权限分级架构与实时版本追踪技术,构建了从内容草拟、多级审批到版本发布的完整闭环。系统支持多人同时编辑功能࿰…...