当前位置: 首页 > news >正文

吴恩达机器学习笔记复盘(八)多元线性回归的梯度下降

简介

梯度下降是多元线性回归的主流优化方法,具有普适性和可扩展性,而标准方程法适用于特定场景。实际应用中需结合特征工程和参数调优提升模型性能。本篇不复盘参数调优。

1.多元线性回归模型

多元线性回归模型假设因变量 y与多个自变量 x_1, x_2, \cdots, x_n之间存在线性关系,其数学表达式为: y = w_1x_1 + w_2x_2 + \cdots + w_nx_n + b其中 w_1, w_2, \cdots, w_n是特征权重,b是偏置项。为了方便表示,我们可以使用向量形式:

\mathbf{W} = \begin{bmatrix} w_1 \\ w_2 \\ \vdots \\ w_n \end{bmatrix}, \quad \mathbf{X} = \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix}

则模型可以写成:

y = \mathbf{W}^T\mathbf{X} + b

2. 代价函数

为了衡量模型预测值与真实值之间的差异,我们通常使用均方误差(Mean Squared Error, MSE)作为代价函数:J(\mathbf{W}, b) = \frac{1}{2m} \sum_{i=1}^{m} (y^{(i)} - \hat{y}^{(i)})^2

其中 m是样本数量,y^{(i)}是第i个样本的真实值,\hat{y}^{(i)}是第 i个样本的预测值,即:

\hat{y}^{(i)} = \mathbf{W}^T\mathbf{X}^{(i)} + b

3. 梯度下降更新规则

梯度下降的核心思想是沿着代价函数的负梯度方向更新参数,以逐步减小代价函数的值。具体来说,我们需要计算代价函数 J(\mathbf{W}, b) 关于参数\mathbf{W}b的偏导数,然后根据偏导数更新参数。

3.1 计算偏导数

关于 w_j的偏导数:

\frac{\partial J(\mathbf{W}, b)}{\partial w_j} = \frac{1}{m} \sum_{i=1}^{m} (\hat{y}^{(i)} - y^{(i)}) x_j^{(i)}

其中 x_j^{(i)}是第 i个样本的第 j个特征值。

关于 b的偏导数:

\frac{\partial J(\mathbf{W}, b)}{\partial b} = \frac{1}{m} \sum_{i=1}^{m} (\hat{y}^{(i)} - y^{(i)})

3.2 更新参数

在每次迭代中,我们使用以下更新规则来更新参数\mathbf{W}b

- 更新 w_j

w_j := w_j - \alpha \frac{\partial J(\mathbf{W}, b)}{\partial w_j}

- 更新 \(b\):

b := b - \alpha \frac{\partial J(\mathbf{W}, b)}{\partial b}

其中 \alpha是学习率,控制每次迭代中参数更新的步长。学习率过大可能导致算法无法收敛,学习率过小则会导致收敛速度过慢。

4. 梯度下降的步骤

1. 初始化参数:

随机初始化权重 \mathbf{W}和偏置 b

2. 计算预测值:

根据当前的参数\mathbf{W}b,计算每个样本的预测值\hat{y}^{(i)}

3. 计算偏导数:

根据上述公式计算代价函数关于 \mathbf{W}b的偏导数。

4. 更新参数:

根据偏导数和学习率更新参数 \mathbf{W}b

5. 重复步骤 2 - 4:

直到满足停止条件,例如达到最大迭代次数或代价函数的变化小于某个阈值。

5. 代码示例

以下是一个使用梯度下降实现多元线性回归的 Python 代码示例:

import numpy as np# 生成一些示例数据
np.random.seed(42)
X = np.random.rand(100, 3)
y = 2 * X[:, 0] + 3 * X[:, 1] + 4 * X[:, 2] + np.random.randn(100) * 0.1# 初始化参数
W = np.zeros(X.shape[1])
b = 0# 定义超参数
learning_rate = 0.01
num_iterations = 1000# 梯度下降
for iteration in range(num_iterations):# 计算预测值y_pred = np.dot(X, W) + b# 计算误差error = y_pred - y# 计算偏导数dW = (1 / X.shape[0]) * np.dot(X.T, error)db = (1 / X.shape[0]) * np.sum(error)# 更新参数W = W - learning_rate * dWb = b - learning_rate * db# 输出最终参数
print("最终权重:", W)
print("最终偏置:", b)

概括总结

梯度下降是一种简单而有效的优化算法,通过不断更新参数来最小化代价函数。在多元线性回归中,我们可以使用梯度下降来寻找最优的权重和偏置。需要注意的是,学习率的选择对算法的收敛性和性能有重要影响,需要进行适当的调整。简要核心过程是以下部分

使用向量符号将多元线性回归模型简化为

F_{W,b}(X) = W \cdot X + b其中 W是特征权重向量,X是特征向量,b是偏置项。

梯度下降更新规则

代价函数J(W, b)Wb的偏导分别为

\frac{\partial J}{\partial W_j} = \frac{1}{m} \sum_{i=1}^m (F_{W,b}(X^{(i)}) - Y^{(i)}) X_j^{(i)}

\frac{\partial J}{\partial b} = \frac{1}{m} \sum_{i=1}^m (F_{W,b}(X^{(i)}) - Y^{(i)})

参数更新规则:

W_j := W_j - \alpha \cdot \frac{\partial J}{\partial W_j}

b := b - \alpha \cdot \frac{\partial J}{\partial b}

 标准方程法(对比 

直接通过矩阵运算求解最优参数,无需迭代。

缺点:无法推广到其他算法(如逻辑回归),计算复杂度高O(n^3),适用于特征数较少的场景。

相关文章:

吴恩达机器学习笔记复盘(八)多元线性回归的梯度下降

简介 梯度下降是多元线性回归的主流优化方法,具有普适性和可扩展性,而标准方程法适用于特定场景。实际应用中需结合特征工程和参数调优提升模型性能。本篇不复盘参数调优。 1.多元线性回归模型 多元线性回归模型假设因变量 与多个自变量 之间存在线性…...

SAP-ABAP: 采购申请创建(PR)BAPI_PR_CREATE 技术指南-详解

BAPI_PR_CREATE 技术指南 用途:通过 RFC 接口创建 SAP 采购申请(PR),支持自动化集成与批量处理。 一、功能概览 类别说明核心功能创建标准采购申请、预留转采购申请,支持多行项目及账户分配。集成场景与 MRP 系统、外…...

Python:单继承方法的重写

继承:让类和类之间转变为父子关系,子类默认继承父类的属性和方法 单继承: class Person:def eat(self):print("eat")def sing(self):print("sing") class Girl(Person):pass#占位符,代码里面类下面不写任何东…...

Cursor解锁Claude Max,助力AI编程新突破!

Cursor 最新推出的 Claude Max 模型,以其卓越的性能和创新的能力,正在重新定义我们对 AI 辅助编程的认知。这款搭载 Claude3.7 大脑的超级模型,不仅具备超强智能,还凭借一系列技术突破,向传统 AI 编程工具发起了挑战。…...

Datawhale coze-ai-assistant 笔记4

课程地址: ‍​‌​‬​​‌​​‬​​​​​⁠​​‬​‌​​​​⁠​​‍​​​​​⁠​⁠​​⁠​‬​第 6 章 应用 - 飞书云文档https://zxdwhda-share.feishu.cn/wiki/Gi9aw4EDTiXxcekUWebcEtmUnb4 应用 AI…...

【基于深度学习的验证码识别】---- part3数据加载、模型等API介绍(2)

四、模型 模型的定义 在机器学习和深度学习中,模型 可以定义为: 一个数学函数或算法,能够从输入数据中提取特征并生成输出。通过训练过程,模型能够学习数据中的规律(如分类、回归、聚类等)。训练完成后&…...

留 言 板

书单 作者:郦波 《五百年来王阳明》 《郦波评说曾国藩家训》《最是人间留不住》《一天一生》 作者:曾仕强 《论语的生活智慧》 《曾仕强详解道德经 道经》 作者: [何勇,陈晓峰著] 《Greenplum企业应用实战 》 作者 Mark G. Sobel…...

3.18练习

BUUCTF练习day2 [GXYCTF2019]Ping Ping Ping ping题有点熟悉的命令注入&#xff0c;使用 127.0.0.1;ls可以得到当前目录的文件名 cat一下flag.php&#xff0c;发现不行 过滤了空格&#xff0c;那我们有什么方法绕过呢 <(重定向符号)${IFS}$IFS$9%09(tab键) 试一试发现过…...

Redis哨兵模式-黑马学习笔记

redis哨兵模式 1.哨兵主要的作用 用于监控主节点的健康情况 如果主节点挂掉立马选择一个从节点顶上去 2.监控的机制 如何监控呢&#xff1f; sentinel基于心跳机制检测主节点的状态 每个1秒向集群发送ping &#xff08;三体中逻辑用来威胁三体人的心跳检测&#xff09; 如…...

Linkreate wordpressAI插件 24小时自动生成原创图文,新增从百度、必应搜索引擎自动获取相关下拉关键词

Linkreate wordpressAI插件核心功能亮点 文章生成与优化 自动化文章生成&#xff1a;利用 AI 技术&#xff0c;根据关键词生成高质量文章。 支持指定长度和要求&#xff0c;异步生成不阻塞操作。 且 AI 可自动生成精准的 tag 标签&#xff0c;利于 SEO 优化。 批量生成文章…...

《AI赋能云原生区块链,引领供应链溯源革新》

在数字化浪潮席卷全球的当下&#xff0c;供应链管理领域正经历着深刻变革。云原生区块链凭借其去中心化、不可篡改等特性&#xff0c;为供应链溯源带来了前所未有的透明度与可靠性。而AI的融入&#xff0c;更如虎添翼&#xff0c;以强大的智能分析和决策能力&#xff0c;为云原…...

基于单片机的多功能热水器设计(论文+源码)

1系统方案设计 基于单片机的多功能热水器系统&#xff0c;其系统框图如图2.1所示。主要采用了DS18B20温度传感器&#xff0c;HC-SR04超声波模块&#xff0c;STC89C52单片机&#xff0c;液晶&#xff0c;继电器等来构成整个系统。硬件上主要通过温度传感器进行水温的检测&am…...

Java面试黄金宝典4

1. 什么是泛型 &#xff1f;与 T 的区别 原理 泛型是 Java 编程语言中的一个强大特性&#xff0c;它提供了编译时类型安全检查机制&#xff0c;允许在定义类、接口和方法时使用类型参数。这些类型参数在使用时会被具体的类型所替代&#xff0c;从而实现代码的复用和类型安全。泛…...

vim在连续多行行首插入相同的字符

工作中经常需要用vim注释掉一段代码或者json文件中的一部分&#xff0c;需要在多行前面插入//或者#符号。在 Vim 中&#xff0c;在连续多行行首插入相同字符主要有以下两种方法&#xff1a; Visual Block 模式插入 将光标移到要插入相同内容的第一行的行首24。按下Ctrl v进入…...

路径问题(greedy):地下城游戏

题目描述&#xff1a; 恶魔们抓住了公主并将她关在了地下城 dungeon 的 右下角 。地下城是由 m x n 个房间组成的二维网格。我们英勇的骑士最初被安置在 左上角 的房间里&#xff0c;他必须穿过地下城并通过对抗恶魔来拯救公主。 骑士的初始健康点数为一个正整数。如果他的健…...

【论文阅读】CARES:医学视觉语言模型可信度的综合基准

CARES&#xff1a;医学视觉语言模型可信度的综合基准 1. 研究背景与动机2. 方法论创新3. 核心实验结果4. 贡献与意义5.总结 CARES: A Comprehensive Benchmark of Trustworthiness in Medical Vision Language Models CARES&#xff1a;医学视觉语言模型可信度的综合基准 Accep…...

Qt窗口坐标体系

坐标系&#xff1a;以左上角为原点&#xff08;0&#xff0c;0&#xff09;&#xff0c;X向右增加&#xff0c;Y向下增加 对于嵌套窗口&#xff0c;其坐标是相对于父窗口来说的 例如&#xff1a; 通过move方法实现...

英伟达消费级RTX显卡配置表

显卡型号显存大小显存频率显存位宽显存带宽CUDA核心数TDP&#xff08;功耗&#xff09;上市年份RTX 409024GB21 Gbps384-bit1,008 GB/s16,384450W2022RTX 4080 (16GB)16GB22.4 Gbps256-bit716.8 GB/s9,728320W2022RTX 4080 (12GB)12GB21 Gbps192-bit504 GB/s7,680285W2023RTX 4…...

1.5.3 掌握Scala内建控制结构 - for循环

Scala的for循环功能强大&#xff0c;支持单重和嵌套循环。单重for循环语法为for (变量 <- 集合或数组 (条件)) {语句组}&#xff0c;可选筛选条件&#xff0c;循环变量依次取集合值。支持多种任务&#xff0c;如输出指定范围整数&#xff08;使用Range、to、until&#xff0…...

10、STL中的unordered_map使用方法

一、了解 1、unordered_map(哈希) unordered_map是借用哈希表实现的关联容器。 访问键值对O&#xff08;1&#xff09;&#xff0c;最坏情况O&#xff08;n&#xff09;&#xff0c;例如哈希冲突严重时。【n是一个哈希桶的元素数量】 unordered_map特性 键值对存储&#xff…...

pycharm-python國際象棋遊戲代碼

嗯&#xff0c;用户的问题是“pycharm寫關於python國際象棋遊戲代碼”&#xff0c;也就是要用PyCharm来写一个Python的国际象棋游戏代码。我需要先整理一下用户提供的搜索结果&#xff0c;看看有什么相关的信息可以利用。 首先看搜索结果中的各个网页内容。网页1主要讲的是象棋…...

Linux下Redis哨兵集群模式搭建(1主2从+3哨兵)

Linux下Redis哨兵集群模式搭建&#xff08;1主2从3哨兵&#xff09; 一、Redis哨兵模式搭建 1.安装包下载 链接: https://pan.baidu.com/s/1_n2rCMi5MHX-mVkkyMo4LA 提取码: gbra 2.新建redis目录 mkdir -p /app/redis3.解压到/app/redis目录下 tar -zxvf redis-6.2.16.ta…...

二.使用ffmpeg对原始音频数据重采样并进行AAC编码

重采样&#xff1a;将音频三元组【采样率 采样格式 通道数】之中的任何一个或者多个值改变。 一.为什么要进行重采样&#xff1f; 1.原始音频数据和编码器的数据格式不一致 2.播放器要求的和获取的数据不一致 3.方便运算 二.本次编码流程 1.了解自己本机麦克风参数&#x…...

【初学者】请介绍一下指针分析(Pointer Analysis)?

李升伟 整理 指针分析&#xff08;Pointer Analysis&#xff09; 指针分析&#xff08;Pointer Analysis&#xff09;是一种静态程序分析技术&#xff0c;用于确定程序中指针可能指向的内存位置或对象。它是编译器优化、程序验证、漏洞检测和并行化等领域的重要基础。 1. 指…...

【程序人生】成功人生架构图(分层模型)

文章目录 ⭐前言⭐一、根基层——价值观与使命⭐二、支柱层——健康与能量⭐三、驱动层——学习与进化⭐四、网络层——关系系统⭐五、目标层——成就与财富⭐六、顶层——意义与传承⭐外层&#xff1a;调节环——平衡与抗风险⭐思维导图 标题详情作者JosieBook头衔CSDN博客专家…...

目标检测20年(一)

今天看的文献是《Object Detection in 20 Years: A Survey》&#xff0c;非常经典的一篇目标检测文献&#xff0c;希望通过这篇文章学习到目标检测的基础方法并提供一些创新思想。 论文链接&#xff1a;1905.05055 目录 一、摘要 1.1 原文 1.2 翻译 二、介绍 三、目标检测…...

SQLMesh系列教程:SQLMesh虚拟数据环境

各种工具都已将软件工程实践引入到数据工程中&#xff0c;但仍有差距存在&#xff0c;尤其是在测试和工作流等领域。SQLMesh 的目标是在这些领域开辟新的天地&#xff0c;解决像 dbt 这样的竞争产品尚未提供强大解决方案的难题。在这篇文章中&#xff0c;我将对 SQLMesh 进行简…...

【python小游戏】扫雷

扫雷小游戏代码。供消遣娱乐&#xff1a; import tkinter as tk from tkinter import messagebox import random# 游戏参数&#xff08;中等难度&#xff1a;15x15 网格&#xff0c;40 颗雷&#xff09; ROWS 15 COLS 15 MINES 40 CELL_SIZE 30 COLORS {default: #CCCCCC…...

【Linux】learning notes(4)cat、more、less、head、tail、vi、vim

文章目录 catmore 查看整个文件less 查看整个文件head 查看部分文件tail 查看部分文件vim / vi cat cat 命令在 Linux 和 Unix 系统中非常常用&#xff0c;它用于连接文件并打印到标准输出设备&#xff08;通常是屏幕&#xff09;。虽然 cat 的基本用法很简单&#xff0c;但它…...

【论文阅读】Adversarial Patch Attacks on Monocular Depth Estimation Networks

一、背景 单目深度估计是CV领域一个比较热门的研究方向&#xff0c;但是现有的方法过度依赖于非深度特征&#xff0c;使得单目深度估计的模型容易受到外界的攻击&#xff0c;针对这一问题该论文设计了一种攻击贴图的方法&#xff0c;用于攻击深度学习实现的单目深度估计模型。…...

基于Flask的自闭症患者诊断辅助系统:助力自闭症诊断

基于Flask的自闭症患者诊断辅助系统&#xff1a;助力自闭症诊断的创新方案 在当今社会&#xff0c;自闭症的早期准确诊断对于患者的治疗和康复至关重要。作为项目的第一作者&#xff0c;我致力于开发一款基于Web的自闭症诊断辅助系统&#xff0c;为这一领域贡献一份力量。 本…...

SqlServer Sql学习随笔

环境 SqlServerSSMSC# 查询 --查询来自数据库[MyTestDb]的[dbo]的表[testTable]前1000条数据--dbo 代表 数据库所有者&#xff08;Database Owner&#xff09;&#xff0c;在 SQL Server 里&#xff0c;它是一个模式&#xff08;Schema&#xff09;。 --**模式&#xff08;Sc…...

【6】组合计数学习笔记

前言 关于今天发现自己连快速幂都忘记怎么写这件事 这篇博客是组合计数基础&#xff0c;由于大部分内容都是 6 6 6 级&#xff0c;所以我就给整个提高级的组合数学评了 6 6 6 级。 组合计数基础 加法原理与乘法原理 加法原理&#xff08;分类计数原理&#xff09;&#…...

功能安全实战系列06-英飞凌Tricore系列SMU详解

本文框架 前言1.What?1.1SMU特性及架构1.1.1 SMU_core和SMU_stdby1.1.2 Flip-Flop机制1.1.3 RT Alarm (RecoveryTime)1.2 Alarm状态机1.3 FSP1.4 Alarm handing1.4.1 SMU_core Alarm handing1.4.2 SMU_Standby Alarm handing1.5 寄存器介绍2.How?2.1 如何排查SMU问题前言 在…...

Python 中的集合的中高级用法

Python 中的集合(set)是一种无序且不重复的数据结构,适用于去重、成员检测和集合运算等场景。以下是集合的中级和高级用法,涵盖从基础到高级的详细操作。 1. 集合的创建与初始化 1.1 创建集合 # 空集合 empty_set = set()# 直接初始化 my_set = {1, 2,...

opencv初步学习——图像处理2

这一部分主要讲解如何初步地创建一个图像&#xff0c;以及彩色图像我们的一些基本处理方法 一、创建一个灰度图像 1-1、zeros()函数 [NumPy库] 要用到这一个函数&#xff0c;首先我们需要调用我们的NumPy库&#xff0c;这一个函数的作用是可以帮助我们生成一个元素值都是0的二…...

传统服务部署、虚拟化部署与云原生部署资源消耗对比与优化指南

1. 三种部署方式概述 1.1 传统服务部署 定义&#xff1a;直接运行于物理服务器或基础Linux操作系统环境&#xff0c;无虚拟化层隔离 特点&#xff1a; 资源独占&#xff08;CPU/内存/磁盘&#xff09; 部署流程简单但扩展困难 典型场景&#xff1a;单一业务高负载场景&…...

使用htool工具导出和导入Excel表

htool官网 代码中用到的hool包里面的excel工具ExcelUtil 1. 引入依赖 <!-- Java的工具类 --><dependency><groupId>cn.hutool</groupId><artifactId>hutool-all</artifactId><version>5.8.25</version></dependency>&l…...

【Linux内核】从文件层面理解socket建立的方式(优雅的C风格多态)

内核层面理解 Socket 的创建和连接 引言 众所周知&#xff0c;Linux 下一切皆文件。无论是普通文件&#xff08;如 file.txt&#xff09;&#xff0c;还是特殊文件&#xff08;包括网络套接字&#xff09;&#xff0c;我们都可以以处理文件的方式来访问它们。网络套接字&…...

WebSocket:开启实时通信的新篇章

在当今的互联网应用中&#xff0c;实时交互已经成为不可或缺的一部分。无论是实时的在线聊天、股票行情更新&#xff0c;还是多人在线游戏&#xff0c;都需要一种高效的双向通信机制。而这正是 WebSocket 的用武之地。 本文将带你深入了解 WebSocket&#xff0c;探索其工作原理…...

只是“更轻更薄”?不!遨游三防平板还选择“更强更韧”

当消费电子领域普遍追求“更轻更薄”的设计美学时&#xff0c;遨游三防平板不止于此&#xff0c;还选择了另一条道路——“更强更韧”。在智能制造的复杂场景中&#xff0c;三防平板需直面高温、油污、撞击与极端气候的考验。普通消费级平板因防护性能不足&#xff0c;常因环境…...

C++ 各种map对比

文章目录 特点比较1. std::map2. std::unordered_map3. std::multimap4. std::unordered_multimap5. hash_map&#xff08;SGI STL 扩展&#xff09; C 示例代码代码解释 特点比较 1. std::map 底层实现&#xff1a;基于红黑树&#xff08;一种自平衡的二叉搜索树&#xff09…...

《量子门与AI神经元:计算世界的奇妙碰撞》

在当今科技飞速发展的时代&#xff0c;量子计算和人工智能作为前沿领域&#xff0c;正不断颠覆我们对计算和智能的认知。量子门操作和AI中的神经元计算过程&#xff0c;分别作为这两大领域的核心机制&#xff0c;看似处于不同维度&#xff0c;却有着千丝万缕的联系&#xff0c;…...

【Linux———生产消费模型】

并不是真的路过而已&#xff0c;也不是真的不会想你.............................................................................. 文章目录 前言 一、【生产者消费者模型的介绍】 1、【概念引入】 2、【特点—321原则】 3、【优点】 二、【基于阻塞队列的生产者消费…...

876.链表的中间节点

题目 Python # Definition for singly-linked list. # class ListNode: # def __init__(self, val0, nextNone): # self.val val # self.next next class Solution:def middleNode(self, head: Optional[ListNode]) -> Optional[ListNode]:slow fa…...

蓝桥杯第13届真题2

由硬件框图可以知道我们要配置LED 和按键 一.LED 先配置LED的八个引脚为GPIO_OutPut&#xff0c;锁存器PD2也是&#xff0c;然后都设置为起始高电平&#xff0c;生成代码时还要去解决引脚冲突问题 二.按键 按键配置&#xff0c;由原理图按键所对引脚要GPIO_Input 生成代码&a…...

【微信小程序变通实现DeepSeek支持语音】

微信小程序实现录音转文字&#xff0c;并调用后端服务&#xff08;Node.js&#xff09;进行语音识别和&#xff0c;然后调用DeepSeek 处理的完整实现。 整体架构 前端&#xff08;微信小程序&#xff09;&#xff1a; 实现录音功能。将录音文件上传到后端。接收后端返回的语音…...

XSS 绕过分析:一次循环与两次循环的区别

目录 代码分析 代码流程&#xff1a; 一次循环的问题 原因分析&#xff1a;删除顺序导致遗漏 两次循环修复方案 两种绕过方式 绕过方法 1&#xff1a;DOM破环 绕过方法 2&#xff1a;SVG XSS&#xff08;双 SVG 绕过&#xff09; 1. 为什么 "一个SVG注定失败&…...

AI重构工程设计、施工、总承包行业:从智能优化到数字孪生的产业革命

摘要 AI正深度重构工程设计、施工与总承包行业&#xff0c;推动从传统经验驱动向数据智能驱动的转型。本文系统性解析AI当前在智能优化设计、施工过程管理、全生命周期数字孪生等场景的应用&#xff0c;展望未来AI在自动化决策、跨域协同等领域的潜力&#xff0c;并从投入产出…...

全局上下文网络GCNet:创新架构提升视觉识别性能

摘要&#xff1a;本文介绍了全局上下文网络&#xff08;GCNet&#xff09;&#xff0c;通过深入分析非局部网络&#xff08;NLNet&#xff09;&#xff0c;发现其在重要视觉识别任务中学习的全局上下文与查询位置无关。基于此&#xff0c;提出简化的非局部模块、全局上下文建模…...