当前位置: 首页 > news >正文

国产之光DeepSeek架构理解与应用分析02

本专栏

国产之光DeepSeek架构理解与应用分析-CSDN博客

国产之光DeepSeek架构理解与应用分析02-CSDN博客

前置的一些内容理解

GPU TPU NPU的区别?

设计目的

GPU:最初是为了加速图形渲染而设计的,用于处理图像和视频数据,以提供高质量的视觉效果。在现代计算机中,GPU 也被广泛用于通用计算,如科学计算、深度学习等。

TPU:是专门为加速张量计算而设计的,主要用于深度学习模型的训练和推理。TPU 针对深度学习的特点进行了优化,能够高效地处理大规模的张量运算。

NPU:主要用于加速神经网络的计算,特别适用于人工智能领域中的图像识别、语音识别、自然语言处理等任务。NPU 通常采用了专门的架构和算法,能够在低功耗的情况下提供高效的神经网络计算能力。

硬件架构

GPU:拥有大量的计算核心(cuda),通常采用 SIMD(单指令多数据)架构,能够同时处理多个数据元素。GPU 还具有丰富的内存层次结构,包括片上缓存、显存等,以支持高效的数据访问。

英伟达gpu为例大概硬件架构图

1.主机接口(Host Interface):负责与主机(如 CPU)进行通信。

2.内存控制器(Memory Controller):管理 GPU 与外部内存(如 GDDR)之间的数据传输。

3.L2 缓存(L2 Cache):作为数据的高速缓存,减少内存访问延迟。

4.流式多处理器(Streaming Multiprocessors, SMs):GPU 的核心计算单元,多个 SM 并行工作以提高计算能力。每个 SM 内部包含线程调度器、 warp 调度器、ALU 阵列和共享内存。

TPU:通常采用了专门的张量处理单元(Tensor Core),能够高效地处理张量运算。TPU 还具有高速的内存接口和片上缓存,以支持快速的数据传输和访问。

以较新的谷歌 TPU v4 为例

1.整体组件Tensor Core:TPU v4 有两个 Tensor Core(tensor_core_0和tensor_core_1 ),每个 Tensor Core 包含多个核心计算单元。

HBM(高带宽内存):有两个 HBM 模块(hbm_0和hbm_1 ),分别与对应的 Tensor Core 相连,提供高带宽内存支持。

Sparse Core:专门针对稀疏计算优化的模块(sparse_core ),与两个 Tensor Core 都有连接。

3D Torus Interconnect:3D Torus 互联结构(torus ),用于实现芯片间高效互联,连接各个主要组件。

2.Tensor Core 内部

每个 Tensor Core 里有四个脉动阵列 MXU(如mxu_0 - mxu_3 等 )以及一个 Scalar Unit 和一个 Vector Unit ,展示了其内部计算单元的构成和连接关系。Sparse 3.Core 内部

包含 Fetch Unit(从 HBM 读取数据 )、scVPU(向量处理单元 )、Flush Unit(反向传播时写入更新参数 )以及五个跨通道单元(执行嵌入操作 ),体现其针对稀疏计算的功能模块设计。

NPU:采用了专门的神经网络处理器架构,通常包括多个处理单元和存储单元。NPU 还具有高效的硬件加速器,如卷积神经网络(CNN)加速器、循环神经网络(RNN)加速器等,以支持不同类型的神经网络计算。

以较为典型的寒武纪思元系列 NPU 架构为参考示例

1.整体组件Input Data Buffer:输入数据缓冲区,用于暂存输入到 NPU 的数据。

Weight Data Buffer:权重数据缓冲区,存放神经网络计算所需的权重参数。

Neural Network Core:神经网络核心计算单元,进行主要的神经网络计算。

Accelerator Engine:加速引擎,对特定计算进行加速处理,提升计算效率。

Memory Controller:内存控制器,管理数据在不同缓冲区和外部内存之间的传输。

Output Data Buffer:输出数据缓冲区,存储计算后的输出结果。

2.Neural Network Core 内部MAC Array:乘累加阵列,执行大量的乘累加操作,是神经网络计算的基础运算单元。

Activation Unit:激活单元,对 MAC 阵列的计算结果应用激活函数,引入非线性因素。

Normalization Unit:归一化单元,对数据进行归一化处理,有助于提升模型训练和推理的稳定性与效率。

3.Accelerator Engine 内部Sparse Computation Unit:稀疏计算单元,针对稀疏数据进行高效计算,减少不必要的计算量。

Dynamic Computation Unit:动态计算单元,适应不同的计算需求,灵活调整计算方式。

Parallel Processing Unit:并行处理单元,充分利用并行计算资源,加速整体计算过程

计算能力

GPU:具有强大的并行计算能力,能够同时处理多个图形或计算任务。在深度学习领域,GPU 也能够提供较高的计算性能,特别是在处理大规模数据集和复杂模型时表现出色。

TPU:针对深度学习的张量计算进行了优化,能够提供比 GPU 更高的计算性能和效率。TPU 通常采用了更高的时钟频率和更高效的计算单元,能够在短时间内完成大规模的张量运算。

NPU:在处理神经网络计算时具有高效的性能,能够在低功耗的情况下提供较高的计算速度。NPU 通常采用了专门的算法和架构,能够针对不同类型的神经网络进行优化,从而提高计算效率。

应用场景

GPU:广泛应用于图形渲染、游戏开发、科学计算、深度学习等领域。在深度学习领域,GPU 是目前最常用的计算设备之一,能够支持各种深度学习框架和模型的训练和推理。

TPU:主要应用于深度学习领域,特别是在大规模数据中心和云计算环境中,用于加速深度学习模型的训练和推理。TPU 能够提供高效的计算性能和低功耗,从而降低数据中心的运营成本。

NPU:主要应用于人工智能领域,如智能手机、智能家居、智能安防等设备中,用于加速图像识别、语音识别、自然语言处理等任务。NPU 能够在低功耗的情况下提供高效的计算能力,从而满足设备对性能和功耗的要求。

SiLU激活函数,并进一步解释门控神经网络

SiLU 激活函数详解

SiLU(Sigmoid Linear Unit)激活函数,也被称为 Swish 激活函数,由 Google Brain 在 2017 年引入。其定义为:

SiLU(x)=x⋅sigmoid(x)

其中,sigmoid(x) 是标准的 sigmoid 函数,其值在 0 和 1 之间:

sigmoid(x)=1+e−x1

特性

平滑性:SiLU 是一个平滑的函数,其输出值是连续且可导的,这有助于梯度下降算法在优化过程中稳定更新参数

非线性:SiLU 引入了非线性变换,使其能够捕捉复杂的数据模式

自正则化:SiLU 的输出值可以自适应地缩放输入值,类似于自正则化的效果,这可能有助于减少过拟合

无零输出区域:与 ReLU 不同,SiLU 不存在零输出区域,这意味着它在负数部分也有一定的响应,从而避免了梯度消失问题

优点

缓解梯度消失问题:SiLU 在负数部分也有一定的响应,这使得它在深度神经网络中能够更好地缓解梯度消失问题

非零中心:SiLU 的输出值不是零中心的,这有助于网络的学习

平滑函数:SiLU 是一个平滑函数,这意味着它在整个定义域内都有导数,有利于优化

缺点

计算复杂度:SiLU 的计算复杂度相对较高,因为它需要计算 sigmoid 函数。

应用场景

SiLU 激活函数在深度神经网络中表现出色,尤其是在需要处理负值输入的场景中。它在 YOLOv5 等深度学习模型中被广泛应用,取得了良好的效果

与其他激活函数的对比

ReLU(Rectified Linear Unit):ReLU 函数定义为ReLU(x) = max(0, x),它在 x > 0 时输出线性增长,而在 x <= 0 时输出为 0。这导致了 “死亡 ReLU” 问题,即当神经元的输入一直为负时,它将永远不会被激活,梯度也会变为 0,从而使该神经元无法更新参数。而 SiLU 在负数部分有非零输出,避免了这个问题。

Sigmoid 函数:Sigmoid 函数将输入值映射到 (0, 1) 区间,常用于二分类问题的输出层。然而,Sigmoid 函数存在梯度消失问题,当输入值很大或很小时,其导数趋近于 0,导致在深度神经网络中难以进行有效的参数更新。SiLU 结合了 Sigmoid 函数和线性函数,一定程度上缓解了梯度消失问题。

数学性质

导数:SiLU 函数的导数可以通过乘积法则计算。设 f(x) = x * sigma(x),其中 sigma(x)是 Sigmoid 函数。根据乘积法则 (uv)' = u'v + uv',可得 f'(x) = sigma(x) + x *sigma(x) * (1 - sigma(x))。这个导数在整个定义域内都是连续的,有助于梯度下降算法的稳定运行。

门控机制理解

SiLU 可以看作是一种门控机制,其中 sigma(x) 作为门控信号。当 sigma(x) 接近 1 时,输入 x 几乎可以无衰减地通过,相当于门打开;当 sigma(x) 接近 0 时,输入 x 被大幅抑制,相当于门关闭。这种门控机制使得 SiLU 能够自适应地调整输入的影响,从而更好地捕捉数据的特征。

门控神经网络详解

门控神经网络是一种通过门控机制来控制信息流动的神经网络结构。门控机制的核心思想是通过“门”来决定哪些信息应该被保留,哪些信息应该被过滤或抑制,从而提升模型的表达能力和计算效率

门控机制的原理

门控机制通常由神经网络(如全连接层)和激活函数(如 sigmoid)组成。门控的计算公式一般如下:

G=σ(Wx+b)

其中,x 是输入信息,W 和 b 是权重和偏置,σ 是 sigmoid 函数。

门控神经网络的结构

门控神经网络的典型代表包括长短期记忆网络(LSTM)和门控循环单元(GRU)。这些网络通过门控机制来控制信息的流动,从而有效地处理序列数据。

门控循环单元(GRU)

GRU 是一种简化的 LSTM 结构,它通过两个门(更新门和重置门)来控制信息的流动。更新门负责确定有多少上一个时间步的隐藏状态信息应该被保留到当前时间步,而重置门负责确定在计算新的隐藏状态时,有多少上一个时间步的隐藏状态信息应该被保留。

门控神经网络的应用

门控神经网络在处理序列数据(如自然语言处理、时间序列预测等)方面表现出色。它们通过门控机制有效地解决了传统 RNN 的梯度消失问题,从而能够更好地建模长距离依赖关系。

相关文章:

国产之光DeepSeek架构理解与应用分析02

本专栏 国产之光DeepSeek架构理解与应用分析-CSDN博客 国产之光DeepSeek架构理解与应用分析02-CSDN博客 前置的一些内容理解 GPU TPU NPU的区别&#xff1f; 设计目的 GPU&#xff1a;最初是为了加速图形渲染而设计的&#xff0c;用于处理图像和视频数据&#xff0c;以提供高…...

EDID结构

EDID DDC通讯中传输显示设备数据 VGA , DVI 的EDID由128字节组成&#xff0c;hdmi的EDID增加扩展块128字节。扩展快的内容主要是和音频属性相关的&#xff0c;DVI和vga没有音频&#xff0c;hdmi自带音频&#xff0c;扩展快数据规范按照cea-861x标准。 Edid为了让pc或其他的图像…...

4.黑马学习笔记-SpringMVC(P43-P47)

1.SpringMVC简介 SpringMVC技术&#xff08;更少的代码&#xff0c;简便&#xff09;与servlet技术功能相同&#xff0c;属于web层开发技术。 SpringMVC是一种基于java实现MVC模型的轻量级web框架。 轻量级指的是&#xff08;内存占用比较低&#xff0c;运行效率高&#xff09;…...

CSS 文件格式

A QFrame#andrFrm[status"android_en"] A&#xff1a;表示父类或顶层窗口的类型。如果 A 是一个自定义的类名&#xff0c;确保该类已经正确注册到 Qt 系统中。QFrame&#xff1a;表示具体的控件类型。#andrFrm&#xff1a;表示控件的对象名称&#xff08;通过 setOb…...

java输出HelloWorld

创建一个java格式文件&#xff0c;这里命令为HelloWorld 这里我选择用notepad编译&#xff0c;也可以直接用记事本 #public 访问修饰词&#xff0c;表示这个类可以被其他任何类访问 #class 定义类的关键字 #HelloWorld 类名&#xff0c;遵循驼峰命名法&#xff08;首字母大写…...

【SAP ME 44】在 HANA DB中报废SFC时的SHOP_ORDER表记录锁定

症状 SELECT…FROM SHOP_ORDER FOR UPDATE 在 SFC 报废期间持有锁,当同时调用数量较大时,可能会导致 HANA 数据库出现大量锁积压。这有时会导致因等待 HANA 数据库释放“选择更新”锁而导致报废 SFC 花费数分钟。 HANA 数据库日志中的示例: # begin PreparedStatement_ex…...

《软件设计师》复习笔记(12.1)——范围管理、进度管理

目录 一、范围管理 1. 核心概念 2. 范围管理过程 WBS&#xff08;工作分解结构&#xff09;示例 真题示例&#xff1a; 二、进度管理 1. 核心过程 2. 关键工具与技术 真题示例&#xff1a; 一、范围管理 1. 核心概念 项目范围&#xff1a;为交付产品必须完成的工作…...

Git-使用教程(新手向)

一、基本概念&#xff1a; 1.Git&#xff0c;Github的关系&#xff1a; Git --- 本地用于管理代码的工具&#xff0c;可类比为游戏存档。&#xff08;存档&#xff0c;仓库&#xff0c;项目在Git中是一个东西&#xff09; Github --- 远程仓库平台&#xff0c;可类比为云端。…...

密码学中的盐值是什么?

目录 1. 盐值的基本概念 2. 盐值的作用 (1) 防止彩虹表攻击 (2) 防止相同的密码生成相同的哈希值 (3) 增加暴力破解的难度 3. 如何使用盐值&#xff1f; (1) 生成盐值 (2) 将盐值附加到密码 (3) 存储盐值和哈希值 (4) 验证密码 4. 盐值如何增加暴力破解的难度 在线暴…...

[工具]Java xml 转 Json

[工具]Java xml 转 Json 依赖 <!-- https://mvnrepository.com/artifact/cn.hutool/hutool-all --> <dependency><groupId>cn.hutool</groupId><artifactId>hutool-all</artifactId><version>5.8.37</version> </dependen…...

安全光幕的CE认证

在工业自动化飞速发展的当下&#xff0c;安全光幕作为保障操作人员安全的关键设备&#xff0c;其重要性不言而喻。对于想要进军欧盟市场的安全光幕制造商来说&#xff0c;CE 认证是必须跨越的一道关卡。今天&#xff0c;我们就来深入探讨安全光幕的 CE 认证流程。 什么是安全…...

DNS解析失败怎么解决?

在互联网时代&#xff0c;畅快地浏览网页、使用各类网络服务已成为生活常态。然而&#xff0c;当屏幕突然弹出 “DNS解析失败”的提示&#xff0c;原本顺畅的网络连接戛然而止&#xff0c;让人倍感困扰。DNS即域名系统&#xff0c;它如同互联网的 “电话簿”&#xff0c;负责将…...

亚马逊商品详情API数据接口概述,Amazon API

亚马逊商品详情API数据接口概述 亚马逊商品详情API&#xff08;如Amazon Product Advertising API或Selling Partner API (SP-API)&#xff09;是亚马逊为开发者提供的官方接口&#xff0c;允许通过编程方式获取商品的详细信息&#xff0c;包括商品标题、价格、描述、图片、用…...

TCP/IP和UDP协议的发展历程

TCP/IP和UDP协议的发展历程 引言 互联网的发展史是人类技术创新的辉煌篇章&#xff0c;而在这一发展过程中&#xff0c;通信协议发挥了奠基性的作用。TCP/IP&#xff08;传输控制协议/互联网协议&#xff09;和UDP&#xff08;用户数据报协议&#xff09;作为互联网通信的基础…...

LeetCode 259 题全解析:Swift 快速找出“满足条件”的三人组

文章目录 摘要描述示例 1&#xff1a;示例 2&#xff1a;示例 3&#xff1a; 题解答案&#xff08;Swift&#xff09;题解代码分析示例测试及结果时间复杂度空间复杂度总结 摘要 本文围绕 LeetCode 259 题“较小的三数之和”&#xff0c;通过 Swift 给出两种解法&#xff0c;并…...

【MySQL】MySQL表的增删改查(CRUD) —— 上篇

目录 MySQL表的增删改查&#xff08;CRUD&#xff09; 1. 新增&#xff08;Create&#xff09;/插入数据 1.1 单行数据 全列插入 insert into 表名 values(值, 值......); 1.2 单行数据 指定列插入 1.3 多行数据 指定列插入 1.4 关于时间日期&#xff08;datetime&am…...

基于大模型的腹股沟疝诊疗全流程风险预测与方案制定研究报告

目录 一、引言 1.1 研究背景与意义 1.2 国内外研究现状 1.3 研究目的与创新点 二、大模型技术概述 2.1 大模型基本原理 2.2 常用大模型类型及特点 2.3 大模型在医疗领域的应用潜力 三、腹股沟疝诊疗流程分析 3.1 腹股沟疝的发病机制与分类 3.2 传统术前评估方法与局…...

使用nssm将Nginx配置为Windows服务

使用nssm将Nginx配置为Windows服务 下载nssm工具 &#xff1a;使用NSSM创建服务启动并验证服务管理服务&#xff08;启动/停止/重启&#xff09; 下载nssm工具 &#xff1a; nssm下载网址 下载到指定路径下&#xff0c;解压就行。 使用NSSM创建服务 winr打开运行命令框&am…...

(8)VTK C++开发示例 --- 交互式3D部件

文章目录 1. 概述2. CMake链接VTK3. main.cpp文件4. 演示效果 更多精彩内容&#x1f449;内容导航 &#x1f448;&#x1f449;VTK开发 &#x1f448; 1. 概述 这个例子介绍了3D小部件&#xff08;vtkBoxWidget&#xff09;。3D小部件利用了前面介绍的事件/观察者设计模式。它们…...

ReAct、CoT 和 ToT:大模型提示词推理架构的对比分析

ReAct、CoT 和 ToT&#xff1a;大模型提示词推理架构的对比分析 在大型语言模型&#xff08;LLM&#xff09;的研究与应用中&#xff0c;如何有效提升模型在复杂任务上的推理能力是关键问题之一。目前&#xff0c;ReAct&#xff08;Reasoning and Acting&#xff09;、CoT&…...

Evidential Deep Learning和证据理论教材的区别(主要是概念)

最近终于彻底搞懂了Evidential Deep Learning&#xff0c;之前有很多看不是特别明白的地方&#xff0c;原来是和证据理论教材&#xff08;是的&#xff0c;不只是国内老师写的&#xff0c;和国外的老师写的教材出入也比较大&#xff09;的说法有很多不一样&#xff0c;所以特地…...

golang context源码

解析 context结构 Deadline&#xff1a;返回 context 的过期时间&#xff1b; Done&#xff1a;返回 context 中的 channel&#xff1b; Err&#xff1a;返回错误&#xff1b; Value&#xff1a;返回 context 中的对应 key 的值. type Context interface {Deadline() (deadl…...

VSCODE插值表达式失效问题

GET https://cdn.jsdelivr.net/npm/vue2.6.14/dist/vue.js net::ERR_CONNECTION_-CSDN博客 更换正确的vue域名 GET https://cdn.jsdelivr.net/npm/vue2.6.14/dist/vue.js net::ERR_CONNECTION_ <script src"https://unpkg.com/vue2.6.14/dist/vue.js"></sc…...

6.VTK 颜色

文章目录 概念RGB示例HSV示例 概念 RGB颜色系统&#xff1a;通过红(R)、绿(G)、蓝(B)三个颜色分量的组合来定义颜色。每个分量的取值范围是0到1&#xff0c;其中(0, 0, 0)代表黑色&#xff0c;而(1, 1, 1)代表白色。可以使用vtkProperty::SetColor(r, g, b)方法为Actor设置颜色…...

MQTTClient.c的线程模型与异步事件驱动

MQTTClient.c的线程模型与异步事件驱动 1. 多线程架构设计 MQTTClient.c通过分离网络I/O和用户逻辑线程实现异步通信&#xff0c;核心设计如下&#xff1a; sequenceDiagramparticipant 主线程 as 主线程&#xff08;用户调用&#xff09;participant 发送队列 as 发送队列pa…...

Flutter异常Couldn‘t find dynamic library in default locations

Flutter项目在Windows系统使用ffigen生成代码时报下面的错误&#xff1a; [SEVERE] : Couldnt find dynamic library in default locations. [SEVERE] : Please supply one or more path/to/llvm in ffigens config under the key llvm-path. Unhandled exception: Exception: …...

在PyCharm中部署AI模型的完整指南

引言 随着人工智能技术的快速发展,越来越多的开发者开始将AI模型集成到他们的应用程序中。PyCharm作为一款强大的Python IDE,为AI开发提供了出色的支持。本文将详细介绍如何在PyCharm中部署AI模型,从环境配置到最终部署的完整流程。 第一部分:准备工作 1. 安装PyCharm …...

6.6.图的广度优先遍历(英文缩写BFS)

树是一种特殊的图&#xff0c;树的广度优先遍历即层次遍历&#xff0c;所以会从树的角度入手图的广度优先遍历&#xff1a; BFS与DFS的区别在于&#xff0c;BFS使用了队列&#xff0c;DFS使用了栈 一.广度优先遍历&#xff1a; 1.树的广度优先遍历&#xff1a; 详情见"…...

练习(杨辉三角、字符串旋转)

一、 以下程序执行的结果&#xff1a; int main() {//0~255unsigned char a 200;//00000000000000000000000011001000//11001000 - a 截断unsigned char b 100;//00000000000000000000000001100100//01100100 - b unsigned char c 0;c a b;//11001000 - a//0110010…...

L1-7 矩阵列平移

题目 给定一个 nn 的整数矩阵。对任一给定的正整数 k<n&#xff0c;我们将矩阵的偶数列的元素整体向下依次平移 1、……、k、1、……、k、…… 个位置&#xff0c;平移空出的位置用整数 x 补。你需要计算出结果矩阵的每一行元素的和。 输入格式&#xff1a; 输入第一行给出…...

webgl入门实例-11模型矩阵 (Model Matrix)基本概念

WebGL 模型矩阵 (Model Matrix) 在WebGL和3D图形编程中&#xff0c;模型矩阵(Model Matrix)是将物体从局部坐标系(模型空间)转换到世界坐标系的关键变换矩阵。 什么是模型矩阵&#xff1f; 模型矩阵是一个4x4的矩阵&#xff0c;用于表示物体在世界空间中的位置、旋转和缩放。…...

【漫话机器学习系列】209.均值的标准误差(Standard Error of the Mean)

均值的标准误差&#xff08;Standard Error of the Mean&#xff09;详解 在统计学中&#xff0c;我们经常会遇到“均值的标准误差”这个概念&#xff0c;英文称为 Standard Error of the Mean&#xff08;简称 SEM&#xff09;。它是对样本均值作为总体均值估计的可靠程度的一…...

Multi Agents Collaboration OS:文档合规性及质量检测助手设计及实践

文档审查及质量检测背景 随着企业运营和知识管理的日益复杂&#xff0c;文档的合规性与质量成为确保信息准确、流程顺畅及风险控制的关键环节。传统上&#xff0c;人工进行文档的合规性和质量检测不仅耗时耗力&#xff0c;且易受主观因素影响&#xff0c;难以保证检测的全面性…...

Vue Teleport 及其在 SSR 中的潜在问题

Vue 3 的 Teleport 特性为开发者提供了更灵活的 DOM 结构控制能力&#xff0c;但在服务端渲染&#xff08;SSR&#xff09;场景中&#xff0c;它可能引发一些需要注意的问题。本文将深入探讨 Teleport 的核心机制及其在 SSR 中的使用陷阱。 一、Teleport 核心机制解析 1. 基本…...

Fastapi 日志处理

uvicorn 日志处理总结&#xff1a; 一、日志的结构 日志结构如下&#xff1a; {"version": 1,"disable_existing_loggers": false,"formatters": {},"handlers": {},"loggers": {} }loggers 用于定义日志处理最顶层的标识…...

FME实现矢量建筑面shp拉伸并贴纹理

文章目录 效果2、数据准备3、整理流程图4、操作步骤4.1 打开软件4.2 添加shp数据4.3 添加Extruder转换器4.4 添加AppearanceSetter转换器4.5 添加png纹理数据4.6 添加输出节点4.7 添加Logger节点4.8 执行5、执行结果效果 2、数据准备 (1)建筑面shp (2)纹理 test.png 其中s…...

仿腾讯会议项目实现——设置配置文件

目录 1、初始化配置 2、实现初始化配置的函数 3、修改配置文件内的ip地址 1、初始化配置 Ckernel.h 2、实现初始化配置的函数 3、修改配置文件内的ip地址 首先修改IP 运行出现设置的IP&#xff0c; 找到运行的配置文件&#xff0c;修改成自己当前的ip 将函数运行条件改成非…...

1187. 【动态规划】竞赛总分

题目描述 学生在我们USACO的竞赛中的得分越多我们越高兴。我们试着设计我们的竞赛以便人们能尽可能的多得分。 现在要进行一次竞赛&#xff0c;总时间T固定&#xff0c;有若干类型可选择的题目&#xff0c;每种类型题目可选入的数量不限&#xff0c;每种类型题目有一个si(解答…...

从零开始学Python游戏编程31-类3

2.6 run()方法 run()方法的作用是在while循环中调用以上方法&#xff0c;运行游戏。代码如图11所示。 图11 run()方法代码 其中&#xff0c;第43行控制while循环的是实例属性running&#xff0c;在图7所示的__init__()方法中定义&#xff1b;第44-46行代码分别调用了processI…...

Transformer 架构 - 解码器 (Transformer Architecture - Decoder)

一、解码器整体结构:多层堆叠设计 Transformer解码器由​​N个相同结构的解码器层堆叠而成​​(通常N=6),每层包含三个核心子模块(图1) 1 5 12 : ​​带掩码的多头自注意力层​​(Masked Multi-Head Self-Attention)​​编码器-解码器注意力层​​(Encoder-Deco…...

解锁健康生活:养生新主张

在生活节奏日益加快的当下&#xff0c;健康养生不再是中老年人的专属话题&#xff0c;越来越多的人开始意识到&#xff0c;它是维持生命活力、抵御疾病的重要保障。​ 中医养生讲究 “药食同源”&#xff0c;在饮食上&#xff0c;我们可以根据季节变化调整食谱。春天气候多变&…...

__call__ 方法

__call__ 是 Python 中的一个魔法方法&#xff0c;也称为类方法。 它的作用是将类的实例变成可调用对象&#xff0c;类似于像函数一样被调用。 __call__ 使用举例 class MyClass:def __call__(self, x, y):return x yobj MyClass() print(obj(1, 2)) 对比其他类/对象的使用…...

济南通过首个备案生活服务大模型,打造行业新标杆

近日&#xff0c;一则振奋人心的消息在人工智能领域传开&#xff1a;济南本土企业丽阳神州智能科技有限公司自主研发的 “丽阳雨露” 大模型成功通过国家网信办的备案。这一成果不仅是济南企业在科技创新道路上的重大突破&#xff0c;更标志着我国在生活服务领域的人工智能应用…...

UE5有些场景的导航生成失败解决方法

如果导航丢失&#xff0c;就在项目设置下将&#xff1a; 即可解决问题&#xff1a; 看了半个小时的导航生成代码发现&#xff0c;NavDataSet这个数组为空&#xff0c;导致异步构建导航失败。 解决 NavDataSet 空 无法生成如下&#xff1a; 当 NavDataSet 为空的化 如果 bAut…...

STM32使用rand()生成随机数并显示波形

一、随机数生成 1、加入头文件&#xff1a;#include "stdlib.h" 2、定义一个用作生成随机数种子的变量并加入到滴答定时器中不断自增&#xff1a;uint32_t run_times 0; 3、设置种子&#xff1a;srand(run_times);//每次生成随机数前调用一次为佳 4、生成一个随…...

继承的了解与学习

目录 1. 继承的概念及定义 1.1 继承的概念 1.2继承的名称 1.3继承方式 1.4继承类模板 2.基类和派生类之间的转化 3.继承中的作用域 4.派生类的默认成员函数 5.继承与友元 6.继承与静态函数 7.多继承与其菱形继承问题 8.虚继承 9.继承和组合 1. 继承的概念及定义 …...

如何精通C++编程?

如果从学生时代算起的话&#xff0c;我学习和使用C已经差不多快十年了&#xff0c;仍然不敢说自己已经掌握了C的全部特性&#xff0c;但或许能够给出一些有用的建议吧。 我学习C全靠自学&#xff0c;花费了不少的功夫&#xff0c;在这里分享一些学习心得&#xff0c;希望对大家…...

【科研绘图系列】R语言绘制多个气泡图组合图(bubble plot)

禁止商业或二改转载,仅供自学使用,侵权必究,如需截取部分内容请后台联系作者! 文章目录 介绍加载R包数据下载导入数据数据预处理画图函数画图系统信息介绍 【科研绘图系列】R语言绘制多个气泡图组合图(bubble plot) 加载R包 library(dplyr) library(tidyr) library(ggp…...

利用大模型实现地理领域文档中英文自动化翻译

一、 背景描述 在跨国性企业日常经营过程中&#xff0c;经常会遇到专业性较强的文档翻译的需求&#xff0c;例如法律文书、商务合同、技术文档等&#xff1b;以往遇到此类场景&#xff0c;企业内部往往需要指派专人投入数小时甚至数天来整理和翻译&#xff0c;效率低下&#x…...

Oracle 19c部署之手工建库(四)

#Oracle #19c #手工建库 手工创建Oracle数据库&#xff08;也称为手工建库&#xff09;是指在已经安装了Oracle数据库软件的基础上&#xff0c;通过手动执行一系列命令和步骤来创建一个新的数据库实例。这种方法与使用Database Configuration Assistant (DBCA)等工具自动创建数…...